回帰モデルの標準化の成否は、こう決まる

2016/07/01 18:00

■　多アクセス記事を再掲する

■概要　回帰モデルのcoefficientsは、層化した表での群内Oddsや、層間のOR比に対応する数であった.（記事　交互作用項の意味と活用の拡張）これは、回帰で推定される係数がORを決める性質からは必然的に思われるが、層化によって得たOddsと係数から得た結果が違いすぎる事例modelがある.つまり回帰による標準化に失敗することがある.

Coefficients in regression model equivalent ratio of odds ratio in stratified tables;
2tables ,one: confounding group ,another non-confounding group .
Standarization shall be successful if a cetain effects ;confounding exist ,unsuccessful if uncertain effects .

　これを検討すると、帰納的に何らの因子間の影響関係が標準化の成否にかかわり、glmの推定に適した因子は、ある要件を備える必要があると思われる.
　factor-factor correration may govern standerization,
■　glmによる回帰標準化が成功する例
　まず、標準化に成功している例をみる.
　「疫学研究における交絡と効果の修飾」（佐藤氏）では、仮想的なデータとして、ローリスク、ハイリスクで層化した、喫煙暴露のCHDをロジスティックモデルを用いて標準化する方法を説明している.
　

　図は、その概要であり、層化と各群odds、各層ORを示す.回帰の線形予測子（各因子）；
　　　　　　　　　　　-2.64+1.55x+2.16z
　　　　　　；xは暴露因子（喫煙）、
　　　　　　　zはハイリスクかどうかが与えられている(交絡）.
　各群に対応するglm；logistic線形予測子をその下に示した.ここでは、予測子から算出したORを調べている（図中「glmOR」と示す）.
　一見して、層化した表からのOddsが、回帰係数からのOddsと一致していることがわかる.回帰モデルのcoefficientsと層化の係数化した率がよく対応している.
　とくに、層のちがいで、リスク値の向きが同一、大きさ（比）が同じ程度なのがポイントとなろう.
　standardization example in sucsessful ,certain effect ;confounding is exist

■　glmによる回帰標準化が成功しない例
　例によって、観光船事例を使用する.佃煮で層化した、玉子焼きの曝露による発症について、各群Odds、各層ORを示す.
　この事例では、線形予測子　0.28 - 2.59βtamago - 0.62βtukudani である.層化して得たOddsと係数から計算したOddsを対比すると、まず、値のオーダーが違い、リスク値が比例的でない.
　

　回帰係数の標準化を述べるまでもなく、Oddsレベルでこれだけの違いが出ており、あきらかにglm（ロジスティック回帰）は成功していない.実は、β。や、主因子β1=βtamagoが、どちらもリスク側に大きすぎる（図には載せていない）.回帰による調整ができなくなっている.
standardization example in un-sucsessful ,uncertain effect isuncertain ;confounding is not unique

■　成功する事例としない事例の違い
　なぜ、回帰による標準化が成功しないか、つまり各群のOddsが表と回帰係数とが乖離するかを考える.　　　
　CHDの例では、各層のORがほぼ一致する.また、個々グループのOddsもglm推定とよく対応している.これから「ハイリスク」の影響が、曝露、非暴露にそれぞれ比例してかかっているようである.実際glmを行うと、推定係数がロー、ハイ各群で一致している.また、文献事例のタモキシフェンも標準化が成功しているが、ある程度このパターンに類似している.　　

　　図：発症確率を　傾きをもつ平面で模式的に表す.
　　曝露によって確率が上がり、交絡（リスク方向として）によっても暴露群と交絡群の
　　　確率リスクが上がるようす　
　　　細青線の面が、”曝露群が曝露しなかった場合”の確率平面.
　　　赤線の高さが、”交絡”の大きさに対応する確率.
standardization example in sucsessful ,certain effect ;confounding is compaired a (super) plane in space of dimension of factor number

　一方、観光船事例の各層ではglmからのOddsに比例的対応がなく（係数レベルでは、等差性がない）、玉子なしの群では、佃煮の効果がなし、佃煮の存在下で玉子の効果がboostされ、ある種、均衡を失っている.
　standardization example in failure ;unbalance effect is exist

■　問題
　成功しない例の係数は、層化した表のものとの対応が悪く、これは因子間に効果にかかわる関連（修飾：佐藤氏、または、交互作用：景山氏）があることが一つの原因と考えられる.修飾のある場合には、このような調整はしないこと(：佐藤氏)とされている.
　観光船事例のモデルについて、因子係数とMH調整値をlnした値を比較し（別記事）、質的には自然な結果が得られていた.しかし、これから導出した感染確率、危険度は観測と比べてかなり強く、うまくいかないモデルとなってしまっていた.
　この失敗をglmの推定の問題とするまえに、容れた因子の独立性、因子間の関連の問題も追及すべきかもしれない.

　このブログでは、結果本質的な意味がある場合以外をみかけといっておき、さらに交絡に該当しそうなものを交絡ということにしている.

人気ブログランキングへ

morの解析ブログ

解析疫学、リスクにまつわるメモや計算

回帰モデルの標準化の成否は、こう決まる