回帰モデルの標準化の成否は、こう決まる
■ 多アクセス記事を再掲する
■概要 回帰モデルのcoefficientsは、層化した表での群内Oddsや、層間のOR比に対応する数であった.(記事 交互作用項の意味と活用の拡張)これは、回帰で推定される係数がORを決める性質からは必然的に思われるが、層化によって得たOddsと係数から得た結果が違いすぎる事例modelがある.つまり回帰による標準化に失敗することがある.
Coefficients in regression model equivalent ratio of odds ratio in stratified tables;
2tables ,one: confounding group ,another non-confounding group .
Standarization shall be successful if a cetain effects ;confounding exist ,unsuccessful if uncertain effects .
これを検討すると、帰納的に何らの因子間の影響関係が標準化の成否にかかわり、glmの推定に適した因子は、ある要件を備える必要があると思われる.
factor-factor correration may govern standerization,
■ glmによる回帰標準化が成功する例
まず、標準化に成功している例をみる.
「疫学研究における交絡と効果の修飾」(佐藤氏)では、仮想的なデータとして、ローリスク、ハイリスクで層化した、喫煙暴露のCHDをロジスティックモデルを用いて標準化する方法を説明している.
図は、その概要であり、層化と各群odds、各層ORを示す.回帰の線形予測子(各因子);
-2.64+1.55x+2.16z
;xは暴露因子(喫煙)、
zはハイリスクかどうかが与えられている(交絡).
各群に対応するglm;logistic線形予測子をその下に示した.ここでは、予測子から算出したORを調べている(図中「glmOR」と示す).
一見して、層化した表からのOddsが、回帰係数からのOddsと一致していることがわかる.回帰モデルのcoefficientsと層化の係数化した率がよく対応している.
とくに、層のちがいで、リスク値の向きが同一、大きさ(比)が同じ程度なのがポイントとなろう.
standardization example in sucsessful ,certain effect ;confounding is exist
■ glmによる回帰標準化が成功しない例
例によって、観光船事例を使用する.佃煮で層化した、玉子焼きの曝露による発症について、各群Odds、各層ORを示す.
この事例では、線形予測子 0.28 - 2.59βtamago - 0.62βtukudani である.層化して得たOddsと係数から計算したOddsを対比すると、まず、値のオーダーが違い、リスク値が比例的でない.
回帰係数の標準化を述べるまでもなく、Oddsレベルでこれだけの違いが出ており、あきらかにglm(ロジスティック回帰)は成功していない.実は、β。や、主因子β1=βtamagoが、どちらもリスク側に大きすぎる(図には載せていない).回帰による調整ができなくなっている.
standardization example in un-sucsessful ,uncertain effect isuncertain ;confounding is not unique
■ 成功する事例としない事例の違い
なぜ、回帰による標準化が成功しないか、つまり各群のOddsが表と回帰係数とが乖離するかを考える.
CHDの例では、各層のORがほぼ一致する.また、個々グループのOddsもglm推定とよく対応している.これから「ハイリスク」の影響が、曝露、非暴露にそれぞれ比例してかかっているようである.実際glmを行うと、推定係数がロー、ハイ各群で一致している.また、文献事例のタモキシフェンも標準化が成功しているが、ある程度このパターンに類似している.
図:発症確率を 傾きをもつ平面で模式的に表す.
曝露によって確率が上がり、交絡(リスク方向として)によっても暴露群と交絡群の
確率リスクが上がるようす
細青線の面が、”曝露群が曝露しなかった場合”の確率平面.
赤線の高さが、”交絡”の大きさに対応する確率.
standardization example in sucsessful ,certain effect ;confounding is compaired a (super) plane in space of dimension of factor number
一方、観光船事例の各層ではglmからのOddsに比例的対応がなく(係数レベルでは、等差性がない)、玉子なしの群では、佃煮の効果がなし、佃煮の存在下で玉子の効果がboostされ、ある種、均衡を失っている.
standardization example in failure ;unbalance effect is exist
■ 問題
成功しない例の係数は、層化した表のものとの対応が悪く、これは因子間に効果にかかわる関連(修飾:佐藤氏、または、交互作用:景山氏)があることが一つの原因と考えられる.修飾のある場合には、このような調整はしないこと(:佐藤氏)とされている.
観光船事例のモデルについて、因子係数とMH調整値をlnした値を比較し(別記事)、質的には自然な結果が得られていた.しかし、これから導出した感染確率、危険度は観測と比べてかなり強く、うまくいかないモデルとなってしまっていた.
この失敗をglmの推定の問題とするまえに、容れた因子の独立性、因子間の関連の問題も追及すべきかもしれない.
このブログでは、結果本質的な意味がある場合以外をみかけといっておき、さらに交絡に該当しそうなものを交絡ということにしている.
人気ブログランキングへ