morの解析ブログ

解析疫学、リスクにまつわるメモや計算

「推定」のまわりをさぐる.教科書では「解析はMHにより行う、因子が多ければ重回帰を用いる」という風で詳しい例は少ない.独自(のつもり)な思いつきで具体に試行.
 数理を用いるべきアセスメントにも切り込む.

回帰モデルの標準化の成否は、こう決まる

■ 多アクセス記事を再掲する

■概要 回帰モデルのcoefficientsは、層化した表での群内Oddsや、層間のOR比に対応する数であった.(記事 交互作用項の意味と活用の拡張)これは、回帰で推定される係数がORを決める性質からは必然的に思われるが、層化によって得たOddsと係数から得た結果が違いすぎる事例modelがある.つまり回帰による標準化に失敗することがある.


Coefficients in regression model equivalent ratio of odds ratio in stratified tables;
2tables ,one: confounding group ,another non-confounding group .
Standarization shall be successful if a cetain effects ;confounding exist ,unsuccessful if uncertain effects .


 これを検討すると、帰納的に何らの因子間の影響関係が標準化の成否にかかわり、glmの推定に適した因子は、ある要件を備える必要があると思われる.
 factor-factor correration may govern standerization,
■ glmによる回帰標準化が成功する例
 まず、標準化に成功している例をみる.
 「疫学研究における交絡と効果の修飾」(佐藤氏)では、仮想的なデータとして、ローリスク、ハイリスクで層化した、喫煙暴露のCHDをロジスティックモデルを用いて標準化する方法を説明している.
 

 



 図は、その概要であり、層化と各群odds、各層ORを示す.回帰の線形予測子(各因子);
           -2.64+1.55x+2.16z
      ;xは暴露因子(喫煙)、
       zはハイリスクかどうかが与えられている(交絡).
 各群に対応するglm;logistic線形予測子をその下に示した.ここでは、予測子から算出したORを調べている(図中「glmOR」と示す).
 一見して、層化した表からのOddsが、回帰係数からのOddsと一致していることがわかる.回帰モデルのcoefficientsと層化の係数化した率がよく対応している.
 とくに、層のちがいで、リスク値の向きが同一、大きさ(比)が同じ程度なのがポイントとなろう.
 standardization example in sucsessful ,certain effect ;confounding is exist


■ glmによる回帰標準化が成功しない例
 例によって、観光船事例を使用する.佃煮で層化した、玉子焼きの曝露による発症について、各群Odds、各層ORを示す.
 この事例では、線形予測子 0.28 - 2.59βtamago - 0.62βtukudani である.層化して得たOddsと係数から計算したOddsを対比すると、まず、値のオーダーが違い、リスク値が比例的でない.
 

 回帰係数の標準化を述べるまでもなく、Oddsレベルでこれだけの違いが出ており、あきらかにglm(ロジスティック回帰)は成功していない.実は、β。や、主因子β1=βtamagoが、どちらもリスク側に大きすぎる(図には載せていない).回帰による調整ができなくなっている.
standardization example in un-sucsessful ,uncertain effect isuncertain ;confounding is not unique


■ 成功する事例としない事例の違い
 なぜ、回帰による標準化が成功しないか、つまり各群のOddsが表と回帰係数とが乖離するかを考える.   
 CHDの例では、各層のORがほぼ一致する.また、個々グループのOddsもglm推定とよく対応している.これから「ハイリスク」の影響が、曝露、非暴露にそれぞれ比例してかかっているようである.実際glmを行うと、推定係数がロー、ハイ各群で一致している.また、文献事例のタモキシフェンも標準化が成功しているが、ある程度このパターンに類似している.  


 



  図:発症確率を 傾きをもつ平面で模式的に表す.
  曝露によって確率が上がり、交絡(リスク方向として)によっても暴露群と交絡群の
   確率リスクが上がるようす 
   細青線の面が、”曝露群が曝露しなかった場合”の確率平面.
   赤線の高さが、”交絡”の大きさに対応する確率.
standardization example in sucsessful ,certain effect ;confounding is compaired a (super) plane in space of dimension of factor number   


 一方、観光船事例の各層ではglmからのOddsに比例的対応がなく(係数レベルでは、等差性がない)、玉子なしの群では、佃煮の効果がなし、佃煮の存在下で玉子の効果がboostされ、ある種、均衡を失っている.
 standardization example in failure ;unbalance effect is exist


■ 問題
 成功しない例の係数は、層化した表のものとの対応が悪く、これは因子間に効果にかかわる関連(修飾:佐藤氏、または、交互作用:景山氏)があることが一つの原因と考えられる.修飾のある場合には、このような調整はしないこと(:佐藤氏)とされている.
 観光船事例のモデルについて、因子係数とMH調整値をlnした値を比較し(別記事)、質的には自然な結果が得られていた.しかし、これから導出した感染確率、危険度は観測と比べてかなり強く、うまくいかないモデルとなってしまっていた.
 この失敗をglmの推定の問題とするまえに、容れた因子の独立性、因子間の関連の問題も追及すべきかもしれない.


 このブログでは、結果本質的な意味がある場合以外をみかけといっておき、さらに交絡に該当しそうなものを交絡ということにしている.

人気ブログランキングへ

×

非ログインユーザーとして返信する