morの解析ブログ

解析疫学、リスクにまつわるメモや計算

「推定」のまわりをさぐる.教科書では「解析はMHにより行う、因子が多ければ重回帰を用いる」という風で詳しい例は少ない.独自(のつもり)な思いつきで具体に試行.
 数理を用いるべきアセスメントにも切り込む.

lmで一次推定~削られる因子

 リニアモデルでは係数とSEに注目して因子削減した.一部、とある特徴がみえる.その特徴からも因子削減できそうだ.


 一次推定は全因子が対象になるが、部分で推定すると推定係数・SEプロットで直線に乗ってみえる因子があると気づくの間で曝露相関をみてみる.切片0を指定する


 


  図 係数によるSEと曝露相関
           弧線:相関のもっとも強いもの間を結んでいる
           全因子の1/3ほどを推定


 上図、例えばwat、ste、mは直線上にあるが、それらの曝露vectorが最大の相関を示すのは、w-m間とste-m間であった.
 全因子推定からは、fli、ste、goboもほぼ直線状に並び、比較的強めの相関があった.相関は、影響のありそうな因子との関係がある場合だけとみえなくもない.係数の類似は、比較的生起性のない因子係数が、曝露重複のためにここぞとばかりに代償性変化したためだろう.
 そのような因子を削除、繰り返して、残る因子によるlmは、切片が小さく、係数、SEとも小さめのgとそうでないいくつかの因子に分離するようになる.
 原点に近い因子を削減してきたのだが、結果的に上のような因子も削減されてきた.それはそれで正解だったのだろう.


 ところで、「多変量解析で調整する」のではなかったのか.調整されてなお、本来関係ない因子、みかけをまとう厄介な因子、そのような因子を見極める一法.

×

非ログインユーザーとして返信する