morの解析ブログ

解析疫学、リスクにまつわるメモや計算

「推定」のまわりをさぐる.教科書では「解析はMHにより行う、因子が多ければ重回帰を用いる」という風で詳しい例は少ない.独自(のつもり)な思いつきで具体に試行.
 数理を用いるべきアセスメントにも切り込む.

oswego事例 独立gデータ

■ データ
 公開データには、oswego・・なるものがある.これを加工して解析(原典と一致している保証せず).
■ lmで因子を絞る
 線形独立推定するとバニラアイスが生起、ミルクとサラダ類が抑制とみえた.ミルクは (-) に係数が大きく、かつSEは大だった.他の因子のSEもまた大きめ(1<)で、とりあえず係数、SEとも小さめのの因子を削減する.
■ 独立g
 lmにより生起・抑制因子とハム . ホウレンソウを残して、それらによる独立gを組み、1因子に対応する率を計算してみる(他にサラダを入れる組み合わせも試行したが、省略).因子の特徴はつかめるか.

 oの曝露が広く、vのriskが明らか.mは抑制(しかし曝露数が小さい).それ以外の因子は特異で抑制+生起性を疑うものが複数ある;hほか.


■ 差分
 gごとの ID数を見ると、v アイス、h ハム、p ホウレンソウ、o 他  が比較的多く、差分を取ると v,m 以外は0をはさんで上下に幅があった.これは線形独立推定で大きなSEを示したことと対になっている.また、それらには多面性がありそうなので、nもみながらさらに交互作用などを検討していい(発散は起こるかも).hを詳しくみれば、vの下で生起性を増強し、vなしgでは抑制的にすら思えた.


■ モデルの評価
 lmによる、一次推定では、事例の主役である生起、抑制、そして多面性のありそうな因子は残せた.ついで差分計算から細部がみえた.
 因子の大半を削減し、モデル推定してみるとARsq、pあるいはR Rsqが改善する場合がある、という程度だった.係数は差分の係数の範囲内にあった(差分からみてかけ離れていないかを確認).


■ つまり
 いったん線形独立モデル推定を行うことで、係数の絶対値の大きさ、各因子のSEから因子削減ができる.
 独立データから行う差分計算は、データから直接、因子の特徴をみれて、MHに比べ、数値も比べやすく、層化に代わるほどのメリットがある.

×

非ログインユーザーとして返信する