oswego事例　独立ｇデータ

2022/06/23 12:00

■　データ
　公開データには、oswego・・なるものがある.これを加工して解析（原典と一致している保証せず）.
■　lmで因子を絞る
　線形独立推定するとバニラアイスが生起、ミルクとサラダ類が抑制とみえた.ミルクは　(-) に係数が大きく、かつSEは大だった.他の因子のSEもまた大きめ（1<）で、とりあえず係数、SEとも小さめのの因子を削減する.
■　独立ｇ
　lmにより生起・抑制因子とﾊﾑ . ﾎｳﾚﾝｿｳを残して、それらによる独立ｇを組み、１因子に対応する率を計算してみる（他にｻﾗﾀﾞを入れる組み合わせも試行したが、省略）.因子の特徴はつかめるか.

　oの曝露が広く、vのriskが明らか.mは抑制（しかし曝露数が小さい）.それ以外の因子は特異で抑制＋生起性を疑うものが複数ある；hほか.

■　差分
　ｇごとの ID数を見ると、v ｱｲｽ、h ﾊﾑ、p ﾎｳﾚﾝｿｳ、o 他が比較的多く、差分を取ると v,m 以外は０をはさんで上下に幅があった.これは線形独立推定で大きなSEを示したことと対になっている.また、それらには多面性がありそうなので、nもみながらさらに交互作用などを検討していい（発散は起こるかも）.hを詳しくみれば、vの下で生起性を増強し、ｖなしｇでは抑制的にすら思えた.

■　モデルの評価
　lmによる、一次推定では、事例の主役である生起、抑制、そして多面性のありそうな因子は残せた.ついで差分計算から細部がみえた.
　因子の大半を削減し、モデル推定してみるとARsq、ｐあるいはR Rsqが改善する場合がある、という程度だった.係数は差分の係数の範囲内にあった（差分からみてかけ離れていないかを確認）.

■　つまり
　いったん線形独立モデル推定を行うことで、係数の絶対値の大きさ、各因子のSEから因子削減ができる.
　独立データから行う差分計算は、データから直接、因子の特徴をみれて、MHに比べ、数値も比べやすく、層化に代わるほどのメリットがある.

morの解析ブログ

解析疫学、リスクにまつわるメモや計算

oswego事例　独立ｇデータ