oswego事例 独立gデータ
■ データ
公開データには、oswego・・なるものがある.これを加工して解析(原典と一致している保証せず).
■ lmで因子を絞る
線形独立推定するとバニラアイスが生起、ミルクとサラダ類が抑制とみえた.ミルクは (-) に係数が大きく、かつSEは大だった.他の因子のSEもまた大きめ(1<)で、とりあえず係数、SEとも小さめのの因子を削減する.
■ 独立g
lmにより生起・抑制因子とハム . ホウレンソウを残して、それらによる独立gを組み、1因子に対応する率を計算してみる(他にサラダを入れる組み合わせも試行したが、省略).因子の特徴はつかめるか.
oの曝露が広く、vのriskが明らか.mは抑制(しかし曝露数が小さい).それ以外の因子は特異で抑制+生起性を疑うものが複数ある;hほか.
■ 差分
gごとの ID数を見ると、v アイス、h ハム、p ホウレンソウ、o 他 が比較的多く、差分を取ると v,m 以外は0をはさんで上下に幅があった.これは線形独立推定で大きなSEを示したことと対になっている.また、それらには多面性がありそうなので、nもみながらさらに交互作用などを検討していい(発散は起こるかも).hを詳しくみれば、vの下で生起性を増強し、vなしgでは抑制的にすら思えた.
■ モデルの評価
lmによる、一次推定では、事例の主役である生起、抑制、そして多面性のありそうな因子は残せた.ついで差分計算から細部がみえた.
因子の大半を削減し、モデル推定してみるとARsq、pあるいはR Rsqが改善する場合がある、という程度だった.係数は差分の係数の範囲内にあった(差分からみてかけ離れていないかを確認).
■ つまり
いったん線形独立モデル推定を行うことで、係数の絶対値の大きさ、各因子のSEから因子削減ができる.
独立データから行う差分計算は、データから直接、因子の特徴をみれて、MHに比べ、数値も比べやすく、層化に代わるほどのメリットがある.