[解説] 4 ゆがみを除く層化
□ オッズ比の性質、MH法、glmによる調整(的)計算を概説した.しかしglmの係数から得たORが実際の2×2表と比べて自然な結果を推定できる保証がなかった.
□ ここでは、glmをごく簡単に使いながら、層化解析と並行して自然な、ゆがみへの対処を試す.
□ glm係数推定による、関与順位の仮定
観光船事例にglm logistic を施すと係数が推定される.:図1.事例のデータからメニュー5つを適当に選んでモデリングして得た推定係数である.
切片のみのモデルによる切片の値を率化する(列:左).ここで率化とはつぎによる.
1/(1+exp(-z)) ;z=β。+Σβixi;線形予測子
図1
すると、事件の発症率44.3%が現れてくる.
次に全因子(ここではメニュー5つ)を入れた線形予測子で推定する(列:中央)と、切片の値は変化し、各因子に係数が割り付けられる.因子を関与させることで事件の発症率は40%ほどとなるが、各因子の関与を表現していることがいえる(必要ならMHORについて比較するとよい).係数からは、玉子、佃煮が+でやや大きい値、水が―で、生起因子と逆:サプレッサーとわかる.
なお、蛇足ながら、(列:右)玉子を欠く場合を数式上シミュレーションしている.
この推定結果は、最終的に満足すべきものだろうか.
上の全因子推測から、発症に対して、みかけによる関与の可能性があるかを玉子(メニュー上は卵焼き)、 佃煮 について検討する.玉子の、佃煮あり無しによる発症健康を層化して観察する.
表 4
佃煮なし層 佃煮あり層
玉子 玉子なし 玉子 玉子なし
発症 20 2 73 1
健康 28 28 55 10
率 0.42 0.07 0.57 0.09
層化解析により、佃煮には独自な危険性がないとわかる.(交互作用はなしとしないが解説は省略する:別記事参照)glmの係数として、第2位の高値を出した佃煮であるが、主導的な因子ではないので以降佃煮を除いて解析していく.
なお、先の 水は、生起因子の下で、生起/非生起の行方を決めるから、モデルから欠くわけにはいかない.
このようにして玉子、水による、シンプルなモデルをglm推定に使う.
表 5 glmによるシンプルモデルの推定結果
切片 -2.497 ***
玉子 2.666 ***
水 -0.527
*** : Pr(>|z|) Signif. codes: 0 ‘***
AIC 272.45
このモデルで、玉子、水のいずれにも曝露した場合を率化すると
%(βw+βe) = 0.409
となる.
この率は、いずれにも曝露した場合の期待発症率となる.これは実際の発症率44.3%に近い値なのでもっともらしい.先の 事件では、玉子への暴露は96%であったが、水への曝露が9%と低く、さらにいずれにも曝露したものの割合はより小さくなっていたため実際の発症は、期待発症率より大きくなっていると説明できるからである.
他方、生起因子が働かないグループ;コントロールグループの推定値を検討していく.
切片係数を率化すれば、
%(β。)= 0.076
となり、図2でみたコントロールグループの値と極めて近いものである.よって、このことからもシンプルモデルは、層化解析の結果に対して、自然な推定をもたらしている.
層化解析と再度のglmにより洗練したモデルを作ることができ、結果お互いに自然なものであった.
□ シンプルモデルは、因果を説明する最小限の因子からなる.層化でのコントロルグループの観察値、疑わしい因子の選別を行うことは、推定を機械的な計算による数値の羅列に終わらせず、また、機械的な因子の選別によらない、自然なモデルを得るために有効なものといえる.
.