もっと単純な式
・因果関係を意識した式を考え、層化によって生起、抑制因子をあげ、それらをまとめ、次いで抑制を阻止する因子を仮定して効果を計算するということをやってきた.
・比を使えば関係式を簡単にできる.
データから層化
データ: N=265 元データを再取り込み、切り捨て無し.
曝露の様子 構成数 発生数 率 比
生起因子+阻止因子 12 7 0.583
生起因子+抑制因子 16 7 0.438 0.751
生起因子+抑制+阻止 226 126 0.558 1.274
・各層の発生率の比
生起と阻止因子曝露の場合、発生率は0.583.生起と抑制因子の曝露ではその率の0.751倍の0.438に、しかし阻止因子にも曝露すれば1.274倍の0.558になる、ということ.
これからpiが乗算で表せる.
・ 関係式の簡単化
生起因子曝露 se、抑制因子曝露 su、阻止因子曝露 ss : 0 or 1
とする.
piは、生起因子がなければ発生率0であるから、
pi = se * 0.583 * 0.751 ^( su) * 1.274^(ss)
と表せる. 積式とよぶ.
・これはすでにデータから阻止効果が計算完了となった状態であり、のこるははずれ数がどうなっているかなのだが・・.
上の式を組み込んでpiをみると、0.00 ≤ pi ≤ 0.74 の範囲にあり、つぎのようになる.
積式 関係式 6因子lm
Σpi 142.6 173.7 127.3 データのΣy1=142
はずれ数 8 9 20
・はずれ数とは、yi=1であるにかかわらず、pi<0.5としてしまうID数であり、piの不調を示す.
上では、阻止因子が解っていて、組み込む関係式の表現を変えただけだから、はずれが小さいのは当然の結果と思える.関係式や、積式では抑制があるケースで一律に減算されないから”必要以上に”確率は下がらないということかもしれない.ここで、はずれとしていまだに残っているのは生起+抑制で0.438の、0.5の区切りに達しないものである.
図 y1についての piの度数分布 積式(青).lm(赤)
図は、積式のほうは、低値の域にy1がごく少なく、鋭いようすがみてとれる.
結局、積式によるpiは、過去数回の試行錯誤をバイパスした結果になった.
なお、積式はRDなどの指標において劣る.最終的に、「大事なのははずれが少ないこと」だけなのか.