qhyperで層化による発生数の偏りをみる
■ Rの操作練習がてら・・qhyper
・曝露により発生をみる確率を計算してきた.
・層化して各層の発生数;計 をみる.生起因子の効果というより、発生数の取りがちな値を調べてみる.
・sありなしでの発生と従来指標
■ 「全体」は、起こってしまった結果であってsによる層化で N M kが即、固定される.
qhyper(p,M,N-M,k) ・
取り出し数によるhypergの%tileと平均線 補助k付き
右上部full:全体のN,発生数
赤線:各層に含まれる y1
直線は、平均を示す
○ は s0、s1 発生数の 0.05,0.95percentile
各発生数はs曝露数に比例的ではあるが、幅があり、y1が偏っているとわかる.
・s1のy1部分を横倒しして図示する.
dh88100 <- dhyper(88:100,139,119,174)
plot(dh88100,type="s",xaxt="n",xlab="88:100")
# x目盛を消し、ラベルに88:100
obs:観察されたy1
s1層の 0.05-0.95percentileあたりを図示.観察した y1;◎ は98なので平均から+4ほど多めだった.一方s0層では逆.
■ 2×2表
sありなし層の発生数はhgの最頻や平均と一致しない.そのような結果からも2×2表ではOR、率が順当に計算されたのだった.
率(生起因子にかかわらない、a+b)は、層ごとに違い、サケあり層で発生が多めに含まれる.にもかかわらず、t1曝露層では逆なのだ・・.
一方で、いずれの層もt0層は、似通った率を示し、t,sとは、ある程度独立な因子が弱い生起性をもって関与しているとわかる.