dhyper 層化してBGを調べる
・前記事で、sありなしで層化し、従来指標で発生を調べた.
主たる生起因子 t に曝露しない層;BGを扱うとき、dhyperの使い道を探る.
■ 自由な数
ある因子でxtabを作る.
s有無で層化
全 体 s1層 s0層
a b M a1 b1 m1 a0 b0 m0
c d c1 d1 c0 d0
k N k1 n1 k0 n0
全体の、周辺度数M,N,kは固定されていて、因子によって a~dは定まる.
sによって層化した場合、2つに分かれた t0での発生は、不確定な原因で起こっているものとしておく.各層でa~dのいずれかが決まると、その層のa~dはすべて決まる.
* 実際この事例では生起因子tは明らか、抑制因子sがかなり疑わしい.
* その他の生起性のある因子が決めきれないので、ここでは不確定な発生
とした.
さらに、
・t0層 b1/d1 , b0/d0、b1 , b0はいずれも小 とわかっている
・b1 , b0の取りうる幅は狭い
・b=b1+b0
これらのことで、シミュのscriptは短くでき、結局、b1だけを動かせばシミュが可能とわかる.
まず、OR・率を羅列してみる.
■ bによるOR・率
b=7固定時 2×2表とrisk指標;OR・t0rate
上段:s1、下段:s0
b1の値に応じてs1のxtableは決まり、同時にs0も決まる;上段と下段の表が対応する
・生起因子、抑制因子による制限条件
ORはsの抑制効果により、s1ではs0より低めとなっているはずだ.とすると、
b1は 3以上
であるはずだ. 観察ではb1は 3、b0は、4.
また、 s1とs0での発生率の差は、小さいはずで、
b1 = 2,3
で最小になっている;ここで、t0では、発生率は低く、BG的に扱っている.
よって、b1=3、b0=4がもっともそれらしいと思える.
ついで、dhyperでシミュする.
■ dhyperでt0を調べる
観察 N-kから k1または k0だけ取り出す、シミュとなる.
dhyper(0:6,7,38,k)
ここでdhyperは、発生の起こりやすさを与える.
発生7を固定、k;16、29 取り出すときの密度確率
◎ dhyper(0:10,7,38,16) は、 dhyper(0:10,7,38,29) と対称な分布となる.
s1では 観測3より1つ小さい2が最も起こりやすく、s0では観測した4より1つ大きい5が最も起こりやすい .
ちなみに、sの抑制効果にかかわらず、BGは抑制された兆候はなかった.どころか逆にs0のt0は高めだった.
発生率は、 BG値とするなら、0.14-0.19あたりと見当がつく.
plot(dhyper(0:10,7,45,16),type="s",xaxt="n",xlab="")
plot(dhyper(0:10,7,45,26),type="s",xaxt="n",xlab="")
■ まとめ
・事例のデータを理解するという点から、計算結果をまとめると・・
t0の発生率展開による、ghyper; ”発生率”の”起こりやすさ”
発生率をいったん独立と仮定して、平面に写す.t0はBG的であって、s1,s0とも おおよそ似た値を期待している;図中 縞帯.
シミュでbの値に応じて得た発生率は、図のような位置に並ぶ.黒柱の高さは、その起こりやすさを示す.
■ 蛇足 (改)
「全体」は、起こってしまった結果であって、後ろ向き調査では、y1 y0は不変.
因子曝露に基づく層化をするなら、いずれかの揺らぎを想定して;揺らがない数を固定してみて、hyperが適用できる.