超幾何分布 dhyper,p-,r- ベクトルを入れる
超幾何分布をRの関数で練習
■ phyperとdhyperの理解
題材
このうち、サケあり層から158とりだす場合に、どれだけ発生が起こりうるか.
phyper 指定した数以下が現れる分布確率を返す
dhyper 指定した数が現れる密度確率 〃
【 ph(x) = Σ_i=1,2,‥x dh(i) 】なのだとわかる.
----------------------------------------------------------------------------------------
■ dhyperとrhyper
dhyperで、最も確率密度の大きいのは89のとき.
rhyperは1万回シミュする.
両方を図で比べるとピークの位置が違ってみえる.
関数から調べる.
rhyperの89におけるpとdhyperでのそれは、
rhyperでのピークをみるのは89で、つまり・・
【histでは軸目盛が左柱を示す】
率を細かく見ると、わずかな差があるのか・・・.
シミュ回数を増やしてみる.
rh7<-rhyper(1000000,98,76,158)
(sum(rh7<90)-sum(rh7<89))/1000000
0.207643、0.207598、0.206943、0.20772・・・
100万回シミュでなおdhyperによる率の周りをふらふらしている.
・dhyper phyperを使う
sum(dhyper(95:158,98,76,158)) t1でyが 95以上になる確率
[1] 0.001616369
phyper(3,98,76,16) t0でyが3以下になる確率
[1] 0.001616369
・・ 確率はt0で3以下となる率に一致.
また、dhyperのみでみても、
dhyper(95,98,76,158)
[1] 0.001401789
dhyper(3,98,76,16)
[1] 0.001401789
それぞれ”点”でみても一致(ひっくり返し不変).
tamによる観察発生数95「以上」はほぼ起こりがたい.
・超幾何分布とクロステーブル・・fisherの正確確率を思い出しながら、練習した.
観察結果から、retrospectiveにみるとき、発生数、曝露数は、固定してみることになる.