morの解析ブログ

解析疫学、リスクにまつわるメモや計算

「推定」のまわりをさぐる.教科書では「解析はMHにより行う、因子が多ければ重回帰を用いる」という風で詳しい例は少ない.独自(のつもり)な思いつきで具体に試行.
 数理を用いるべきアセスメントにも切り込む.

超幾何分布 dhyper,p-,r- ベクトルを入れる

  超幾何分布をRの関数で練習
■ phyperとdhyperの理解
 題材 

     

 このうち、サケあり層から158とりだす場合に、どれだけ発生が起こりうるか.
 phyper  指定した数以下が現れる分布確率を返す
 dhyper  指定した数が現れる密度確率 〃

 【 ph(x) = Σ_i=1,2,‥x dh(i) 】なのだとわかる.
----------------------------------------------------------------------------------------
■ dhyperとrhyper
 dhyperで、最も確率密度の大きいのは89のとき.
 rhyperは1万回シミュする.

    

 両方を図で比べるとピークの位置が違ってみえる.
 関数から調べる.
 rhyperの89におけるpとdhyperでのそれは、

   

 rhyperでのピークをみるのは89で、つまり・・
 【histでは軸目盛が左柱を示す】


 率を細かく見ると、わずかな差があるのか・・・.
   シミュ回数を増やしてみる.
   rh7<-rhyper(1000000,98,76,158)
   (sum(rh7<90)-sum(rh7<89))/1000000
    0.207643、0.207598、0.206943、0.20772・・・
   100万回シミュでなおdhyperによる率の周りをふらふらしている.


・dhyper phyperを使う
  sum(dhyper(95:158,98,76,158))            t1でyが 95以上になる確率
    [1] 0.001616369
  phyper(3,98,76,16)            t0でyが3以下になる確率
    [1] 0.001616369
    ・・  確率はt0で3以下となる率に一致.
 また、dhyperのみでみても、
   dhyper(95,98,76,158)
   [1] 0.001401789
   dhyper(3,98,76,16)
   [1] 0.001401789
 それぞれ”点”でみても一致(ひっくり返し不変).


 tamによる観察発生数95「以上」はほぼ起こりがたい.


・超幾何分布とクロステーブル・・fisherの正確確率を思い出しながら、練習した.
 観察結果から、retrospectiveにみるとき、発生数、曝露数は、固定してみることになる.

×

非ログインユーザーとして返信する