morの解析ブログ

解析疫学、リスクにまつわるメモや計算

「推定」のまわりをさぐる.教科書では「解析はMHにより行う、因子が多ければ重回帰を用いる」という風で詳しい例は少ない.独自(のつもり)な思いつきで具体に試行.
 数理を用いるべきアセスメントにも切り込む.

qhyperで層化による発生数の偏りをみる

■ Rの操作練習がてら・・qhyper
・曝露により発生をみる確率を計算してきた.
・層化して各層の発生数;計 をみる.生起因子の効果というより、発生数の取りがちな値を調べてみる.
・sありなしでの発生と従来指標
■ 「全体」は、起こってしまった結果であってsによる層化で N M kが即、固定される.
     qhyper(p,M,N-M,k)      ・
 

    

         取り出し数によるhypergの%tileと平均線 補助k付き
              右上部full:全体のN,発生数
                                          赤線:各層に含まれる y1 
              直線は、平均を示す
              ○ は s0、s1  発生数の 0.05,0.95percentile


 各発生数はs曝露数に比例的ではあるが、幅があり、y1が偏っているとわかる.


・s1のy1部分を横倒しして図示する. 
   dh88100 <- dhyper(88:100,139,119,174)
   plot(dh88100,type="s",xaxt="n",xlab="88:100") 
             #  x目盛を消し、ラベルに88:100
   

    

                              obs:観察されたy1
 s1層の 0.05-0.95percentileあたりを図示.観察した y1;◎ は98なので平均から+4ほど多めだった.一方s0層では逆.


■ 2×2表
 sありなし層の発生数はhgの最頻や平均と一致しない.そのような結果からも2×2表ではOR、率が順当に計算されたのだった.
 

    

 率(生起因子にかかわらない、a+b)は、層ごとに違い、サケあり層で発生が多めに含まれる.にもかかわらず、t1曝露層では逆なのだ・・.
 一方で、いずれの層もt0層は、似通った率を示し、t,sとは、ある程度独立な因子が弱い生起性をもって関与しているとわかる.

×

非ログインユーザーとして返信する