morの解析ブログ

解析疫学、リスクにまつわるメモや計算

「推定」のまわりをさぐる.教科書では「解析はMHにより行う、因子が多ければ重回帰を用いる」という風で詳しい例は少ない.独自(のつもり)な思いつきで具体に試行.
 数理を用いるべきアセスメントにも切り込む.

もっと単純な式

・因果関係を意識した式を考え、層化によって生起、抑制因子をあげ、それらをまとめ、次いで抑制を阻止する因子を仮定して効果を計算するということをやってきた.


・比を使えば関係式を簡単にできる.
 データから層化
   データ: N=265 元データを再取り込み、切り捨て無し.


   曝露の様子         構成数  発生数       率         比 
  生起因子+阻止因子        12     7        0.583 
  生起因子+抑制因子        16          7        0.438      0.751
    生起因子+抑制+阻止        226      126   0.558      1.274 


・各層の発生率の比 
 生起と阻止因子曝露の場合、発生率は0.583.生起と抑制因子の曝露ではその率の0.751倍の0.438に、しかし阻止因子にも曝露すれば1.274倍の0.558になる、ということ.
 これからpiが乗算で表せる.


・ 関係式の簡単化
 生起因子曝露 se、抑制因子曝露 su、阻止因子曝露 ss  : 0 or 1
 とする.
 piは、生起因子がなければ発生率0であるから、


  pi  = se * 0.583 * 0.751 ^( su) *  1.274^(ss)


 と表せる. 積式とよぶ.


・これはすでにデータから阻止効果が計算完了となった状態であり、のこるははずれ数がどうなっているかなのだが・・.
 上の式を組み込んでpiをみると、0.00  ≤  pi ≤  0.74 の範囲にあり、つぎのようになる.
       
            積式    関係式  6因子lm 
       Σpi    142.6    173.7   127.3    データのΣy1=142
     はずれ数           8           9     20   
                                         
・はずれ数とは、yi=1であるにかかわらず、pi<0.5としてしまうID数であり、piの不調を示す.
 上では、阻止因子が解っていて、組み込む関係式の表現を変えただけだから、はずれが小さいのは当然の結果と思える.関係式や、積式では抑制があるケースで一律に減算されないから”必要以上に”確率は下がらないということかもしれない.ここで、はずれとしていまだに残っているのは生起+抑制で0.438の、0.5の区切りに達しないものである.



   図 y1についての piの度数分布  積式(青).lm(赤) 


 図は、積式のほうは、低値の域にy1がごく少なく、鋭いようすがみてとれる.


 結局、積式によるpiは、過去数回の試行錯誤をバイパスした結果になった.


 なお、積式はRDなどの指標において劣る.最終的に、「大事なのははずれが少ないこと」だけなのか.

×

非ログインユーザーとして返信する