morの解析ブログ

解析疫学、リスクにまつわるメモや計算

「推定」のまわりをさぐる.教科書では「解析はMHにより行う、因子が多ければ重回帰を用いる」という風で詳しい例は少ない.独自(のつもり)な思いつきで具体に試行.
 数理を用いるべきアセスメントにも切り込む.

生起因子らしいか.実発生数率 を計算 cORと比べる;crude

・データによっては、生起因子を逸し、疑わしい因子を扱うこともありうる.
・生起因子らしさとは、事例の大部分の発生を説明できる因子であることも1つ.
 曝露が重複してみかけ上発生が多いものは生起因子でない、としてよい.
 そのようなものを数的に示したい.多いとする数値は、なくとも比較はできる.
 有力な生起因子なのか、調べる計算の1方法.


■ 疑わしさの残る因子 
 mは、曝露で発生は大きく;生起因子に次ぐ 、逆は少ないため、疑わしさが残る.
 table度数をみる.
  [1] 131 8 105 14
・実発生数率の計算
 アイデアは、BGは、小さいはずだということ.
 mについて非mでの発生をいったんBGとみなし、その率をm曝露数に乗じた数を発生数から減じて実質発生数とし、y1に対する割合をみる .
   ( a - b / (b+d) * k ) / (a+b)
 としする.
  [1] 0.325049
 となる.このとき、BGは86程になり、mが説明できる数45程より大きく、不自然な事態になる.
     
・事例での解釈
 m単独で説明できる発生は、BGであるべき数より大きく、前提と矛盾する.また、全発生の3割程にとどまるから、mが主たる生起因子とは言えない.
 このことから、この例では、調査に主な生起因子が欠けたものと考える.


■ 生起因子、抑制因子のあて
 見やすい式は、「R 記述を短くするデータ」
 粗table  例 m  
   m4<-c(sum(  y1[4] ),sum( re1[4] ),sum(  y0[4] ),sum( re0[4] ) ) 
 粗OR、層化、MHOR
  例;記事「Rで計算.ベクトル化度数から 2つのMHORの起こりやすさまで」


■ 念のため、 tについて確かめると、 
 t 度数は、
  ttab<-c( sum(  y1[7] ) ,sum( re1[7] ), sum(  y0[7] ),sum( re0[7] ) )
   [1] 132 7 81 38 
 から、同様な計算で、
   [1] 0.711
 と高率になっている.
 このとき、BGは33位、tが説明できる数99程であって、生起因子として不自然でない.


■ 全因子について
 intetab[i,j] ;度数table から、各因子の値を次の記述でうる.
 実発生説明率を zituh ベクトルとする
    ituh <-NULL
   for(i in 1:8) {
         zituh <-c(zituh ,   
            (intetab[i,1]-intetab[i,2]/ (intetab[i,2]+intetab[i,4] )*      
           (intetab[i,1]+intetab[i,3] )) / (intetab[i,1]+intetab[i,2] ) )
        }  
zituh
[1] 1.00000000 -0.02406351 -0.03378563 0.32504905
[5] 0.21730086 0.09403905 0.71127098 0.36813103 


 この実発生数率を cORと比較すると、
     

    

                     最も右の〇は t


 cORとよく似た指標とわかる.   crude


■ まとめ風
・「率」は、直感的にとらえやすく、cORと同等な指標とみえる.
・cORのみで生起因子を探すのに比べて、説明できる率を尺度にするので、やや安心感がある.
・引き続き、生起因子と、それに影響する因子を調べることができる.

×

非ログインユーザーとして返信する