生起因子らしいか.実発生数率 を計算 cORと比べる;crude
・データによっては、生起因子を逸し、疑わしい因子を扱うこともありうる.
・生起因子らしさとは、事例の大部分の発生を説明できる因子であることも1つ.
曝露が重複してみかけ上発生が多いものは生起因子でない、としてよい.
そのようなものを数的に示したい.多いとする数値は、なくとも比較はできる.
有力な生起因子なのか、調べる計算の1方法.
■ 疑わしさの残る因子
mは、曝露で発生は大きく;生起因子に次ぐ 、逆は少ないため、疑わしさが残る.
table度数をみる.
[1] 131 8 105 14
・実発生数率の計算
アイデアは、BGは、小さいはずだということ.
mについて非mでの発生をいったんBGとみなし、その率をm曝露数に乗じた数を発生数から減じて実質発生数とし、y1に対する割合をみる .
( a - b / (b+d) * k ) / (a+b)
としする.
[1] 0.325049
となる.このとき、BGは86程になり、mが説明できる数45程より大きく、不自然な事態になる.
・事例での解釈
m単独で説明できる発生は、BGであるべき数より大きく、前提と矛盾する.また、全発生の3割程にとどまるから、mが主たる生起因子とは言えない.
このことから、この例では、調査に主な生起因子が欠けたものと考える.
■ 生起因子、抑制因子のあて
見やすい式は、「R 記述を短くするデータ」
粗table 例 m
m4<-c(sum( y1[4] ),sum( re1[4] ),sum( y0[4] ),sum( re0[4] ) )
粗OR、層化、MHOR
例;記事「Rで計算.ベクトル化度数から 2つのMHORの起こりやすさまで」
■ 念のため、 tについて確かめると、
t 度数は、
ttab<-c( sum( y1[7] ) ,sum( re1[7] ), sum( y0[7] ),sum( re0[7] ) )
[1] 132 7 81 38
から、同様な計算で、
[1] 0.711
と高率になっている.
このとき、BGは33位、tが説明できる数99程であって、生起因子として不自然でない.
■ 全因子について
intetab[i,j] ;度数table から、各因子の値を次の記述でうる.
実発生説明率を zituh ベクトルとする
ituh <-NULL
for(i in 1:8) {
zituh <-c(zituh ,
(intetab[i,1]-intetab[i,2]/ (intetab[i,2]+intetab[i,4] )*
(intetab[i,1]+intetab[i,3] )) / (intetab[i,1]+intetab[i,2] ) )
}
zituh
[1] 1.00000000 -0.02406351 -0.03378563 0.32504905
[5] 0.21730086 0.09403905 0.71127098 0.36813103
この実発生数率を cORと比較すると、
最も右の〇は t
cORとよく似た指標とわかる. crude
■ まとめ風
・「率」は、直感的にとらえやすく、cORと同等な指標とみえる.
・cORのみで生起因子を探すのに比べて、説明できる率を尺度にするので、やや安心感がある.
・引き続き、生起因子と、それに影響する因子を調べることができる.