因子をどう選ぶか 曝露数とcRD からplotして
■ 因子の選択
cRDは簡便に因子を特徴づけられることを使って、因子選択に利用する
・cRD
・曝露数
の2つから因子を選択するということを記す
■ 全因子
dd= read.csv(file.choose()) # dd:csv 26全因子新データ
# 空白削除
d26 <-complete.cases(dd)
d <- dd[d26,]
■ 【cludeなRD】曝露数をも計算
crd<- NULL
t_ec<- NULL
for (x in 1:27) { # x 全因子を調整対象とし、、、、
a1 <- sum( d[,1] *d[x] ) # 発生有
b1 <- sum( d[,1] *(1-d[x]) ) #
c1 <- sum( (1-d[,1]) *d[x] ) # 発生なし
d1 <- sum( (1-d[,1]) *(1-d[x]) )
e_count <- a1+c1 # 曝露数
n1 <-a1+b1+c1+d1
k11<-a1+c1
k10<- b1+d1
rd1 <- a1/k11-b1/k10
crd<-c(crd,rd1)
t_ec<-c(t_ec,e_count) # 曝露数ベクトル
}
■ 曝露数ごとのcRDをplot
plot(t_ec,crd)
text(x=t_ec,y=crd,colnames(d))
結果 上図
■
曝露数と、粗リスク差に基づいてモデルの柱となる因子 ;この場合4つ を挙げる
曝露が大な、mesi (次いで steak
生起因子tam、次ぐpotesara
抑制因子wat
曝露が大なmesiに次いで steak も注目しておく