Rの記述1. データから粗な度数
・リスト dr :マスターテーブルともいう
・2分反転データ :簡単な表記のため
y1 y0 re1 re0 の4つを作る.
作り方:
1) リスト2分
行を抽出 y1 と y0 に リスト をわける
リストの列 yが 1に一致する ものを y1とするよう指定
y1<- dr [ dr $y ==1,] → y1行 139 ID
y0<- dr [ dr $y ==0,]
2)drに対して反転した、reを定義する
re<-1-dr ♯ dr+re=1 となる.
のちに便利なことは、
y1 re1 zで 層化するとき 各に y1z y1z re1z re1z
y0 re0 y0z y0z re0z re0z
あたかも ベクトルの掛け算になる
・粗なtable 因子4の例
sum( y1[4] )
sum( re1[4] )
sum( y0[4] )
sum( re0[4] )
各因子のtable
y4 <-c(sum( y1[1] ),sum( re1[1] ),sum( y0[1] ),sum( re0[1] ) )
w4<-c(sum( y1[2] ),sum( re1[2] ),sum( y0[2] ),sum( re0[2] ) )
tya4 <-c(sum( y1[3] ),sum( re1[3] ),sum( y0[3] ),sum( re0[3] ) )
m ・・・
tori4 <-c(sum( y1[5] ),sum( re1[5] ),sum( y0[5] ),sum( re0[5] ) )
s4 <-c(sum( y1[6] ),sum( re1[6] ),sum( y0[6] ),sum( re0[6] ) )
t4 <-c(sum( y1[7] ),sum( re1[7] ),sum( y0[7] ),sum( re0[7] ) )
po4 <-c(sum( y1[8] ),sum( re1[8] ),sum( y0[8] ),sum( re0[8] ) )
これらをつなげて intertab とした.
■ 疑わしい因子
度数を眺めると、生起と疑わしい因子の候補をあげることができる.ついで指標を生成してみることになる.
・指標
ORや、実発生数率など指標は、上のデータからそのつど容易に計算でき、また、全因子ベクトル化も可能.