morの解析ブログ

解析疫学、リスクにまつわるメモや計算

「推定」のまわりをさぐる.教科書では「解析はMHにより行う、因子が多ければ重回帰を用いる」という風で詳しい例は少ない.独自(のつもり)な思いつきで具体に試行.
 数理を用いるべきアセスメントにも切り込む.

Rの記述1. データから粗な度数

・リスト dr :マスターテーブルともいう 
・2分反転データ :簡単な表記のため
 y1 y0 re1 re0 の4つを作る.
 作り方:
  1) リスト2分
   行を抽出  y1 と y0 に リスト をわける
   リストの列 yが 1に一致する ものを y1とするよう指定 
    y1<-  dr [ dr $y ==1,]  → y1行 139 ID
    y0<-  dr [ dr $y ==0,]        


  2)drに対して反転した、reを定義する 
    re<-1-dr  ♯ dr+re=1 となる.
    のちに便利なことは、
     y1  re1     zで 層化するとき 各に y1z y1z   re1z re1z
     y0  re0                                y0z y0z  re0z re0z
                あたかも ベクトルの掛け算になる


・粗なtable  因子4の例
    sum( y1[4] )    
           sum( re1[4] )
     sum( y0[4] )
           sum( re0[4] ) 
各因子のtable
 y4 <-c(sum(  y1[1] ),sum( re1[1] ),sum(  y0[1] ),sum( re0[1] ) ) 
w4<-c(sum(  y1[2] ),sum( re1[2] ),sum(  y0[2] ),sum( re0[2] ) ) 
tya4 <-c(sum(  y1[3] ),sum( re1[3] ),sum(  y0[3] ),sum( re0[3] ) )
m ・・・
tori4 <-c(sum(  y1[5] ),sum( re1[5] ),sum(  y0[5] ),sum( re0[5] ) )
s4 <-c(sum(  y1[6] ),sum( re1[6] ),sum(  y0[6] ),sum( re0[6] ) )
t4 <-c(sum(  y1[7] ),sum( re1[7] ),sum(  y0[7] ),sum( re0[7] ) )
po4 <-c(sum(  y1[8] ),sum( re1[8] ),sum(  y0[8] ),sum( re0[8] ) )


これらをつなげて intertab とした.


■ 疑わしい因子
 度数を眺めると、生起と疑わしい因子の候補をあげることができる.ついで指標を生成してみることになる.
・指標
 ORや、実発生数率など指標は、上のデータからそのつど容易に計算でき、また、全因子ベクトル化も可能.

×

非ログインユーザーとして返信する