morの解析ブログ

解析疫学、リスクにまつわるメモや計算

「推定」のまわりをさぐる.教科書では「解析はMHにより行う、因子が多ければ重回帰を用いる」という風で詳しい例は少ない.独自(のつもり)な思いつきで具体に試行.
 数理を用いるべきアセスメントにも切り込む.

後ろ向き研究のFBDから出発して・・

・疫学のステップ;観察、仮説、解析;調整によってFBDのデータを調べてきた
 FBD解析の本来の目的;生起因子の特定 は実際、多くは調整なしで不都合がない
 また”集団感染”との鑑別も有力な方法がみえた
 事例のデータの中で生起因子のみならず、他の因子も発生に関係するようで、規模の小さな一部の事例では調整してはじめて意味ある値をみる例もある


■ 観察・記述
 時間的、場所的、人的(社会的)といった空間内で発生を記述
 既知事例から知れる最大の潜伏期間をもって網掛けすれば、調査に時間が浪費される 膨大なデータが集まり、手間が増える 事例の拡大を防止する目的からは、本末転倒 また人的調査でも数を増やすのが有利と限らない   
 時間的な集積をみるとき、えてして連続・断続曝露、ヒトヒト感染;二次感染により観察がかく乱される
 などなど、実際の事例に当たっては注意点があがる


■ 粗表
 粗な2×2表を得る
 この段階でRDをとるとFBDを起こした生起因子が判明する場合と、そうでなく感染事例のような因子逸失を鑑別できる数値が出て有益
  
■ モデリングでの因子、予測子
・複数因子
  因子たちが・・
・・独立とみるとき
    x1+x2+x3+・・ 
   となる  ;とりあえずのモデリングで使う
     FBDであって、生起因子を知る目的なら単純なモデル;独立因子仮定
     でも明らかになる場合がある
   x2の効果に対してx3は”平行的効果”として推定される
   この推定による、データとのズレやSEの大きさが悩ましい
・・因子間に関連があるとき
   関連は層化によって調べ、論理式が記せる
    x1+x1*x2+x2・・ 
   x1 x2の存在下で意味ある係数を持つ:交互作用項に相当 
   
   因子間関連は、交絡の対処とは異なる、ゆがみを除く手段となる


 因子の因果関係は予測子として表せて、モデル組み立ての根本となる


■ 発生度合と予測子
・線形予測子と発生度合の関係
 ダイレクトにしてみるとき線形モデル  : p = z
 そうでないとき:glm、gam*・・・・     ; p = f (z)
         * 線形予測子の一部が複雑な回帰を示す因子を含むとき


■ ゆがみを減らす
 FBDデータ処理からの気づき
・因果を表した式により線形独立仮定した際のゆがみは除ける
 因子間関連と同一視しておく
 交互作用を別記事で扱う
・層化調整により例数不足による算出不能を減らせる
  MHOR:分母、分子同士の和の比 となるため、zero割が減る
  RR、RDでは・・ORでのa/c、b/dがa/(a+c)、b/(b+d)となるため、zero割が減る


■ 後ろ向き研究の方針
・データセット
 扱うデータでは、因子の性質は知れていない
・データが示す傾向を基に因子の性質を決めていく


■ メモ
 調整手段で例数問題の一部が改善される経験をした
  中小規模なデータセットでは、率系指標や調整がゼロ割を防ぐ効果ももつ
 因子関連は予測子により論理的な式として表現できる
  (往々、発散する)
  論理式は、線形独立なモデルによるゆがみを避け、”調整的な”機能がある 


発散しがたい最尤推定はできないものか

×

非ログインユーザーとして返信する