morの解析ブログ

解析疫学、リスクにまつわるメモや計算

「推定」のまわりをさぐる.教科書では「解析はMHにより行う、因子が多ければ重回帰を用いる」という風で詳しい例は少ない.独自(のつもり)な思いつきで具体に試行.
 数理を用いるべきアセスメントにも切り込む.

《前座》 交互作用モデルの方がよいのか 4,5因子モデル 全26データ による

■ 元データ
・4因子は客観的に選択した steなど以外を加えるモデルを作るため、26因子全部をデータとした
・症例定義2 ただし症例定義1は考慮せず発生としたもの
■ 4因子モデルと”+適当な因子”で5因子モデル さらに独立と交互作用
 切片とRsqで評価する
   
 4因子モデル
・ 因子   cRDの絶対値の大きな、または曝露の大なもの;4データ
・モデル  独立モデル、交互作用項*モデル
  *交互作用は、抑制因子のある3因子以上のモデルでは必ずあるはずだと想定


4データ独立m
 ko6 lm(formula = y ~ wat + mesi + tam + potesara, data = d)
  (Intercept) 0.10317 Multiple R-squared: 0.08622, Adjusted R-squared: 0.07039
 
4データ交互
 ko6k lm(formula = y ~ wat + mesi + tam + potesara + mesi:tam + mesi:tam:wat,
 data = d)
  (Intercept) -0.003488  Multiple R-squared: 0.09202, Adjusted R-squared: 0.06823
 →交互モデルでIC改善


■ 5因子モデル
・因子  4データに適当な因子を加えた ;+?? 5因子
・独立、交互


+steakで5因子独立
 ko6l<-lm(formula = y ~ wat+mesi+tam+potesara+steak , data = d)
  (Intercept) 0.09585  Multiple R-squared: 0.08684, Adjusted R-squared: 0.06698
+steakで5因子交互 
 ko6st lm(formula = y ~ wat + mesi + tam + potesara + steak + steak:mesi:tam +
 mesi:tam, data = d)
  (Intercept) 0.009791 Multiple R-squared: 0.09739, Adjusted R-squared: 0.06968 

+sake交互
 ko6ss lm(formula = y ~ wat + mesi + tam + potesara + sake + sake:mesi:tam +
 mesi:tam, data = d)
  (Intercept) 0.01796  Multiple R-squared: 0.09732, Adjusted R-squared: 0.0696
 → +steakまたは⁺sakeでIC,Rsq 改善  


■ 結果
・独立より交互作用モデルは有利
  ICは小さめで好ましく、Rsq は改善されている
  うち、steakとsakeでの違いは鮮明でない
・4因子より多い5因子モデルは有利
  思い付きで*steakなどを追加しただけで交互作用モデルは、さらに好ましくなる
  これはsteakに限らない
■ 課題
・症例定義による、ID削除
・lmでのモデルのよさをRsqで評価することの意味
 ”適当な因子選択”は、別記事でより検討

×

非ログインユーザーとして返信する