《前座》　交互作用モデルの方がよいのか 4,5因子モデル　全26データによる

2024/03/14 22:52

■　元データ
・４因子は客観的に選択した　steなど以外を加えるモデルを作るため、26因子全部をデータとした
・症例定義2　ただし症例定義1は考慮せず発生としたもの
■　4因子モデルと”＋適当な因子”で５因子モデル　さらに独立と交互作用
　切片とRsqで評価する
　　　
　4因子モデル
・因子　　cRDの絶対値の大きな、または曝露の大なもの；4データ
・モデル　独立モデル、交互作用項*モデル
　　*交互作用は、抑制因子のある3因子以上のモデルでは必ずあるはずだと想定

４データ独立ｍ
　ko6　lm(formula = y ~ wat + mesi + tam + potesara, data = d)
　　(Intercept) 0.10317　Multiple R-squared: 0.08622, Adjusted R-squared: 0.07039

４データ交互
　ko6k　lm(formula = y ~ wat + mesi + tam + potesara + mesi:tam + mesi:tam:wat,
　data = d)
　　(Intercept) -0.003488 Multiple R-squared: 0.09202, Adjusted R-squared: 0.06823
　→交互モデルでIC改善

■　5因子モデル
・因子　　4データに適当な因子を加えた　；＋?? 5因子
・独立、交互

＋steakで5因子独立
　ko6l<-lm(formula = y ~ wat+mesi+tam+potesara+steak , data = d)
　　(Intercept) 0.09585　 Multiple R-squared: 0.08684, Adjusted R-squared: 0.06698
+steakで5因子交互　
　ko6st　lm(formula = y ~ wat + mesi + tam + potesara + steak + steak:mesi:tam +
　mesi:tam, data = d)
　　(Intercept) 0.009791　Multiple R-squared: 0.09739, Adjusted R-squared: 0.06968　
+sake交互
　ko6ss　lm(formula = y ~ wat + mesi + tam + potesara + sake + sake:mesi:tam +
　mesi:tam, data = d)
　　(Intercept) 0.01796　 Multiple R-squared: 0.09732, Adjusted R-squared: 0.0696
　→　+steakまたは⁺sakeでIC,Rsq 改善

■　結果
・独立より交互作用モデルは有利
　　ICは小さめで好ましく、Rsq は改善されている
　　うち、steakとsakeでの違いは鮮明でない
・4因子より多い5因子モデルは有利
　　思い付きで*steakなどを追加しただけで交互作用モデルは、さらに好ましくなる
　　これはsteakに限らない
■　課題
・症例定義による、ID削除
・lmでのモデルのよさをRsqで評価することの意味
　”適当な因子選択”は、別記事でより検討

morの解析ブログ

解析疫学、リスクにまつわるメモや計算

《前座》　交互作用モデルの方がよいのか 4,5因子モデル　全26データによる