《前座》 交互作用モデルの方がよいのか 4,5因子モデル 全26データ による
■ 元データ
・4因子は客観的に選択した steなど以外を加えるモデルを作るため、26因子全部をデータとした
・症例定義2 ただし症例定義1は考慮せず発生としたもの
■ 4因子モデルと”+適当な因子”で5因子モデル さらに独立と交互作用
切片とRsqで評価する
4因子モデル
・ 因子 cRDの絶対値の大きな、または曝露の大なもの;4データ
・モデル 独立モデル、交互作用項*モデル
*交互作用は、抑制因子のある3因子以上のモデルでは必ずあるはずだと想定
4データ独立m
ko6 lm(formula = y ~ wat + mesi + tam + potesara, data = d)
(Intercept) 0.10317 Multiple R-squared: 0.08622, Adjusted R-squared: 0.07039
4データ交互
ko6k lm(formula = y ~ wat + mesi + tam + potesara + mesi:tam + mesi:tam:wat,
data = d)
(Intercept) -0.003488 Multiple R-squared: 0.09202, Adjusted R-squared: 0.06823
→交互モデルでIC改善
■ 5因子モデル
・因子 4データに適当な因子を加えた ;+?? 5因子
・独立、交互
+steakで5因子独立
ko6l<-lm(formula = y ~ wat+mesi+tam+potesara+steak , data = d)
(Intercept) 0.09585 Multiple R-squared: 0.08684, Adjusted R-squared: 0.06698
+steakで5因子交互
ko6st lm(formula = y ~ wat + mesi + tam + potesara + steak + steak:mesi:tam +
mesi:tam, data = d)
(Intercept) 0.009791 Multiple R-squared: 0.09739, Adjusted R-squared: 0.06968
+sake交互
ko6ss lm(formula = y ~ wat + mesi + tam + potesara + sake + sake:mesi:tam +
mesi:tam, data = d)
(Intercept) 0.01796 Multiple R-squared: 0.09732, Adjusted R-squared: 0.0696
→ +steakまたは⁺sakeでIC,Rsq 改善
■ 結果
・独立より交互作用モデルは有利
ICは小さめで好ましく、Rsq は改善されている
うち、steakとsakeでの違いは鮮明でない
・4因子より多い5因子モデルは有利
思い付きで*steakなどを追加しただけで交互作用モデルは、さらに好ましくなる
これはsteakに限らない
■ 課題
・症例定義による、ID削除
・lmでのモデルのよさをRsqで評価することの意味
”適当な因子選択”は、別記事でより検討