morの解析ブログ

解析疫学、リスクにまつわるメモや計算

「推定」のまわりをさぐる.教科書では「解析はMHにより行う、因子が多ければ重回帰を用いる」という風で詳しい例は少ない.独自(のつもり)な思いつきで具体に試行.
 数理を用いるべきアセスメントにも切り込む.

独立データから着想・・同一因子 別名推定


■ 独立データ(非重複データ)は推定法によらず同一な結果をもたらし、元データに一致した.独立データを図式した段階で、mが抑制、阻止の2面性をもつことがわかったが、それを数的に表し、元データと一致するか調べたい.


■ 交互作用に工夫をしてみる.mの曝露データを m、m1、m2 と名を変え、複写し追加、中身は皆mなのだが.単独なm、生起因子と重複するm1、抑制因子とも重複するm2 として別々の因子のようにモデルを組む.


    × t + m + tm + tms +・・・ mは、ばらついた区間をもつ1値
    ○ t + m + tm1 + tm2s +・・・単独、tへの効果 tsへの効果 ;違った値をもつ


 発散しがちなので一部のgについてモデル化する.
 その結果、mは生起的、m1は生起に対して抑制的、m2は抑制に対して阻止的とわかり(3面性)、それらに対応する独立データgの推定値と、パラレルになる.r-sqやres-devなども改善.


*1因子1係数の前提でばかりモデル化したのでは、どうにもならないが独立データgの特徴から別名推定すると相異なる推定値が得られる.


■ 複雑な交互作用を持つ場合を想定した推定
 今までの試行からデータ処理するためのステップが考えられて、
                                           
  cludeな傾向 層化* 独立データg化 ←→ データ再現性検討: 別名推定   
              ⤵           ↑            
      ↓  ①     ⤵ 
  モデリングによる推定 →   ②  →  交互作用モデル     
                            * 検定するんじゃないぞ
    ① 生起、抑制因子が判明
    ② 阻止ほか複雑な影響ある因子に目星
       ~ ある程度の数の因子を一斉に回帰分析してみることができる


・いいかえれば、
 Ⅰ 元データから線形独立なモデリング(g)lmを実行し因子を見極めていく方向
と、
 Ⅱ 独立データ化して差分を調べていく方向
の2通りの方法がある.


Ⅰ 多くの因子を入れて推定し、各係数の標準誤差の大きさを観察する 別記事詳細
 交互モデルで推定することで、膨大な組み合わせとなる試行を削減する.
 また、さらに別名推定することで複雑因子を量的に調べ、独立データの率を再現するかを検討できる.


 図 lm系で推定、結果から係数安定度のとびぬけた値↓を調べる


Ⅱ 独立データのg推定から行う方法
 まず各独立gの係数(率)を羅列、mstpとmtpの係数差を取る;Δβsになる
 ついで、他のgからもsについてのΔβsを取る(下図、左式上)


 sについていえば、Δβsのうちの最大から最小を差し引き、幅を出し、それらの平均で割る(下図、右式).
    


 tほか因子についてもこれを繰り返し、各因子の取りえた係数の最大最小幅が、それらの平均に対して大きいか小さいかを測る.これが著しく大きければ、生起性がありかつ抑制性ももつなど異なった性質を持つ因子である可能性がみえる.また、右式を因子についてよく見れば阻止効果にも気づける.
 このようにして、mについて多面性を想定した別名推定を行える.


・独立gの係数の比較は、Δβの観察の段階で、生起、抑制の見当をつけることができ、阻止等の性質も現れる.Ⅰでもかなりの傾向は知れる.層化の煩わしい操作から逃れる方法とすら思える.


■ 生起、抑制をみつけ、それ以外の効果を持つかもしれない因子に注目して、別名推定・交互作用を試し、はずれ数の少ない、データをそこそこ再現できるモデルかを確かめる流れ.
 因果関係のあてが付くなら予測子を関係式にして発生を再現できるか試すことになる.

×

非ログインユーザーとして返信する