morの解析ブログ

解析疫学、リスクにまつわるメモや計算

「推定」のまわりをさぐる.教科書では「解析はMHにより行う、因子が多ければ重回帰を用いる」という風で詳しい例は少ない.独自(のつもり)な思いつきで具体に試行.
 数理を用いるべきアセスメントにも切り込む.

因子関連は成り立つか sim

■ 因子関連について推測する.
 宿題があった.因子は線形独立でないが、因子の関連をうまく組み入れられるか、抑制因子を阻害する因子はありうるか.
 生起・抑制因子を決め、抑制効果は生起因子の存在を条件とし、生起・抑制因子に対してはそれらを阻止する因子を仮定した.式(関係式)としてリスクを計算し、観察データとのはずれが大きなIDを数え、モデルと比較した.
■ 元データ
 発生率 56.2% の事例.
■ シミュレーションsim
〇準備
○ 関係式 
・因子と因子の関連 


                   係数    係数使用      因子存在数    
①  生起因子:たまご、ポテト   層化から算出   2    いずれか曝露で1 
②  抑制因子:サケ、水、茶     〃     サケのみ    〃
③  阻止因子:めし、ホタテ、トリ    変数として検討     〃       
     ①② MHなどで明瞭な効果を示す.
     ① 主たる生起因子であるたまご焼きの期待発生率;層化から0.64である.
       たまご焼きに曝露しないIDの発生数は8に過ぎず、めし、ポテト、ステ
       ーキと全重複している.そこで、ポテトがリスキーとみなす.
       これはありうる範囲内のこと.
     ③ 量のある因子
       他の因子とのMHで不思議な値を示したホタテとそれに似た性状のもの.
       これらは 生起・抑制因子に対して抑制以外の影響が予想されれる.
       「変数」:阻止因子がどの程度働くかを担う.効果は未定なので
       0≤ で ≤1の数とし、生起、抑制に対して各1.
・関係式の構成
   関係式のない型
       切片+生起または抑制因子の曝露*係数
          (切片は0とする、一部例外あり;以降同)
   関係式をもつ型
       切片+生起または抑制因子の曝露*係数
       *( 1 - 変数* 阻止因子曝露*生起または抑制因子存在数)


 関係式は、生起因子の存在を前提に抑制因子が働くこと、抑制因子の存在を前提に阻止因子が働くこと、生起因子の存在を前提に阻止因子が働くことを規定している.
 係数として関係式に入れるのは、生起因子2つと抑制因子は原則1つ(一部3つ).
○  比較するモデル
 lm
 リスク値、生起と抑制が曝露によって単純に加算減算されるような状況をsimと同一条件とするため、リニアモデルlmを使う.よって切片を0と指定し、推定後係数を取り出してIDごとのリスク値を算出、はずれ数を計算した.
 データは、症例定義:広い方とし、age<10となるIDを除いて計算した.
 リニアモデルは推定係数が確率を表すので直感的に解りやすく、推定値はロジスティックモデルとの類似性がある.


〇 sim             
・個々のIDのpiが発生という結果に近づくからといって、最適とはいえない.生起因子がないgでは、piは限りなく0でなければならない:過去記事での検討.観察した発生yiからはずれるpiのうち、なくてしかるべきはずれを示すID数で評価する.
 また、式に与えた変数は、そのはずれ数を減らす方をとる.


  なくてしかるべきはずれ数・・y1-pi > 0.5 のID個数


       はずれ数   simの条件                         
  lm         44     12因子
  関係式なし   13   *生起因子2係数たまごやき、ポテト、抑制因子1係数;サケ
  関係式       7      * 同、生起因子阻止変数  ≤ 0.01、抑制因子阻止変数 0.63       
          はずれ数:条件下最低値
          抑制にかかる阻止変数は 1を超えると生起側に転じてしまう 


・改変
 関係式の細かな改変をすると阻止因子は、めしだけとして、同様の結果を再現できる.


■結果
 生起因子の存在を条件とした抑制因子、抑制因子に影響する阻止因子の関わりを なくてしかるべきはずれ数で評価すると、モデル、関係式なし(単純な生起・抑制の型)をしのいだ.
 関係式は手計算した少数の係数と簡単な式で検討できた.
 曝露のパターンによる抑制阻止の効果は過去記事で記したが、抑制の効果を0.27倍程度にした.;上の結果は 1 - 0.63=0.37となり、近接した.

■ つまり・・・
・因子の関わりを関係式により、また、手計算ではずれ具合をもって検討できた.
・線形独立な係数ではつじつまがあわなかったが、生起因子、抑制因子を決定したのちは、試行した関係式がデータをよりよく説明でき、阻止因子は否定されなかった.


■ おまけ 
・ロジスティック回帰により調べた.
 予測子として線形あるいは関係式をロジスティック回帰として比較した.全IDデータを使用.
・関係式はglm推定係数を借用し、切片は、発生数がΣyiに近づくよう調整した.


 ロジスティック回帰
        はずれ数      simの条件                      
  glm     37    6因子   
  関係式          7    生起因子は2、抑制因子1係数;サケ
                生起因子阻止変数 ≤0.01、抑制因子阻止変数0.49≤               
    
 ロジスティック回帰でも、関係式ではずれ数を減らせた.
 関係式そのものがうまく機能したようにみえる.


■ 多因子モデリングlm系推定は、そもそもなくてしかるべきgのpiをも高めに推定することに留意.
 一連の検討ではずれ数は最低値を示さず、関連する因子(メニューとは限らない)が残っている可能性;検討の前提(生起、抑制因子の決定)や、IDごとのなんらの要因;はある.

×

非ログインユーザーとして返信する