morの解析ブログ

解析疫学、リスクにまつわるメモや計算

「推定」のまわりをさぐる.教科書では「解析はMHにより行う、因子が多ければ重回帰を用いる」という風で詳しい例は少ない.独自(のつもり)な思いつきで具体に試行.
 数理を用いるべきアセスメントにも切り込む.

余興 固有値の疫学的試用:観光船事例

■ 具体例




 


■「観光船」事例を題材とする.この事例は、因子数も豊かで生起因子のほか、みかけの因子、抑制因子が含まれる.コホートとみなせる集団に起こった、後ろ向き研究の格好のデータであり、当ブログでたびたび取り上げている.
 比較のため、因子ごとに2×2表マスターテーブルをつくり、cludeOR、MH要約OR、推定モデルからの推定係数を計算しておく(MHORは一層).固有値、detとの関連について検討する.


■ cOR、MHORにおいて、固有値(図ではcf値としてある)との相関、大小関係の順序の一致度は、ある程度高いことがわかる.さらに回帰モデルによる推定係数と比較する.
・推定係数と固有値
 回帰モデルから推定係数を求め、固有値(小さい方)と比較すると、因子数を絞らざるを得ないが、試した因子間では抑制因子の1因子を除き、順位が一致した.
 固有値と従来の調整値、モデリングによる推定係数との対応は好ましいものだった.


■ 固有値による、影響度の推測
 事件を特徴づける生起因子、みかけの因子、サプレッサーそれぞれの固有値は正しく影響度を反映しているかを調べる.  
 推定係数による固有値(小さな方)は、生起因子(この事例では「玉子焼き」)をはじめ、曝露によるみかけを示すとみられる「佃煮」、生起因子による発症を抑制する因子とみられるサプレッサー「水」の各推定係数と一意的な対応を示した. ・・・図.
 サンプル数の不足による逆転が注目する因子以外の因子にみられた.これが例外のものであり、サンプル数が十分な因子については、破たんがないといえる.


■ 他の適用事例 
 「観光船」事例の6-8因子のほか、「oswego」事例の4因子、「納豆オクラ」事例での8因子について適用した.いずれの事例も、暴露上のみかけの効果を生起因子と峻別でき、サプレッサーも明確にできた.
 「oswego」事例では、サプレッサーが2因子あり、その間で対応順が逆転した.サンプル不足のためとみられる.


■ 推定上の固有値の性質
 明示的因子であれば、従来層化、調整、モデリングによってゆがみを除くことができる.明示的因子に対し固有値を対応させると、MHORと同等以上、モデル係数;調整に匹敵するリスク表現力をもつことがわかる.
 cOR、MHORでは、しばしば計算不能が起こる.固有値ないし、detは計算不能と発散はおこらず、全因子に対して一斉に計算ができ、計算式が簡略である.
 また、MHORは(通常)もう一つの因子を特定することによる制約が伴う.層化を繰り返せば、計算も面倒になる.固有値を用いればその点の不利はない.
 モデリングにおいても係数の発散(p値はときに1に近い)がある.
 固有値をリスク値とみなせば、それらの問題が解決できるかは、グループを構成する例数にもよるが、有望と思われる.


■ 固有値については数学的な定義があるが、疫学的な性質は論じられていない.


        
       
   ・・・

×

非ログインユーザーとして返信する