morの解析ブログ

解析疫学、リスクにまつわるメモや計算

「推定」のまわりをさぐる.教科書では「解析はMHにより行う、因子が多ければ重回帰を用いる」という風で詳しい例は少ない.独自(のつもり)な思いつきで具体に試行.
 数理を用いるべきアセスメントにも切り込む.

[解説] 3 オッズ比のゆがみ:改

□ 因子ごとにORを計算した.因子の間で、その結果への影響は独立に作用することを前提にして解説した.しかし、実際は必ずしもそうでない.中には、因子に明らかな"従属関係"や、”条件”のような性質を持つものすらある.
 そのような、ゆがんだ係数をもつ因子は、ふつう始めからわかっているわけではない.解析の段階で、因子の因果関係とみかけのあいだを迷走することになる.
 結果に関連する因子がA,B2つあるとして、因子Aについて観察した指標OR-Aをみているとき、もう1つの因子Bがどう影響するかはOR-Aからは検討できない.例として因子2つについてそれらのゆがみを調べ、矯正する方法をみる.
□ MHOR
 複数因子の、結果に対する本当の効果をみることができないかという動機をもつ.そうしたORがほしい、ということになる.
 解析的な方法として、Mantel-Haenzsel要約ORの計算がある.


 

                    図 佐藤氏 統計数理46,1,1998より.


 これによれば、もとのORとMHORを各因子(2に限られるのではないが)について得られ、それらの効果を推定できる.SEの計算もできるが解説では省略する.
 事例の規模が小さいと、セルの数値は小さいもの、ときに0が含まれてくる結果、幾層について解析ができなくなる.また、各因子のコントロールグループとなる非暴露群の発症比も、数値の安定性は低下する.もともと食中毒事例では、発症率が高く、コントロールグループは小さくなりがちなのは致し方なく、しかし、これに頼ったリスクの対比をすることになる.
 とりあえず2因子について調べる.OR-AとOR-Bを並べて、それぞれのセルから数値を取り出し、計算に付して要約ORを得る.
 いくつかの例で、別な原因究明から関連性が補強された因子のMHORは、大きめのまま、原因とあまり関連しない理由を有する場合は、もとのOR(clude)より小さくなる、ということが実際わかっている.
 また、2つの因子が”相乗的な”効果を持つ例があり、ORは、単純な予想値を上回る例もある.オッズそのものを観察しながら慎重に層化解析するか、モデル推定によって交互作用項を投入し処理することになる.交互作用については別記事もあるので解説を省略する.


 ゆがみの除去は、MHORによるのほか、GLMなどが挙げられる. 
□ 重回帰分析
 GLMにより、logistic回帰を応用してORを事実上調整できる.(港氏R関係の説明による.)(別記事でMHORとの比較を行っている.)glmは各因子のORをオッズの計算を経て得るのでなく、それらの元となる係数が推定される*.したがって、曝露を人為的に操作したシュミレーションORの算出が容易で、疫学文献ではRRを中心とした解説の中に、glm係数からのORを使用して対比するものがある.


□ 一般化加法モデル
 GAMは、GLMを包括し、非線形な分布をなす結果についての観察ができる.しかしRのgamでは推定される因子の関与を取り出しがたい.一方で、平滑化(正則化)が付随した機能であり、これにより過適合への対応が可能である.


□ ゆがみはどのような起き方をしているのか、MHやglmで推定すれば十分なのか.より詳しく調べる必要がある.なぜなら、事例によるサンプルは、例数をはじめ制約されたデータによって解析せざるを得ないからだ.
 層化解析とglmを中心にゆがみ(過適合を含むかもしれない)への何らの対応を考えたい.



 
 

×

非ログインユーザーとして返信する