morの解析ブログ

解析疫学、リスクにまつわるメモや計算

「推定」のまわりをさぐる.教科書では「解析はMHにより行う、因子が多ければ重回帰を用いる」という風で詳しい例は少ない.独自(のつもり)な思いつきで具体に試行.
 数理を用いるべきアセスメントにも切り込む.

MH法による調整値とglm推定係数の比較

概要
 MH法;Mantel-Haenszel要約オッズ比


   ;http://minato.sip21c.org/oldlec/social_stat_p09.html 
   ;またはAdjusting the Mantel Haenszel Test Statistic and Odds Ratio for Cluster Sampling 


■ MHORとglmにより、因子間のみかけを除く.結果を比較すると、似通ったものとなるが、glmでは、主な生起因子と、従的な因子、抑制因子の概略をつかむことができる.ことに微妙なサプレッサー因子をよく切り出す.
 しかし、小規模事例では生起因子とこれに近い値をもつ因子とを明確に区別できず(別記事に詳述 )、観察に層化をも加え、glmの切片の検討からアプローチして峻別できる見通しが立つ. 
■ 普通、生起因子を探す食中毒事例では、生起因子と目される因子とみかけを示す因子を調整すれば、目的が達成される.一方、複数の因子が関連する場合はありえて、その程度を調べるための研究をすることがある(抑制因子が複数で、促進因子が1つの場合など).層化を含めて、主な2つの調整法による推定から、ORを得、調整の機能について実験し、直観的に理解したい.
◆ 方針 MH法とglmの比較
・MH法(マンテル-ヘンツェルMantel-Haenstzel 法)は定評ある調整方法であり、使いやすく、広く普及している.また、glmは、調整の機構が異なり、適用範囲が広い.これによる推定係数(交互作用項を投入しないもの:交絡は別に検討する)を得て、MH法と比較する.

 [観光船]事例のデータ[1]を用いる. 
◆ 詳細
・[観光船]事例から数個の因子を使用する.MHORは、ある因子の、他因子に対する総当たり調整MHORのうち、生起因子に対する調整値をみる.ただし、生起因子は、サプレッサーとした水に対する調整値を使う. 
  


 


 図. MH調整後のOR順(左から右へ)に、卵焼き、佃煮、ウインナ、レモン、・・水である.
 ここで、x軸にプロットしたMH調整後のln値;卵焼きと佃煮、それに佃煮とウインナ・レモンの差が(点推定で)小さい.これが、MH法のしっくりこないところと感じる.
 また、y軸にプロットしたglm係数では、卵焼きに次ぎ、佃煮が-0.57、pr0.12とリスク傾向を示しながら、レモン・ウインナは、ともに値を下げ、リスク性(関連性も)がない結果となる(いずれもprは大であるが).水は+のままで、prも0.16であって、サプレッサーとみてとれる.
 結果、MH調整値は、みかけが除き切れず、一方、glm係数では、発生に対する影響が+、-のものは、そのまま、無関連のものはほぼ0を示すことがわかる.
「水」は、MH一斉調整を行って、総当たり調整結果を一覧(図表なし)し、検討したすべての因子に対して抑制的な調整値を示すため、抑制因子と扱っている.glmによる係数の信頼区間が大きいのは、暴露率が10%程度と低いため、推計的に絞られなかったと考えられる.(有意性のみをもって、効果の信頼性判断基準としない)
・水と卵焼きについて、4因子としたモデルから層別解析/MH法による結果は、
 層別すると水ありの卵焼きMHORは、6.65、なしで11.6、要約MHORは10.86、信頼区間3.73~31.63.卵焼きありの水0.63、なしで4.22、要約MHORは、1.21(0.70~2.10)であった.
 係数と有意性について4因子モデルから計算すると、水のglm係数は、0.584 pr 0.232、卵焼き-2.41 pr 0.000137 ***であり、交互作用項を投入して水なしの卵焼きの係数は、発散、卵焼きなしの水の係数は、0.53(pr0.23)であった。
 これらのように、glmによって生起因子、準ずる因子、抑制因子がうまく区別できる.しかし、生起因子と準ずる因子の区別については、さらに検討を要すると考える.
◆ 第2の生起因子とみえる、佃煮(準ずる因子)
 佃煮に注目してさらに検討する
 上の事例において、MHOR値とglm結果を比較して、調整の機能について実験した.[観光船]事例.
◆MH法とglmによる、複数のリスク(疑い)因子の比較
 

   


・図は、4因子を使用したcrudeなglmの因子係数とその95%信頼区間(左)、4因子間総当たり H調整ORのlnについて最大値・最小値を線分(右)で表したもの.
 右、MHからの値は、それぞれ左、glm係数の信頼区間;95%範囲の中ほどの値を示した因子がめだつが、佃煮は違っており、詳しく見る.
 佃煮は、他の因子、ことに取り上げない因子に対してもriskyであった.交互作用項を設けて細かく見ると、お茶がないときのリスクが最大であった.また、お茶との間で、交互作用項の危険率が幾分低く、値の絶対値は比較的大きかった.この例に限らず、ある因子間で、特異的に影響関係があるかも知れず、個別に検討する必要がある.
 佃煮は、cOR2.91であり、主因子であった卵焼きについでcludeなリスク値が大きかった. 卵焼きによる層化では、あり:1.84、なし:1.63、MHOR1.82 (0.97-3.44)と大きく下げるものの、有意性を帯びている*.(* 各セルに強制的に0.5を加えて計算)
 glmにおいてはまた、卵焼きとの交互作用項投入によって、佃煮そのものの係数は、-0.64(exp0.64=1.89),pr0.07であり、有意性を帯びたものであった。
 佃煮を他因子との間で交互作用項総当たりで試すと、いずれに対しても (-) (この場合risk方向)であった.
 これらから、佃煮は、卵焼きに次いでriskyであることが否定できないことになる.
 glmは、調整された係数とみなせる推定値が出ているはずであるが、このままでは、推定後の佃煮の係数が、なおriskyである.このことは、関連記事 でさらに詳細に追及してある.
◆ 考察
・MH法は、例えば2層ないし3層あるいはそれ以上にわたるが、層が増えれば、数値が不安定となり、主な検討可能範囲は2層の調整にとどまる.しかも特定の因子との調整であるという限定がつく.n個の因子についてn(n-1)通りの層化を行い、さらにMH調整値を一斉に得るために、表計算でシートを作成した.すべての組み合わせを詳しく見ることができるが、ここでは組み合わせのうち、最低値を示すMHORを対象とした.
・glmでは、少なくとも取り上げた因子すべてについて単一回の計算処理で、係数が得られ、「・・互いに他の独立変数の影響を調整した,各独立変数独自の従属変数への影響を示す・・」(R による保健医療データ解析演習 中澤氏)ことが、点推定上もよくわかる.さらに”標準化が可能である(佐藤氏ら)”.また、interceptについても観察でき、reduce modelによる検討も容易である.
・glm の推定係数は、上のサプレッサーについてみれば、MH調整をしのぐほど、埋もれがちな微弱な抑制因子をも摘出できるようだ.ことに、観察研究(後ろ向き)において抑制因子の探索が主な目的となる制御管理、予防効果の調査にあたっては、メリットがあるとわかる.


まとめ 
□ MH一斉調整とglmを同一事例に適用して、調整の能力を比較した.
□ glmによる調整は、よりクリアで、 注目する因子が関与する情報のみでなく、事例全体の促進拮抗関係を容れた構造が窺える.
[1]岡山作成公開エクセルファイル:(eiji氏)

×

非ログインユーザーとして返信する