morの解析ブログ

解析疫学、リスクにまつわるメモや計算

「推定」のまわりをさぐる.教科書では「解析はMHにより行う、因子が多ければ重回帰を用いる」という風で詳しい例は少ない.独自(のつもり)な思いつきで具体に試行.
 数理を用いるべきアセスメントにも切り込む.

アウトブレイク調査(1)ブログ移転

・食中毒;解析疫学の手順
 みかけの危うさを避け、疫学的な解析が必要である.
・アウトブレイク調査に関連する、重要な手順を記したものは、
   * 「WHO標準疫学」
   * 「 WHO食品媒介疾患の アウトブレイク 調査と対策のための ガイドライン」
の2つがある.
・前者、疫学では次の点が示される.


    バイアス(偏り) はなかったか・・・・  1
   交絡はないか      ・・・・・・・   2 このブログでは”みかけ”と扱う
   偶然による可能性「おそらくなし」 ・・・  3
   因果関係である可能性があるか ・・・・・  4
・後者ガイドラインはこれらを欠く.もちろん後者を下敷きとしたマニュアル類も同様であり、注意.


・このうち、主に2つ目を取り上げる.
 みかけの関連を述べないテキストや資料があふれているから注意する.後ろ向き研究で必ず付きまとう、みかけをほったらかしては、みえるものもみえない.
 さて、食中毒を解析する説明資料や、プログラムによっては、この、重要な原則である2をすっ飛ばし、3から始める.χ二乗検定がいきなり出てくるものがあり、知らぬ人を独断の世界に引きずり込む.
 調整が面倒くさい、むづかしいからと、避けているのだろうか、ならば初めから解説や調査などしないことだ.
 1,3,4はそもそも調査段階で取り決めておくこととするので、詳しくは取り扱わないが、3では、とくに有意性により切り捨てを行わず(危険率0.1超え程度でもかなり怪しむべき)、関連性について述べる.言い方を変えれば、多少の例外っぽいものがあることを認めながら進めることになる."多少の例外"は、全体をひっくり返さないものである.求めるものは、大半を説明できる因子である.
 なお、3に絡んで、中規模事例では、みかけ調整時に例数の制限が付きまとい、悩ましい.
 4では、最近、食中毒調査では、原因物質検出至上主義(検査一辺倒)では何ともならない事例があるらしい.ここで特に強調するが、近年原因物質が検出されなくとも、積極的に原因について述べるべきとする風潮がある.より疫学的になっていくことに好感する.
 生物学的、ときに化学的な証拠も当然求められるが、準備は自明.


   解析疫学が幾分浸透し、これも原因食品を特定する一手法となっているが、食中毒処理要領では、「疫学的所見または症候的観察等の結果まで無視してはならない。これらにより相当に原因が推定出来る」とされている.
  http://kouseikyoku.mhlw.go.jp/kantoshinetsu/gyomu/bu_ka/shokuhin/hourei/kan_no214.html .


 また、研究やこれに伴う研修がわずかながらある.しかし、感染症の発生についての処理要領を探しても解析疫学が取り上げられていないようで、もっぱら公害や、薬効の事例を習っていくしかないようである.つまり、感染症と食中毒をまとめて処理できる考え方が、存在しない.
 したがって、後ろ向き研究による解析疫学は、原因究明・対処のため根本的に重要な手段となる.このことから、食中毒の解析にあたっても、みかけに対処した手順は必ず備えるべき事項になる.
 食中毒に対してみかけに配慮しないまま処理する手法を感染症のアウトブレイクに使って対処する、ないしそれを主張することは、”みかけの呪い”を流布することと同じである.



 さてと・・みかけを扱う前に、実際面で直面する問題は次のものだろう.
   中規模事例、因子が多いこと(メニュー20-もざらにある)をどう処理?
   欠測(セルでいえば、空白)も許容して処理できるか?
   調整できるか?(有力な因子を列挙できるか)
   プログラムの選択(手の出せないものでは困る)?      
・はじめに、適切なプログラムを選択する.
 ポイントは、因子数が限られないか、一斉処理ができるか、空白を扱えるかであるが、ここでいろいろ集めて比べると、
  × HAD ,SPBP, EXWF, 68LGr, Tah
 であった.
 つぎに、調整できるかであるが、
  ×  「食中毒集計表」
 であった.
 繰り返すが、プログラムによっては、みかけの処理の前に有意検定してしまうものがあり、後ろ向き研究に必須な手順をとらない独断の世界に引きずり込まれる恐れがあり、問題だ.また同時に因子間の関連を探る機会を逃すことになる.
 プログラムでは、R が残った.
 また、エクセルは、データ整理や、層化、2×2表と、係数のみかけの検討、Rへのデータ生成、MH調整や検定まで簡単に処理するため、便利である.
・エクセルによる処理は、
 2×2表や、層化、p値、調整値とそのSEなどなど関数化、一発計算させることができる.
 ここで、次に注意する.
 ゼロ割、空白セル(ゼロとカウントしない)による計算上の問題を避ける.これもエクセルの関数を活用する.
 空白を許容するプログラムなり関数で対処しなければならない.すべて書き込んだ調査票をつくるメリットはなく、一部不完全なものでも次の対処に即結びつく結果を得ることこそが必要だ.
・Rには、モデルによる検討を担わせる.調整された値を得る目的もある(交互作用項といった有用な検討ができる).



・みかけの調整は2通りとした
 ①Mantel-Haenstzel(1959)要約Odds計算による法(このブログでMH法などとする).層化解析を合わせて行う
 ②glm(一般化線形回帰:Nelder and Wedderburn (1972))による重回帰(ロジスティック回帰)係数の推定


 これでみかけの関連を検討できる.みかけを調整できることは、1つの狙いではあるが、実は調整という過程で因子間の関連がみえることがある.これは、大きな利点ではないか.解析を広くとらえると、より検討の意味が増す.当ブログの関連記事は、それを具体的に感じるためにある.なぜなら、みかけを調整して終わってしまうだけなら、原因不明の感染症や、集団事例を検討するために役立つ手段は得られないからだ.


 それにしても、みかけを扱うのは必要としても、関係者個々に独力でこれらの手間を強いるのは、どうみても些細なことでは済まない.


 層化や、MH解析、モデルによる調整*を覚える必要がある.これは、厳密に数値差をみていくというより、生起、交絡(ざっくりと、みかけ)、抑制の関係が見極められれば足りる場合が多いから、調整の手法を使用して、それら3関係を見分けるという方式である.他記事でも記すとおり、検討の目的は、最適なモデルを作ることではなく、限られた情報によるモデルから、本来の事件の原因やこれを左右する因子を探る手法を作ることにある.また、原因を含まないモデルの性質から、食中毒と感染症を鑑別する方法が開発できるはずであり、これを見据えている.
 * reduce modelと交互作用項を理解し、使い方を覚えることも必要(小規模例では発散気味になることがある.しかしまたしても疫学の手法がこれに役立つ.


補強・要点
 ・因子のうち ややあいまいな影響傾向を切り捨てない 検定はするな! 
 ・みかけ上のリスク値を交絡の影響を含めて調整の手法により調べる技術をもつ
 ・その過程で、逆なリスク値をもつ因子が現れる場合がある(ヨーグルトなど)
  これも調整の対象とし得る
 ・調整後リスク値が有意でもその事件の主要なリスク要因とは限らない
 ・層化して常識的な総括が必要(glm推定の宿命?)

×

非ログインユーザーとして返信する