morの解析ブログ

解析疫学、リスクにまつわるメモや計算

「推定」のまわりをさぐる.教科書では「解析はMHにより行う、因子が多ければ重回帰を用いる」という風で詳しい例は少ない.独自(のつもり)な思いつきで具体に試行.
 数理を用いるべきアセスメントにも切り込む.

陽性率の菌数による分布 poissonとgaussian_3 改、加、改

■ 記事_1,_2では、陽性率と危険な検体の割合が比例的でなく、リスクを考える上では陽性率を額面通りに扱えないことを観察した.
■ 一連のRA記事では、
○ 喫食量一定とすれば菌の濃度がリスクを決める.
○ 1回曝露・喫食直前の市販品ベースで考える.
○ リスクのある菌数濃度周辺では、累積度数の勾配が最も急になる.
としておく.この根拠となるものは公開された実測値・実験値にある.
 解釈は当ブログ独特のものが含まれる.
■ 陽性率分布
 ここでは、陽性率の分布についてメモする.鶏肉では、陽性率がばらつく.また、率により危険な検体の割合は異なっている.
 まず菌数による度数分布が定式化できるか試す.RA(EA:曝露アセス)に数理的な構造を当てはめることができれば、シミュレーションが容易となる.
A gaussian分布
 未加熱食品について生菌数を調べるとき、対数正規分布を想定するが、campyについて国産生鮮鶏肉(データ:表19 評価書)を調べると、対数化した菌数に対してgaussianが想定される.陰性の検体はこの分布を外れ、扱いに配慮が要ることがわかる.

            


B poisson分布
 低陽性率の群は、対数区分した菌数の度数分布から、(対数)正規分布を当てはめることはできず、まれな場合に当てはまるpoisson分布が尤もらしい.それは次のデータをみるとわかる.
 ① 市販肉について6検体中、
 陰性:〈50cfu/g  5検体、
 陽性:50-100cfu/g 1検体 
   データ:http://www.pref.miyagi.jp/uploaded/attachment/209066.pdf 
   ② 輸入肉について100検体中、
 陰性:〈15/100g 84検体、
 陽性:10の1乗台 14検体
 陽性:10の2乗台   2検体 
   データ:表19 評価書
           * ①と②では感度が全く異なる.


・評価書データを図示すれば、国産、輸入それぞれの菌数による汚染割合をみることができる :下図

         

     図 国産(青)50検体、輸入(赤)食鳥肉100検体の、campy菌数(対数)
       による汚染率 


*campyばかりか鶏卵サルモネラ汚染菌数のほとんどが低陽性率であり、度数分布はpoisson分布で近似できる.
 別記事、”poisson分布を級数表現してみた”では、poisson分布する場合に、その度数分布のランクゼロ;図中、”陰性”を exp(-λ)とし、λについて解くと、計算がすっきりして、解釈が容易になる.アイデアは、ランクゼロを陰性のものに対応させることである.
                                           データ:「鶏肉のサルモネラリスクプロファイル」
・ このような、陰性を含む分布を一括して扱うには、β分布をからめたpoisson分布が想定される.

汚染率は危険と比例しない._2

■ 前記事では、ヒトの発症菌量を固定すると、ブツの重量と濃度に簡単な関係が設定でき、これを起点として、同一データから陽性率とリスクの程度が比例関係にないことが導かれる例を1つ示した.国内RAの定量データから菌数による分布を作成して試算した.
■ リスク
 ある菌数を区切り、危険な検体とするうえで検体との関係をもう少し説明する.
■ 発症菌量
 実際のcampy事故では、残品の菌数が30cfu/g程度であった(定量された事故データは少ないようだ).実験的には、国際的に使用されているボランティア発症菌数実験のデータ;800cfuがあり、また仮定される値としては500程度、100などがある.
 当ブログの計算では、100-800の範囲で発症菌量を変えても危険な検体の割合はあまり変わらなかった.
 さらには、製品側の濃度を表現する定量データは、10のx乗で区分するものがあるから、発症の危険の値を100cfuとおくことは、便利でもあり、少し厳しめだが無理のないところだろう.
■ 外挿による感染の危険の誤解
 あえて誤解という.
 FAOのRAでは発症の確率を計算する式として、「菌1個でも危険有」ことを前提に、個数が増えるにつれて、なめらかに確率が増加するものを用いている.これは実際の結果から設定された式ではない.つまりは、発症する確率がはっきりした菌数範囲外について、「外挿」している.
 上のように、実際は、800cfuを下回る数での発症の実証がなく、また仮にわずかな発症可能性があるとしても、全体の評価への寄与は小とみなして無視する.
 外挿は行き過ぎの恐れが生じ、定性で陽性なら危険という天下り的固定観念を許してしまう. 
■ この記事では、記事_1に引き続き、他の複数の定量データを使い、一般に陽性率とリスキーな検体が比例しないことをみていく.
■ データ
 下表は評価書のデータであり、この2行目の128検体のデータを例にする.




 陽性検体の割合;陽性率positive rateをprとする.  発症菌量を超えるものの割合 risky sample rateをrrとする.
 陽性率prは、
  pr = (128-32) / 128 = 75%
 である.
 発症菌数を100cfuとし、100g摂るとして100cfu/100gランク以降を発症菌量濃度の検体とするから、その割合rrは、
  rr = (37+26+4) / 128 = 52%
 となる.これを▲で図示する.
 ここでもし、各セル(同一菌数の検体)で一斉に1オーダーづつ菌数を下げると;●で表す;pr-rrは上図のような曲線(赤、矢印)をたどる. 

陽性率に対し、riskyなブツの菌数(濃度)は比例関係にない.


 さらにこのことが他の実測データにおいても成り立つか調べる.
 公開各資料定量データについて、陽性率、危険な菌数のものを100cfu(食す量を100gと設定)とすると次の表になる.

この表を図示すると、

 発症の危険rrのものは、陽性率prより小さい、つまり毎常、
     rr ≦ pr   《b》
 が成り立つ.
 意味ありげに思えるのは、例数の十分なプロットが垂れたひも状の凹んだ曲線を描くことだ.理由は、菌数濃度の度数分布が釣鐘状を示すことによる.こんもりした砂山を端から等間隔で掻き出し、1度にとれる砂の量を量っていくときを思い浮かべてみると、はじめのうちは何度書き出しても砂はなかなかたまらないが、中ほどへ向かって次第に多くなり、そして次第に少なくなる、がしかし、ほとんどの砂を得た後もすべてを掻き出すのは、なかなかはかどらない様子、というふうに想像すればよい.
■ 数ある定量データから rr は pr に対し、比例的でない(あるいは線形でない)ことが示された.これについての数理は機会があれば記す.
 また、発症の危険のある菌量をもつものの割合が陽性率と同じとみなせるのはむしろ例外的であった.