morの解析ブログ

解析疫学、リスクにまつわるメモや計算

「推定」のまわりをさぐる.教科書では「解析はMHにより行う、因子が多ければ重回帰を用いる」という風で詳しい例は少ない.独自(のつもり)な思いつきで具体に試行.
 数理を用いるべきアセスメントにも切り込む.

超幾何分布はモデリングによるseより有用か

■ モデリング推定係数のseは、いやに大きい.推定係数+2seをもとに、率や期待発生数を求め、データと比べると、およそ危険率5%などといった縛りからは、考えられない値が出る.(メモ;seが大きすぎる).サンプリングしたデータの大きさは有限(教科書的な、無限iに伸びた分布でない)で、超幾何分布をあてはめるのが自然だ.平均値1つが与えられ、サンプリング数(曝露数)が決まれば、”正確に”決まる.実例データによると信頼下限は、モデリングの係数から求めた下限より、かなりタイトだとわかる.
■ 超幾何分布の発生m、非発生nを伸ばすと、分散は、k(1-p)pに漸近する.このときの分散が与える区間は、有限なサンプリング集団の超幾何分布からのばらつきよりは大きくなるが、モデリングによるseが示すものより小さい.
■ サンプリング数についての分散が与える信頼下限の一点は、モデルに基づいて本当に知りたい、因子の効果を示す値にちがいない.
 サンプリングが有限である限りは、どのような因子・曝露状況下でも有限な組み合わせで結果との関係が決まるわけで、モデリングの推定方法に立ち返ると、logistic回帰では、係数の範囲は-∞から+∞の正規分布する前提であり、最尤推定では、確率の平均に収束することと曝露によって説明しつくすことに縛られる.重回帰では、最尤推定によって係数ベクトルβi(この場合切片を含む)がそれの属する因子の曝露とで決まる.その βixi もまた、データの枠のなかで許される超幾何分布に収まるべきであるとしてみる.


・・条件1
 とはいいながら、線形予測子 βixi は、最尤推定の縛りでは、その総体の影響に枠がはめられるのであり、β。βiのいずれも一意に決めるものでない.
 そこで、疫学的な条件を持ち込んでこれを縛るのであった.

×

非ログインユーザーとして返信する