morの解析ブログ

解析疫学、リスクにまつわるメモや計算

「推定」のまわりをさぐる.教科書では「解析はMHにより行う、因子が多ければ重回帰を用いる」という風で詳しい例は少ない.独自(のつもり)な思いつきで具体に試行.
 数理を用いるべきアセスメントにも切り込む.

2022年1月のブログ記事

  • lnの積分

    正確確率のところで、コメントいただいた件、記事として  階乗を含む式をlnすれば表現が簡単化できるか     ln<n!> = ln(n・(n-1)・(n-2)・・・1)           = ln(n)+ln(n-1)+ln(n-2) +...+ln1   → lnの積分  ある区間での積分(... 続きをみる

  • 超幾何分布はモデリングによるseより有用か

    ■ モデリング推定係数のseは、いやに大きい.推定係数+2seをもとに、率や期待発生数を求め、データと比べると、およそ危険率5%などといった縛りからは、考えられない値が出る.(メモ;seが大きすぎる).サンプリングしたデータの大きさは有限(教科書的な、無限iに伸びた分布でない)で、超幾何分布をあて... 続きをみる

  • 超幾何分布から信頼下限を決める

    ・ 2×2表を超幾何分布から考える.  2×2表では、生起因子曝露に対する観察発生数 94ほか(観光船事例)4つの数値が得られる.  事例のなかで、発生数m、暴露数(抽出数)k、非発生数nの3つの数値があれば、超幾何分布を用いて、抽出数に応じた、起こるべきばらつきを再現できる.  生起因子について... 続きをみる

    nice! 2
  • 超幾何分布からCIを計算してみた Fisher'sExact test for CI

    cludeな指標のこと [データに依存して信頼区間を求めると整数を使った近似のために、デコボコするときの対処] ・解析において、cross tableから OR、RRと近似による偏差から信頼区間を推定するが、それは、ふつう各群の数から計算される.そのため低率の事例では、ケースの小さな整数が信頼区間... 続きをみる

  • メモ:glmで推定した係数のseが大きい

    ・Rが推定する係数のse  数~10前後の因子についてglm logistic回帰をして係数を得る.x1が生起因子とわかる.  因子をこれ1つとしたモデルをつくり、seなどを比較する.       8因子モデル   x1   se   切片   se   AIC                  ... 続きをみる

  • 検定は後回しで推定を学ぶ

    ・もとめるものは、すっきり割り切れないところにある.何か”あるらしい”匂いがするなら. ・検定は、ことを終わらせる間際の作法のようなものとすら思う.  推定や調整を繰り返す.過適合を避ける.データに束縛される必要はない.むしろデータはゆがみに束縛されている.しかしデータこそが残された手がかり.  ... 続きをみる

  • 危険度差RD

     2×2表において 曝露発症a、非曝露発症b、曝露非発症c、非曝露非発症dとおくとき   RD=a/(a+b) - c/(c+d)  とする.      事例の生起因子により、層化して他の因子についてRDを調べる.   生起因子あり群の因子RDとなし群の因子RDは、   層化        因子2... 続きをみる