2022年1月のブログ記事
-
-
■ モデリング推定係数のseは、いやに大きい.推定係数+2seをもとに、率や期待発生数を求め、データと比べると、およそ危険率5%などといった縛りからは、考えられない値が出る.(メモ;seが大きすぎる).サンプリングしたデータの大きさは有限(教科書的な、無限iに伸びた分布でない)で、超幾何分布をあて... 続きをみる
-
・ 2×2表を超幾何分布から考える. 2×2表では、生起因子曝露に対する観察発生数 94ほか(観光船事例)4つの数値が得られる. 事例のなかで、発生数m、暴露数(抽出数)k、非発生数nの3つの数値があれば、超幾何分布を用いて、抽出数に応じた、起こるべきばらつきを再現できる. 生起因子について... 続きをみる
-
超幾何分布からCIを計算してみた Fisher'sExact test for CI
cludeな指標のこと [データに依存して信頼区間を求めると整数を使った近似のために、デコボコするときの対処] ・解析において、cross tableから OR、RRと近似による偏差から信頼区間を推定するが、それは、ふつう各群の数から計算される.そのため低率の事例では、ケースの小さな整数が信頼区間... 続きをみる
-
・Rが推定する係数のse 数~10前後の因子についてglm logistic回帰をして係数を得る.x1が生起因子とわかる. 因子をこれ1つとしたモデルをつくり、seなどを比較する. 8因子モデル x1 se 切片 se AIC ... 続きをみる
-
・もとめるものは、すっきり割り切れないところにある.何か”あるらしい”匂いがするなら. ・検定は、ことを終わらせる間際の作法のようなものとすら思う. 推定や調整を繰り返す.過適合を避ける.データに束縛される必要はない.むしろデータはゆがみに束縛されている.しかしデータこそが残された手がかり. ... 続きをみる
-