2022年1月のブログ記事一覧 - morの解析ブログ

正確確率のところで、コメントいただいた件、記事として　階乗を含む式をlnすれば表現が簡単化できるか　　　　ln＜n！＞　=　ln（n・(n-1)・(n-2)・・・１）　　　　　　　　　=　ln（n）+ln（n-1）+ln(n-2)　+...+ln1　　→　lnの積分　ある区間での積分（... 続きをみる

超幾何分布はモデリングによるseより有用か

■　モデリング推定係数のseは、いやに大きい.推定係数+2seをもとに、率や期待発生数を求め、データと比べると、およそ危険率5%などといった縛りからは、考えられない値が出る.（メモ；seが大きすぎる）.サンプリングしたデータの大きさは有限（教科書的な、無限iに伸びた分布でない）で、超幾何分布をあて... 続きをみる

超幾何分布から信頼下限を決める

・　2×2表を超幾何分布から考える. 　2×2表では、生起因子曝露に対する観察発生数　94ほか（観光船事例）４つの数値が得られる. 　事例のなかで、発生数m、暴露数（抽出数）k、非発生数ｎの3つの数値があれば、超幾何分布を用いて、抽出数に応じた、起こるべきばらつきを再現できる. 　生起因子について... 続きをみる

超幾何分布からCIを計算してみた Fisher'sExact test for CI

cludeな指標のこと [データに依存して信頼区間を求めると整数を使った近似のために、デコボコするときの対処] ・解析において、cross tableから OR、RRと近似による偏差から信頼区間を推定するが、それは、ふつう各群の数から計算される.そのため低率の事例では、ケースの小さな整数が信頼区間... 続きをみる

メモ：glmで推定した係数のseが大きい

・Rが推定する係数のse 　数~10前後の因子についてglm logistic回帰をして係数を得る.x1が生起因子とわかる. 　因子をこれ１つとしたモデルをつくり、seなどを比較する. 　8因子モデル　　　x1　　　se　　　切片　　se　　　AIC 　　　　　　　　　　　... 続きをみる

検定は後回しで推定を学ぶ

・もとめるものは、すっきり割り切れないところにある.何か”あるらしい”匂いがするなら. ・検定は、ことを終わらせる間際の作法のようなものとすら思う. 　推定や調整を繰り返す.過適合を避ける.データに束縛される必要はない.むしろデータはゆがみに束縛されている.しかしデータこそが残された手がかり. 　... 続きをみる

危険度差RD

　２×２表において　曝露発症a、非曝露発症b、曝露非発症c、非曝露非発症dとおくとき　　RD＝a/(a+b) - c/(c+d) 　とする. 　事例の生起因子により、層化して他の因子についてRDを調べる. 　　生起因子あり群の因子RDとなし群の因子RDは、　　層化　　　　　　　　因子２... 続きをみる