morの解析ブログ

解析疫学、リスクにまつわるメモや計算

「推定」のまわりをさぐる.教科書では「解析はMHにより行う、因子が多ければ重回帰を用いる」という風で詳しい例は少ない.独自(のつもり)な思いつきで具体に試行.
 数理を用いるべきアセスメントにも切り込む.

余興;推定関数の加工

・推定関数は曲面の方程式で、mlsとNLLは最小値が描く線も異なっていた.この関数を加工し推定に使えるか・・.optimを用いて調べる.


① p-y図で「⤴」となる最小値を描くようなものを探した.mlsに1項加える.


   mls <- sum( ( pr- y )^2 -pr*y )


・非独立なデータの適当な因子で推定、lm;mlsによる推定値と比較してみると、

 空欄はIC


 各係数(マイナスな係数も)がそろって1.5倍になっている.
 ちなみに交互作用有の線形回帰モデルでは切片以外が1.5倍となり、独立データではすべて1.5倍になる.
・はずれ数はどうか.
         lm最小二乗    最小二乗-pry 加   
   はずれ数   16         9       
・係数が大きめに推定され、はずれ数は減らせた.


② 「s」字状
  (y-(sin prπ/2)^2)^2
 サイン二乗カーブが p-y図で「s」字状の最小値を描く. 
 小さな係数ほど大きめに推定される.はずれ数はlm最小二乗よりやや悪化する.


③ 「半放物線」状
  pをsin^2カーブで変換する.
    2/π・arcsin√ p
  arcsinは級数から近似式とし、yとのmlsを計算させる.
 作られる曲面は、p=0,y=1のところで最大となっており、非対称でもある.
 係数から計算される率は生起因子は大きめ、他の因子は小さめに推定され、はずれ数は9.
  
・推定関数を並べると、最小値の描くラインが異なり、最大値の場所も異なってる.
 ③では、望まれる、y=1のとき、pが大きくならない推定(はずれ数で評価した過去記事)が得られる.しかし、”正しい”推定である保証はない.
 より、「らしい」推定のために、因果関係を式にして確率を定義することが1つ、一方で推定関数には興味が持てる.




 
推定関数はこの曲面の上の点が、IDの数だけ積み重なることになり、

×

非ログインユーザーとして返信する