morの解析ブログ

解析疫学、リスクにまつわるメモや計算

「推定」のまわりをさぐる.教科書では「解析はMHにより行う、因子が多ければ重回帰を用いる」という風で詳しい例は少ない.独自(のつもり)な思いつきで具体に試行.
 数理を用いるべきアセスメントにも切り込む.

道草 クラスター分析 clusplot

■ クラスター分析でデータをみる.
  clusplot ( dataroku ,km$cluster, color=TRUE, shade=TRUE, labels=2, lines=0)


    

 データは、 y=1をID97 以降とし、tam=1をID 22-95と 103- と並べ替えた. 
 「発生」IDは密な赤斜線エリアに集まった.y0のm、tam、toriなしは、粗な赤斜線に、
 y0のmありは青斜線に集まった.
■ y1を除く
 もし、発生のデータyを削除したらどうなるか.yカラムのないデータとなるのだが.
  

   

 この図が示すのは、メニューどうしの曝露の共通性だろう.k-meansでcentersを 3としている.データID1,2,3,7などは、粗赤斜線で囲まれ、これらは”お茶”曝露.kmy$centersをグラフにする.クラスターの”中ほど”を示す.



    

 
 主成分分析、因子分析でも現れた”水”、”お茶”の、特徴ある曝露パターンが現れている.

 納豆オクラデータでは、


  

    


 y1を 90- 157とする.生起因子曝露は、44-47、90-となっている.

×

非ログインユーザーとして返信する