morの解析ブログ

解析疫学、リスクにまつわるメモや計算

「推定」のまわりをさぐる.教科書では「解析はMHにより行う、因子が多ければ重回帰を用いる」という風で詳しい例は少ない.独自（のつもり）な思いつきで具体に試行.
　数理を用いるべきアセスメントにも切り込む.

道草　クラスター分析　clusplot

2023/06/11 18:06

■　クラスター分析でデータをみる.
　 clusplot ( dataroku ,km$cluster, color=TRUE, shade=TRUE, labels=2, lines=0)

　　　　

　データは、　y=1をID97 以降とし、tam=1をID 22-95と 103-　と並べ替えた.　
　「発生」IDは密な赤斜線エリアに集まった.y0のｍ、tam、toriなしは、粗な赤斜線に、
　y0のｍありは青斜線に集まった.
■　ｙ１を除く
　もし、発生のデータyを削除したらどうなるか.ｙカラムのないデータとなるのだが.
　　

　　　

　この図が示すのは、メニューどうしの曝露の共通性だろう.k-meansでcentersを３としている.データID1,2,3,7などは、粗赤斜線で囲まれ、これらは”お茶”曝露.kmy$centersをグラフにする.クラスターの”中ほど”を示す.

　　　　

　
　主成分分析、因子分析でも現れた”水”、”お茶”の、特徴ある曝露パターンが現れている.
■
　納豆オクラデータでは、

　　

　　　　

　y1を 90- 157とする.生起因子曝露は、44-47、90-となっている.