道草 クラスター分析 clusplot
■ クラスター分析でデータをみる.
clusplot ( dataroku ,km$cluster, color=TRUE, shade=TRUE, labels=2, lines=0)
データは、 y=1をID97 以降とし、tam=1をID 22-95と 103- と並べ替えた.
「発生」IDは密な赤斜線エリアに集まった.y0のm、tam、toriなしは、粗な赤斜線に、
y0のmありは青斜線に集まった.
■ y1を除く
もし、発生のデータyを削除したらどうなるか.yカラムのないデータとなるのだが.
この図が示すのは、メニューどうしの曝露の共通性だろう.k-meansでcentersを 3としている.データID1,2,3,7などは、粗赤斜線で囲まれ、これらは”お茶”曝露.kmy$centersをグラフにする.クラスターの”中ほど”を示す.
主成分分析、因子分析でも現れた”水”、”お茶”の、特徴ある曝露パターンが現れている.
■
納豆オクラデータでは、
y1を 90- 157とする.生起因子曝露は、44-47、90-となっている.