|
EDA365欢迎您登录!
您需要 登录 才可以下载或查看,没有帐号?注册
x
打开Matlab输入doc dendrogram,可以发现如下描述:# x0 L/ r2 M y& m
! F A7 V6 f$ q0 Y; v: ?1 H2 V8 p1 U
7 q2 f& U& K5 I' Q( I+ |: ?( l [- B5 _! V
- dendrogram(tree) generates a dendrogram plot of the hierarchical binary cluster tree. A dendrogram consists of many U-shaped lines that connect data points in a hierarchical tree. The height of each U represents the distance between the two data points being connected.
- If there are 30 or fewer data points in the original data set, then each leaf in the dendrogram corresponds to one data point.
- If there are more than 30 data points, then dendrogram collapses lower branches so that there are 30 leaf nodes. As a result, some leaves in the plot correspond to more than one data point.
+ _! R( P$ p) ], A1 I5 q9 V
+ K. Y' ]) O; G, j; m5 _. z* `$ \8 g2 k6 q% q3 x: e' z4 U3 x& r
根据参考文献的思路,可能下面的说法更加好理解一些。
U, f! O2 T: S v+ q2 F" T1 s6 x" i5 A1 i: M9 u
在教材P301页1 h f/ }6 K. r5 v1 J9 I. b
1)H=dendrogram(Z)
: u R4 f2 C) K7 @$ F 有这么一句话,“当原始数据中观测数多于30个时,整个树形图会显得比较拥挤,可能会忽略某些底层节点,也就是说此时树形图中的某个叶节点可能对应多个观测。”" l1 ]: R* f4 e6 [
请问,可能会忽略某些底层节点是什么意思啊?某个叶节点可能对应多个观测又是什么意思呢?( h2 X0 F7 ], k! m9 {6 n( l7 ?
还有这里的底层节点和叶节点分别是什么意思啊?
7 O: Z& c# a# W$ @ P( b7 w2)H=dendrogram(Z,P): k d( A: l \1 s4 P9 `
若P为正整数,并且原始数据中的观测数多于P个时,将忽略某些底层节点,使得树形图的叶节点不多于P个。若P为0,则显示全部节点,此时树形图可能会显得比较拥挤。% X' W$ y3 C K4 x3 P3 z
3 i3 f7 M6 |7 A U9 r
聚类树形图上显示(注意是显示出来的)的最底层称为叶节点,当观测数目不太多时,聚类树形图能显示所有观测,此时叶节点就是各个观测;当观测过多时,聚类树形图无法显示所有观测点,也就是说某些细节会被掩盖,换句话说就是某些细小的树枝(由某些观测构成的一个小树枝)会显示为一个叶节点,此时某个叶节点可能对应多个观测。# _9 \5 O9 k+ s; E. u9 e4 ?0 z
3 w$ F" @7 X- [/ l* ?( b# {. Z& \, v" q" O
5 T+ U* b M( s l! Y
|
|