推荐书: Python开发最佳实践

spss如何使用变量的取值模式进行聚类

分享时@该用户已经被封, 我就能回答你的问题奥!

spss聚类分析中,默认的聚类方法是按照变量的取值水平进行聚类,但是有时候,为了符合我们研究的要求,需要按照变量的取值模式进行聚类,这时候就用到了这里提到的一个方法:By case
工具/原料

  • spss20.0
    方法/步骤
  • 先在spss中打开你要处理的数据,然后点击菜单:analyse–classify–hierarchical cluster,打开聚类分析的对话框
  • 将指标变量放入independent列表,然后把地区放入标签栏,因为地区可以作为case的标签
  • 点击method按钮,这就是我们的重头戏,在在方法对话框中,我们需要设置Z分数的计算方法
  • 如图所示,将standardised设置为Z score,然后勾选by case
  • 点击ok,开始处理数据,等会就输出结果
  • 第一个表格是聚类过程表,从聚类系数可以帮助我们判断将数据分为几类最合适,判断的方法是,相邻的两个数据变化的幅度显著大于前面的系数的变化范围,这时候分类在这里就是最好的
  • 这里叫做层次聚类谱系图,该图也是帮助我们查看聚类过程的,我们看到如图所示,沿着垂直方向画一条线,这条线与图中的水平线交叉点就是分的类别,有几个交叉点就有几个类别。当然,你所画的线可以决定你的数据分成了几类,越往右边,分类数目越少

转载请注明来自DataScience.

邮箱: 675495787@qq.com