推荐书: Python开发最佳实践

spss中如何处理极端值、错误值

分享时@该用户已经被封, 我就能回答你的问题奥!

spss中录入数据以后,第一步不是去分析数据,而是要检验数据是不是有录入错误的,是不是有不合常理的数据,今天我们要做一个描述性统计,进而查看哪些数据是不合理的。下面是具体的步骤:
工具/原料

  • spss20.0
    方法/步骤
  • 先准备好数据,然后打开描述性统计对话框,如图所示,执行菜单:analyse–descriptive statistic–descriptive
  • 将你要检验的变量放入variables对话框,点击箭头可以添加或者删除变量
  • 勾选如图所示的选项,他的意思是输出Z分数,并作为一个变量列出来。因为检查数据有效性的时候会用到Z分数
  • 点击options按钮,设置需要输出的描述性统计量,我们需要的统计量主要是最大值和最小值,所以,你看到下面第二幅图,勾选最大值和最小值
  • 点击continue按钮,点击ok,开始处理数据,并输出处理结果
  • 我们看到有一个表格,输出了最大值和最小值,根据这个值我们可以判断,这个变量中的数据是不是超出了合理的范围,比如,这个变量的意思是身高,你的数据的最大值为5米,这时侯你就可以想到,有数据录入错误了。
  • 接下来切换到数据视图中,我们看到生成了一个新的变量,他是x8这个变量的Z分数,我们知道,如果数据是正太分布的,那么数据应当分布在正负三个标准差之内,因此,从图中我们看到,Z分数大于3或小于-3的数据就是错误的数据

转载请注明来自DataScience.

邮箱: 675495787@qq.com