文章目录
强影响点会影响线性回归的回归效果,所以我们需要对这些数据进行筛选,那么如何诊断中这些数据呢?我们通常是使用强影响点诊断,下面是具体的方法:
工具/原料
spss20.0
方法/步骤在菜单栏上执行:analyse–regression–linear,打开线性回归对话框
- 将自变量和因变量放入各自的框框中,上面的是因变量,下面的是自变量
- 点击statistic按钮,我们设置检验强影响点的参数
- 勾选如图所示的选项,我们看到一个数值3是我们自己填的,3代表三个标准差,在3个标准差以外的数据就会作为强影响点,这里只是诊断强影响点,而不会 在处理数据的时候删除这些数据
- 点击ok按钮,开始处理数据并输出诊断的结果表格
- 这个表格就是对强影响点的诊断,case number这个就是被诊断出来的强影响点的case编号,我们可以删除这些强影响点以后再进行数据的处理
转载请注明来自DataScience.
邮箱: 675495787@qq.com