SPSS+AMOS数据分析案例教程-关于中介模
SPSS视频教程内容目录和跳转链接
SPSS+AMOS数据分析案例教程-关于中介模
SPSS视频教程内容目录和跳转链接
R语言快速入门视频教程
Python智联招聘数据分析
LCA潜在类别分析和Mplus应用
Amos结构方程模型数据分析入门教程
倒U关系回归分析中介效应和调节效应分析SPSS视频教程

SPSS多重线性回归分析共线性和控制变量的设置和解读(视频教程)

在B站@mlln-cn, 我就能回答你的问题奥!

文章目录
  1. 1. 前提条件
  2. 2. 数据介绍
  3. 3. 介绍控制变量
  4. 4. 理论模型
  5. 5. 软件操作
  6. 6. 结果解读
  7. 7. 结果汇报
  8. 8. 视频教程

在前一篇教程中(回归-1元线性回归分析)我们主要介绍了1个自变量的回归分析, 这种情况比较少见, 通常回归分析可以加入多个自变量, 使得我们的研究更具有”生态效度”, 也就是说现实生活中, 影响因变量Y的因素太多了, 如果我们只研究1个自变量, 那我们的研究就偏离真实生活很远, 以至于我们的研究没有应用价值, 因此我们倾向于将更多的自变量加入到我们的模型中。

多重线性回归就是多个自变量的情况下的线性回归, 它与1元线性回归的区别就是有了多重共线性的风险, 其他没有太多区别。

前提条件

  • 自变量和因变量都是连续型变量(或者自变量可以定义为连续)
  • 自变量和因变量之间有线性关系(散点图或者相关分析)
  • 具有相互独立的观测值(Durbin-Watson)
  • 没有异常值(Casewise Diagnostics)
  • 等方差性(残差与回归拟合值或标准化残差与标准化预测值之间的散点图)
  • 回归残差近似正态分布(直方图)
  • 自变量之间不存在多重共线性

我在最后一个前提条件上加了粗体, 因为前几个条件都是之前的教程中介绍过的, 多重共线性是非常重要又没有讲过的,
因此我们后面会重点说。

数据介绍

我们调查了三百多人的体重和坐姿时间的数据, 研究目的是考察坐姿时间是否对体重有影响, 采集到的数据是这样的:

介绍控制变量

虽然我们的研究主题是”坐姿对体重的影响”, 但是我们采集了很多”无关”的变量, 比如抑郁和焦虑, 因为我们的研究想要排除心理疾病的影响, 另外身高也是对体重有重要影响的因素, 因此必须排除体重的影响, 所以身高也会用到。

上面的意思就是, 我们的模型引入的控制变量, 但是很多童鞋会纳闷, spss软件中没有让我们输入控制变量的地方, 因为控制变量就是自变量, 仅仅是因为我们的研究重点不是他们, 所以名字就叫做控制变量。总之控制变量就是自变量。

理论模型

在任何回归分析之前需要列出来你的理论模型, 就是一个方程式:

$$ 体重 = b_0 + b_1 坐姿时间 + b_2 身高 + b_3 是否抑郁 + b_4 是否焦虑 $$

软件操作

  • 打开回归的对话框
  • 设置变量, “体重”是因变量, 其他变量放入自变量框
  • 在”统计”对话框中注意勾选”共线性诊断”, 其他选项跟之前一样, 具体内容会在视频中讲解
  • 在”图”对话框中, 设置散点图的x和y轴的变量

结果解读

由于这是回归教程的第二篇, 很多检验在之前的教程中已经有讲解, 这里重点介绍共线性的检验, 当回归中存在2个或多个自变量高度相关时,就会出现多重共线。它不仅可以影响自变量对因变量变异的解释能力,还可以影响整个多重线性回归模型的拟合。为了检验假设6,我们主要关注相关系数(correlation coefficients)和容忍度/方差膨胀因子(Tolerance/VIF )两类指标。

实际上,方差膨胀因子是容忍度的倒数(1/容忍度),我们只需要判断其中一个指标即可。如果容忍度小于0.1,方差膨胀因子大于10,提示数据存在多重共线性。在本研究中,所有容忍度值都大于0.1(最小值为0.765),说明数据满足前提条件。

回归方程的ANOVA检验显示F(4,298) = 71.5, P<.001,结果显著,说明至少有一个自变量对因变量具有预测作用,具体哪些变量有预测作用,需要看具体的系数显著性检验。

结果汇报

如果容忍度小于1,方差膨胀因子(VIF)大于10,说明各变量严重共线。从表中结果可知,所有变量都不存在多重共线性的风险。

回归方程的ANOVA检验显示F(4,298) = 71.5, P<.001,结果显著,说明至少有一个自变量对因变量具有预测作用,具体哪些变量有预测作用,需要看具体的系数显著性检验。

坐姿时间的标准化系数为0.267(t=6.333, P<.001), 系数显著,且因为系数大于0,所以坐姿时间正向影响体重的大小;身高的标准化系数为0.635(t=15.260, P<.001), 系数显著,且因为系数大于0,所以身高正向影响体重的大小;是否有抑郁的标准化系数为0.094(t=2.195, p<.05), 系数显著,且因为系数大于0,所以是否有抑郁正向影响体重的大小;是否有焦虑的标准化系数为0.082(t=1.915, p>.05), 系数不显著,可以认为是否有焦虑对体重没有影响。总之,变量坐姿时间、身高、是否有抑郁的变化会显著影响体重的变化。

注意
本文由jupyter notebook转换而来, 您可以在这里下载notebook
统计咨询请加QQ 2726725926, 微信 mllncn, SPSS统计咨询是收费的
微博上@mlln-cn可以向我免费题问
请记住我的网址: mlln.cn 或者 jupyter.cn

视频教程

赞助

持续创造有价值的内容, 我需要你的帮助