SPSS 单因素方差分析教程

作者:Ruben Geert van den Berg,发表于 ANOVA 专栏下。

想要了解一些基础知识,请参考 ANOVA - 是什么?

  • 单因素方差分析 - 零假设
  • 方差分析的假设
  • SPSS 方差分析流程图
  • SPSS 单因素方差分析对话框
  • SPSS 方差分析输出结果
  • 方差分析 - APA 报告指南

方差分析示例 - 肥料对植物的影响

一位农民想知道哪种肥料最适合他的欧芹。因此,他在不同的植物上尝试不同的肥料,并在 6 周后称重这些植物。数据(部分如下所示)位于 parsley.sav 文件中。

Data View Parsley Plant Experiment 的截图

快速数据检查 - 分割直方图

SPSS 中打开我们的数据后,让我们首先看看它们的基本外观。一种快速的方法是分别检查每种肥料的重量直方图。下面的截图将指导您完成。

SPSS 单因素方差分析分割直方图对话框

按照这些步骤操作后,单击“粘贴(P aste)”将生成下面的 语法(syntax) 。让我们运行它。

*** 运行分割直方图。
**
GRAPH
/HISTOGRAM=grams
/PANEL COLVAR=fertilizer COLOP=CROSS.

结果

SPSS 单因素方差分析分割直方图

重要的是,这些分布看起来是合理的,我们没有看到任何异常值:我们的数据从一开始看起来是正确的 - 在真实世界的数据中并不总是这样!

结论:绝大多数重量在 40 到 65 克之间,并且看起来相当符合 正态分布(normally distributed)

检查样本量和均值

肥料究竟如何影响植物?让我们分别比较一下不同肥料的一些描述性统计数据。最快的方法是使用 MEANS 命令,我们可以从“分析(A nalyze)”SPSS 菜单箭头 “比较均值(C ompare Means)”SPSS 菜单箭头 “均值(M eans)”中粘贴,但直接输入语法可能同样容易。

*** grams (克) 按 fertilizer (肥料) 的基本描述性统计表。
**
means grams by fertilizer
/cells count mean stddev.

结果

SPSS 单因素方差分析均值表
  • 每种肥料的样本量均为 n = 30
  • 其次,化肥导致了最高的平均重量,接近 57 克。“None”表现最差,约为 51 克,而“Biological”介于两者之间。
  • “Biological”的标准差略高于其他条件,但差异非常小。

现在,这张表告诉我们很多关于植物 样本 的信息。但是我们的 样本 均值对 总体 均值有什么说明呢?我们能对肥料对 所有(未来)植物的影响说些什么呢?我们将尝试通过驳斥所有肥料表现相同的说法来做到这一点:我们的零假设。

单因素方差分析 - 零假设

方差分析的零假设是: 所有总体均值都相等。 如果这是真的,那么我们的样本均值无论如何可能都会略有不同。但是,非常 不同的样本均值与总体均值相等的假设相矛盾。在这种情况下,我们可以得出结论,这个零假设可能根本不是真的。

方差分析基本上会告诉我们,我们的零假设在多大程度上是可信的。但是,它需要一些关于我们数据的假设。

方差分析的假设

  • 独立观察(independent observations):数据中的每条记录必须是一个不同的、独立的实体。准确地说,假设是“独立同分布的变量”,但透彻的解释超出了本教程的范围。
  • 正态性(normality):因变量在总体中呈正态分布。对于合理的样本量,例如每个 n ≥ 25,则不需要正态性。
  • 方差齐性(homogeneity):因变量的方差在每个亚总体中必须相等。仅当样本量(明显)不相等时才需要方差齐性。在这种情况下,可以使用 Levene’s 检验 来查看是否满足方差齐性。

那么如何检查我们是否满足这些假设呢?如果我们违反了这些假设该怎么办?下面的简单流程图将指导我们完成。

SPSS 方差分析流程图

SPSS 单因素方差分析流程图

那么我们的数据呢?

  • 我们的植物似乎是独立观察:每个植物都有不同的 id 值(第一个变量)。
  • 我们的均值表显示每个 n ≥ 25,因此我们不需要满足正态性。
  • 由于我们的样本量相等,我们也不需要方差齐性假设。

那么我们为什么要根据均值表检查我们的样本量呢?为什么我们不直接查看 fertilizer (肥料) 的频率分布呢?好吧,我们的方差分析只使用在因变量上没有 缺失值(missing values) 的个案。我们的均值表准确地显示了这些个案。

第二个原因是我们需要报告每组的均值和标准差。均值表为我们提供了我们想要的统计数据,并按照我们想要的顺序排列。

SPSS 单因素方差分析对话框

我们现在将从菜单运行一个基本的方差分析。下面的截图将指导您完成。

SPSS 单因素方差分析对话框 1

“粘贴(P aste)”按钮创建了下面的 语法(syntax)

单因素方差分析语法

*** 基本单因素方差分析语法。
**
ONEWAY grams BY fertilizer
/MISSING ANALYSIS.

SPSS 单因素方差分析输出结果

SPSS 单因素方差分析输出结果

一般的经验法则是,如果“Sig.”或 p < 0.05,我们就拒绝零假设,这里的情况就是如此。因此,我们拒绝所有总体均值相等的零假设。

结论:不同的肥料表现不同。我们的平均重量之间的差异(范围从 51 克到 57 克)在 统计上是显著的(statistically significant)

方差分析 - APA 报告指南

首先,我们将 报告我们的均值表 。关于显著性检验,APA 建议我们报告

  • F 值;
  • df1,分子自由度(degrees of freedom
  • df2,分母自由度;
  • p 值

像这样: “我们的三种肥料条件导致欧芹植物的平均重量不同,F(2,87) = 3.7, p = .028。”

单因素方差分析 - 下一步

对于这个例子,我们 可以 再看看两件事:

  • 事后检验(Post hoc tests):我们的方差分析结果告诉我们,并非所有总体均值都相等。但是,究竟哪个均值与其他哪个均值不同呢?这可以通过运行 事后检验 来回答。有关优秀的教程,请参考 SPSS - 带事后检验的单因素方差分析示例
  • 效应量(Effect size):我们得出结论,肥料会影响平均重量,但这种影响有多大?对于方差分析,常用的 效应量 度量是 偏 eta 方(partial eta squared)。遗憾的是,效应量在“单因素(One-Way)”对话框中 отсутствует.

奇怪的是,MEANS 确实 包含 eta 方,但缺少其他基本选项,例如 Levene’s 检验。要获得完整的输出,您需要从 2 个不同的命令运行两次方差分析。这确实是 SPSS 中的一个主要愚蠢之处。我就这么说了。

从 MEANS 获取带有 Eta 方的方差分析

*** 从 MEANS 获取的方差分析包含 eta 方,但不包含 Levene's 检验或功效估计。
**
means grams by fertilizer
/statistics anova.

结果

从 MEANS 获取的 ANOVA - Eta 方输出

好的,这就是我能想到的最基本的 SPSS 方差分析教程。我希望你觉得它有帮助。