SPSS ANOVA:Levene 检验“显著”
作者:Ruben Geert van den Berg,发表于 ANOVA 栏目下
ANOVA(方差分析)的一个前提假设是方差齐性。我们通常会运行 Levene 检验来检查是否满足此假设。但如果 Levene 检验的结果是显著的(即不满足方差齐性),该怎么办?本教程将带你了解如何处理这种情况。
- SPSS ANOVA 对话框 I
- 结果 I - Levene 检验“显著”
- SPSS ANOVA 对话框 II
- 结果 II - Welch 和 Games-Howell 检验
- Plan B - Kruskal-Wallis 检验
示例数据
本教程中的所有分析都使用 staff.sav 数据集,部分数据如下所示。我们鼓励你下载这些数据并重复我们的分析。
我们的数据包含 N = 179 名员工的详细信息。今天的研究问题是:薪水与地区有关联吗?我们将尝试通过拒绝所有地区的平均人口薪水相等的零假设来支持这一观点。对此进行分析的一种常见方法是 ANOVA(方差分析),但这需要满足几个假设。
ANOVA 假设
ANOVA 需要满足 3 个假设:
- 独立观测:每个观测值之间是相互独立的。
- 正态性:因变量在每个子总体中必须服从正态分布。
- 方差齐性:因变量的方差在所有子总体中必须相等。
对于我们的数据,独立观测似乎是合理的:每个记录代表一个不同的人,并且人们没有以任何可能影响他们答案的方式进行互动。
其次,只有当每个子组的样本量 很小 时(例如,N < 25),才需要满足正态性。我们将在稍后检查我们的数据是否满足此要求。
最后,只有当样本量 非常不相等 时,才需要满足方差齐性。如果样本量不相等,我们通常运行 Levene 检验。此过程检验 2 个或更多总体方差是否可能相等。
快速数据检查
在运行 ANOVA 之前,让我们首先看看报告的薪水是否合理。最好的方法是检查直方图,我们将通过运行以下 语法 来创建直方图。
***运行薪水的基本直方图。
**
frequencies salary
/format notable
/histogram.
结果
- 请注意,我们的直方图报告 N = 175,而不是我们的 N = 179 名受访者。这意味着薪水包含 4 个缺失值。
- 但是,频率分布看起来是合理的:没有明显的离群值或其他应该引起警觉的异常情况。
- 分布显示出一些 正偏度。但是,这是完全合理的,无需担心。
现在让我们继续进行实际的 ANOVA。
SPSS ANOVA 对话框 I
在 SPSS 中打开我们的数据后,让我们首先导航到 A nalyze(分析) G eneral Linear Model(广义线性模型)
U nivariate(单变量),如下所示。
现在,让我们填写打开的对话框,如下所示。
完成这些步骤将生成以下语法。让我们运行它。
***带描述性统计、Levene 检验和效应大小:(偏)eta 平方的 ANOVA。
**
UNIANOVA salary BY region
/METHOD=SSTYPE(3)
/INTERCEPT=INCLUDE
/PRINT ETASQ DESCRIPTIVE HOMOGENEITY
/CRITERIA=ALPHA(.05)
/DESIGN=region.
结果 I - Levene 检验“显著”
我们检查的第一件事是用于 ANOVA 和 Levene 检验的样本量,如下所示。
- 首先,请注意,我们的 Descriptive Statistics(描述性统计)表基于 N = 171 名受访者(底行)。这是由于地区和薪水中存在一些 缺失值。
- 其次,“North”(北方)和“East”(东方)的样本量相当小。因此,我们可能需要满足正态性假设。现在,让我们假设它已满足。
- 接下来,我们的样本量非常不相等,因此我们确实需要满足方差齐性假设。
- 但是,Levene 检验 具有统计学意义,因为它的 p < 0.05:我们拒绝其总体方差相等的零假设。
最后 2 点的组合意味着我们 不能 解释或报告下表中显示的 F 检验。
如前所述,我们不能依赖于此 p 值进行通常的 F 检验。
但是,我们仍然可以解释 eta 平方(通常写为 η2)。这是一个描述性统计,既不需要正态性也不需要方差齐性。η2 = 0.046 意味着我们的 ANOVA 具有小到中的 效应大小。
现在,如果我们无法解释我们的 F 检验,那么我们如何知道我们的平均薪水是否不同?两个好的替代方案是:
- 运行带有 Welch 统计的 ANOVA 或
- Kruskal-Wallis 检验。
让我们从 Welch 统计开始。
SPSS ANOVA 对话框 II
对于检查 Welch 统计,首先导航到 A nalyze(分析) C ompare Means(比较平均值)
O ne-Way ANOVA(单因素方差分析),如下所示。
接下来,我们将填写打开的对话框,如下所示。
这将生成以下语法。再次,让我们运行它。
***带有 Welch 统计和 Games-Howell 事后检验的 ANOVA。
**
ONEWAY salary BY region
/STATISTICS HOMOGENEITY WELCH
/MISSING ANALYSIS
/POSTHOC=GH ALPHA(0.05).
结果 II - Welch 和 Games-Howell 检验
如下所示,Welch 检验 拒绝了总体均值相等的零假设。
此表标记为“Robust Tests…(稳健检验…)”,因为它对 Levene 检验指示的违反方差齐性假设的情况具有稳健性。因此,我们现在得出结论,平均薪水在 所有 地区并不相等。
但是,究竟 哪些 地区的平均薪水有所不同?这可以通过检查事后检验来回答。如果违反了方差齐性假设,我们通常更喜欢 Games-Howell 检验,如下所示。
请注意,此表中的每个比较都显示两次。平均薪水“显著”不同的唯一地区是 North(北方)和 Top 4 City(前四城市)。
Plan B - Kruskal-Wallis 检验
到目前为止,我们忽略了一个问题:某些地区的样本量为 n = 15 或 n = 16。这意味着也应该满足正态性假设。这里一个 糟糕的主意 是为每个地区分别运行:
这两个检验都不会拒绝 正态分布 因变量的零假设,但这仅仅是由于样本量不足。
一个更好的主意是运行 Kruskal-Wallis 检验。你可以使用以下语法执行此操作。
***从 Analyze(分析) - Nonparametric Tests(非参数检验) - Legacy Dialogs(旧对话框) - K Independent Samples(K 个独立样本)中进行的 Kruskal-Wallis 检验。
**
NPAR TESTS
/K-W=salary BY region(1 5)
/STATISTICS DESCRIPTIVES
/MISSING ANALYSIS.
结果
可悲的是,我们的 Kruskal-Wallis 检验未检测到地区之间平均薪水等级的任何差异,H(4) = 6.58,p = 0.16。
简而言之,我们的分析得出了不确定的结果,并且不清楚具体原因。如果你有任何建议,请在下面给我们留言。除此之外,感谢你的阅读!