如何在 SPSS 中计算均值

作者:Ruben Geert van den Berg,归属于 因子分析

引言 & 练习数据文件

本教程将演示如何以简单而稳健的方式计算变量和个案的均值。我们建议您下载并打开 restaurant.sav 文件,并跟随教程进行操作。该文件的一部分内容如下所示。

SPSS - 如何计算均值的原始数据

快速数据检查

在进行任何计算之前,我们需要首先了解数据中包含的内容。跳过此步骤通常会导致得到错误的结果,我们稍后会看到这一点。首先,我们通过运行以下 语法(syntax) 来检查一些频率。

***在输出表格中显示数据值和值标签。
** set tnumbers both.

***快速数据检查。
** frequencies v1 to v5.

结果

SPSS - 如何计算均值 - 快速数据检查

好的,现在在继续之前,我们需要确保两件事。首先,所有变量是否具有相似的编码方案? 对于食物评分,较高的数字(4 或 5)反映了更积极的态度(“好”和“非常好”),但对于所有变量都适用吗?如果我们快速查看我们的 5 个表格,我们会发现这是成立的。 其次,我们是否有任何用户缺失值(user missing values)? 也就是说,我们是否要将所有数据值包含在我们的计算中?在这种情况下,我们不希望这样做。我们需要从所有计算中排除 6(“没有回答”)。我们将使用以下语法来实现这一点。

设置缺失值

***将 6 设置为用户缺失值。
** missing values v1 to v5 (6).

***再次检查。
** frequencies v1 to v5.

结果

SPSS - 如何计算均值 - 用户缺失值设置

计算变量的均值

好的,计算变量均值的最简单方法如下面的语法所示。请注意,我们通常可以使用空格分隔变量名,但在这种情况下,由于某些奇怪的原因,我们需要使用逗号。

***计算 v1, v2, v3, v4 和 v5 的均值。
**
compute happy1 = mean(v1, v2, v3, v4, v5).
execute.

如果我们的目标变量在数据中是相邻的,我们不需要拼写出所有变量名。相反,我们只需要输入第一个和最后一个变量名(可以从 变量视图(variable view) 复制粘贴到我们的语法窗口中),并用 TO 分隔。

***替代方法:使用 TO 关键字指定变量。
**
compute happy2 = mean(v1 to v5).
execute.

计算均值 - 处理缺失值

如果我们仔细观察我们的数据,我们会发现一些受访者在 v1 到 v5 上有很多缺失值。默认情况下,v1 到 v5 的均值是为在这些变量上至少有一个非缺失值的任何个案计算的。如果所有五个值都是(系统或用户)缺失值,则无法计算均值,因此它将是一个 系统缺失值(system missing value),正如我们在数据中看到的那样。

SPSS - 如何计算均值 - 缺失值

通常的做法是从计算中排除具有很多缺失值的个案。在这种情况下,最简单的选择是使用点运算符。例如,mean .3 (v1 to v5) 表示“计算 v1 到 v5 的均值,但仅适用于在这些变量上至少有 3 个非缺失值的个案”。让我们试试看。

计算均值 - 排除具有许多缺失值的个案

***仅为在 v1 到 v5 上至少有 3 个有效值的个案计算均值。
**
compute happy3 = mean.3(v1 to v5).
execute.

结果

SPSS - 如何计算均值 - 排除缺失值

另一种更通用的方法,也适用于更复杂的计算,是使用 IF 命令,如下所示。

***排除在 v1 到 v5 上有效值少于 3 个的个案的替代方法。
**
if (nvalid (v1 to v5) >= 3) happy4 = mean(v1 to v5).
execute.

SPSS - 计算个案的均值

到目前为止,我们计算了水平均值:每个个案变量的均值。现在让我们计算垂直均值:每个变量个案的均值。我们将首先创建包含均值的输出表,然后将这些均值添加到我们的数据中。 使用 DESCRIPTIVES 可以轻松获得所有个案的均值,例如 descriptives v1 v2.

结果

SPSS - 如何计算均值 - 描述性统计

分组的均值

那么,如果我们想分别获得男性和女性受访者的均值呢?一种选择是 SPLIT FILE,但这比必要的麻烦多了。一个简单的 MEANS 命令就可以做到,如下所示。

***仅在输出表格中显示值标签(无数据值)。
**
set tnumbers labels.

***分别报告不同性别的均值。
**
means v1 v2 by gender/cells means.

结果

SPSS - 如何计算均值 - Means 命令

SPSS - 将均值添加到数据集

最后,您有时可能希望将个案的均值作为新变量添加到您的数据中。这里的方法是 AGGREGATE 命令,如下所示。

***将 v1 的均值作为新变量添加到数据中。
**
aggregate outfile * mode addvariables
/mean_1 = mean(v1).

如果您想要分别获得个案组的均值,请添加一个或多个 BREAK 变量,如下所示。此示例还展示了如何一次添加多个变量的均值,再次使用 TO 关键字。

***将 v2 到 v5 的均值分别作为新变量添加到数据中。
**
aggregate outfile * mode addvariables
/break gender
/mean_2 to mean_5 = mean(v2 to v5).

结果

SPSS - 如何计算均值 - AGGREGATE 命令

请注意,在运行 means v2 by gender. 之后,我们已经在输出中看到了这些均值(v2 的均值,按性别划分)。 好了。这就是关于 SPSS 中均值的所有内容。如果您有任何问题或意见,请随时在下面发表评论。