SPSS WEIGHT 命令

默认情况下,你数据中的每个个案都算作一个独立的个案。然而,你可以让每个个案的权重不同,也就是加权 (weighting)。 例如,你数据中的第一个个案可以被视为 2 个个案,而第二个个案则可以被视为 0.5 个个案。这些数值,即个案权重 (case weights),存储在一个权重变量 (weight variable) 中。运行 WEIGHT BY [...] 命令会告诉 SPSS 将某个权重变量的值视为当前的个案权重。请注意,状态栏会显示加权是否生效。

SPSS Weight On

SPSS Weight - 基本用法

类似于 [SPLIT FILE](/spss-split-file-command)[FILTER](/spss-filter-command) 命令,WEIGHT 命令有三个主要的操作:

  1. WEIGHT BY [...].:启用一个权重变量。如果当前已经有一个权重变量生效,该命令可以用于设置另一个变量作为当前的个案权重。
  2. SHOW WEIGHT.:显示当前正在使用的权重变量。
  3. WEIGHT OFF.:关闭个案权重。执行此操作后,每个个案将再次被视为一个独立的个案。

SPSS Weight - 注意事项

  • SPLIT FILEFILTER 命令不同,活动的权重变量会与数据一起保存。因此,当你启动 SPSS 并打开一个数据文件时,可能已经有一个权重变量生效。
  • 活动的权重变量不仅会影响生成的输出结果,某些数据修改操作也会受到个案权重的影响(最显著的是 [AGGREGATE](/spss-aggregate-command) 命令)。
  • 有些用户通过菜单查看当前生效的权重变量。当看到 current status: Weight cases (…) 时,他们认为没问题并点击 “OK”。然而,这会关闭权重变量。

SPSS Weight Off 意外地关闭了个案权重

为什么要对个案进行加权?

以下是需要对个案进行加权的主要场景:

  1. 你的样本不能代表你正在调查的总体。例如,你可能知道你的目标总体中有 50% 是女性,但你的样本中有 80% 是女性。在这种情况下,你可以通过给这 80% 的女性分配 0.625 的个案权重来降低 (weight down) 她们的权重,使她们在样本中占比 50%。类似地,你可以通过分配 2.5 的权重来提高 (weight up) 20% 的男性受访者的权重,使他们在样本中也占比 50%。 请注意,这些权重并不对应于实际进行的观察数量。在这种情况下,权重通常具有平均值为 1,因此加权后的样本大小与未加权的样本大小完全相同。我们将在下面的示例中演示这种情况。

  2. 在某些情况下,你只有聚合数据。一个典型的例子是书或文章中呈现的列联表(“crosstab”)。在这种情况下,个案权重将全部为正整数。这种情况下,权重对应于实际进行的观察数量

  3. 你可以在某些情况下欺骗 SPSS 使用权重,但这超出了本教程的范围。

SPSS Weight - 示例

“我们进行了一项关于收入的小型调查。不幸的是,我们 80% 的受访者是女性,而这在我们目标总体中只占 50%。也就是说,我们的样本不能代表我们的总体,因为女性受访者人数过多。”

运行下面的 语法 (syntax) 会创建这些数据,并计算男性、女性和所有受访者的平均收入。

***1. 创建一些测试数据。
**
data list free / case_weight gender income.
begin data
2.5, 0, 2200, 2.5, 0, 2000, 0.625, 1, 2700, 0.625, 1, 2300, 0.625, 1, 2400,
0.625, 1, 2700, 0.625, 1, 2400, 0.625, 1, 2300, 0.625, 1, 2500, 0.625, 1, 2200
end data.

value labels gender 0 'Male' 1 'Female'.

***2. 未加权的平均收入。
**
means income by gender.

未加权个案的偏差估计

SPSS Unweighted Means 女性受访者人数过多且收入较高

在上图中请注意,女性受访者的平均收入较高,而且人数也过多。这导致对整个目标总体的估计平均收入(€ 2370,-向上偏差 (biased upwards)。我们可以通过像前面描述的那样对受访者进行加权来纠正这一点。下面的语法演示了如何做到这一点。

***3. 加权个案 + 快速检查,然后运行加权平均收入。
**
weight by case_weight.

show weight.

means income by gender.

***4. 关闭加权并对其进行快速检查。
**
weight off.

show weight.

加权个案的无偏估计

SPSS Weighted Means 当权重生效时,女性和男性人数相等

在上图中,首先看一下样本大小。现在女性和男性的人数相等,从而使样本在性别方面具有代表性。另请注意,总样本量仍然是 10。这是因为平均个案权重正好为 1。 其次,我们目标总体的估计平均收入现在是 € 2268,75-。这是因为我们通过加权来纠正前面提到的向上偏差。