要手动计算结构方程模型 (SEM) 的参数量和自由度,您需要对模型中的所有变异数、共变异数以及回归路径进行系统性的识别和计数。以下是计算 SEM 参数量和自由度的详细步骤教程。
结构方程模型 (SEM) 是一种强大的统计方法,用于检验变量之间的复杂关系。在构建 SEM 模型时,了解模型的参数量和自由度至关重要,因为它们直接影响模型的识别性以及模型拟合度的评估。
第一部分:计算模型的参数量 (Number of Parameters)
模型的参数量指的是模型中需要估计的独立参数的数量。这些参数包括变量的变异数、变量间的共变异数以及回归路径的系数。
步骤一:识别所有变量
列出模型中所有的观测变量 (Observed Variables)(即指标变量)和所有的潜变量 (Latent Variables)。
步骤二:计算观测变量的变异数
模型中每个观测变量都需要估计一个变异数。
- 观测变量的变异数数量 = 观测变量的总数
步骤三:计算潜变量的变异数
模型中每个潜变量都需要估计一个变异数。
- 潜变量的变异数数量 = 潜变量的总数
步骤四:计算变量间的共变异数(Co-variances)/相关
这包括观测变量之间以及潜变量之间的共变异数。
- 观测变量间的共变异数数量:统计模型中所有观测变量之间的共变异数。在某些模型中,残差共变异数也可能被估计。
- 潜变量间的共变异数数量:统计模型中所有潜变量之间的共变异数。
步骤五:计算回归路径
这包括潜变量对其指标变量的回归路径(即因子载荷)以及潜变量之间的回归路径。
- 潜变量到其指标变量的回归路径 (Loadings):计算每个潜变量到其对应观测变量(指标)的路径数量。
- 潜变量到潜变量的回归路径:计算一个潜变量到另一个潜变量的路径数量。
步骤六:固定一个参数以设定每个潜变量的尺度
为了为每个潜变量设定一个尺度(即确定其单位),您必须固定该潜变量的一条路径(通常是其一个因子载荷)为 1。这个被固定的参数不计入需要估计的自由参数数量中。
步骤七:汇总所有自由参数
将步骤二、三、四和五中计算出的变异数、共变异数和回归路径的数量相加,然后减去在步骤六中被固定为 1 的参数数量。
- 总自由参数量 = 观测变量变异数 + 潜变量变异数 + 观测变量间共变异数 + 潜变量间共变异数 + (未被固定的) 潜变量到指标路径 + 潜变量到潜变量路径
示例:一个包含 5 个观测变量和一个潜变量的验证性因子分析 (CFA) 模型
假设有一个潜变量,它由 5 个观测变量(指标)测量。
-
变异数 (Variances):
- 5 个观测变量的变异数 = 5
- 1 个潜变量的变异数 = 1
- 变异数总数 = 6
-
载荷 (Loadings):
- 通常,会有 5 个载荷(每个观测变量对应一个)。
- 但是,为了设定潜变量的尺度,必须将其中一个载荷固定为 1。
- 因此,需要估计的载荷数量 = 5 - 1 = 4
-
共变异数 (Covariances):
- 在这个简单的CFA模型中,通常不直接估计观测变量之间的共变异数(它们由共同的潜变量解释)。潜变量之间也只有一个,但这里只有一个潜变量,所以没有潜变量间的共变异数。观测变量的残差之间一般也不估计共变异数。
- 因此,此模型中需要估计的共变异数数量 = 0(除非您有特定的残差共变异数需要估计)。
-
总自由参数量 = 6 (变异数) + 4 (载荷) + 0 (共变异数) = 10 个自由参数
第二部分:计算模型的自由度 (Degrees of Freedom, df)
模型的自由度衡量的是模型中可用于估计的信息与实际估计参数数量之间的差异。自由度为正数表示模型是识别的,且可以进行拟合度检验。
步骤一:计算样本共变异数矩阵中的唯一元素数量
SEM 模型的基础是样本共变异数矩阵。如果您的模型有 p
个观测变量,那么样本共变异数矩阵是一个 p x p
的对称矩阵。该矩阵中唯一元素的数量(包括变异数和共变异数)可以通过以下公式计算:
- 样本共变异数矩阵中的唯一元素数量 = p * (p + 1) / 2
- 其中
p
是模型中观测变量的总数。
- 其中
步骤二:计算模型的自由度
模型的自由度是样本共变异数矩阵中唯一元素的数量减去模型中需要估计的自由参数的数量。
- 模型的自由度 (df) = [p * (p + 1) / 2] - 总自由参数量
回到示例:一个包含 5 个观测变量和一个潜变量的验证性因子分析 (CFA) 模型
-
观测变量数量 (p) = 5
-
样本共变异数矩阵中的唯一元素数量:
- 5 * (5 + 1) / 2 = 5 * 6 / 2 = 30 / 2 = 15
-
模型的自由度 (df):
- 我们之前计算出总自由参数量为 10。
- 自由度 = 15 (唯一元素) - 10 (自由参数) = 5
通过以上步骤,您可以手动计算任何 SEM 模型的参数量和自由度,从而更好地理解您的模型结构和识别情况。