因子分析主要有两种:一种旨在探索新的因子结构(探索性因子分析),另一种旨在已经确立的因子结构中验证结构的合理性。
在本篇文章中,我们重点关注的是两者的不同使用环境,我们大部分人都用错了。
什么是探索性因子分析
探索性因子分析(Exploratory Factor Analysis,EFA)是多元统计分析技术的一个分支,主要用于研究众多变量之间的内部依赖关系,探求观测数据中的基本结构,并用少数几个潜变量(即因子)来表示基本的数据结构。这种方法有助于将具有错综复杂关系的变量综合为少数几个核心因子,从而实现对数据的降维处理。
在探索性因子分析中,一旦因子被抽取出来,确定保留因子的个数就变得非常关键。常用的确定因子个数的准则包括特征值大于1准则(eigenvalue greater than 1 rule)和碎石图(scree test)。 其实还有其他的方法比这两个方法更准确,也更合理, 但是因为这两种方法最简单, 最终他们被使用的频率最高。不过,这两个标准往往也是有分歧的, 也就是说大于1的特征值的因子可能有3个, 但是根据碎石图可以提取4个, 这种情况很普遍, 这就告诉我们任何一种标准都不是一定正确的。
此外,探索性因子分析也有助于建立新的假设和发展新的理论,尤其在理论架构尚不清晰或需要进一步完善的情况下,这种方法能够发挥重要作用。
第一个提出探索性因子分析的是英国心理学家Charles Spearman。他在1904年发表了一篇著名论文《对智力测验得分进行统计分析》,提出了单一化的智能因子,这被视为探索性因子分析的起点。
探索性因子分析是通过研究多个变量之间的相关系数来找出内部依赖关系,并从错综复杂的变量中找出为数不多的关键变量,以再现原始变量与因子之间的相互关系。这种分析方法旨在简化复杂问题,避免人为因素的干扰,从而更加客观准确地评判事物及其中存在的规律。
随着研究的深入,探索性因子分析的应用领域逐渐扩大,从最初的心理学和教育学拓展至经济学、社会学、考古学、生物学、医学、地质学以及体育科学等各个领域,都取得了非常显著的成绩。
如需更多关于探索性因子分析的信息,建议查阅统计学相关书籍或咨询统计学专家。
什么是验证性因子分析
验证性因子分析(Confirmatory Factor Analysis,CFA)是对社会调查数据进行的一种统计分析,主要测试一个因子与相对应的测度项之间的关系是否符合研究者所设计的理论关系。这是一种使用样本数据对已经根据某些理论、先验知识作出的因子结构假设进行验证的过程。
在验证性因子分析中,研究者首先会开发调查问卷,对应于每一个研究者所感兴趣的理论变量,问卷中往往有多个问题。例如,研究者对顾客的忠诚度感兴趣,忠诚度可能用购买频率、主观评估、消费比例等多个问题来衡量。这个理论变量就是因子,这些个别问题是测度项。验证性因子分析就是要检验这些测度项是否真的可以反映该理论变量。
验证性因子分析是结构方程模型的一种常见应用,它的主要用途包括:针对成熟量表进行效度分析,如结构效度、聚合(收敛效度)和区分效度;用于组合信度的分析;进行共同方法偏差(CMV)检验;以及进行权重计算。
验证性因子分析(Confirmatory Factor Analysis,CFA)最早是由瑞典统计学家于1969年提出。这种方法主要是将因子分析和路径分析等统计技术结合起来,能够同时估计因子结构和因子关系,且允许研究者将观察变量依据理论或先前假设建构模型,再来评价因子结构和样本资料的匹配吻合程度。它是社会及行为科学学者验证量表是否符合所收集资料的重要方法。
探索性因子分析 VS 验证性因子分析
探索性因子分析(EFA)和验证性因子分析(CFA)都是重要的统计分析方法,用于研究变量之间的关系和数据结构。然而,它们在目的、应用前提以及操作上存在着显著的区别。
首先,探索性因子分析的主要目的是寻找影响观测变量的因子个数,以及各个因子和各个观测变量之间的相关程度,以揭示一套相对较大的变量的内在结构。它没有先验信息,研究者通过因子载荷凭知觉推断数据的因子结构。因此,探索性因子分析通常用于初步了解数据的结构,为后续的理论构建或假设生成提供基础。
而验证性因子分析的主要目的是验证研究者事先定义的因子模型是否拟合实际数据,即检验观测变量的因子个数和因子载荷是否与基于预先建立的理论的预期一致。验证性因子分析有明确的先验信息,它基于理论预期来检验因子结构,以确保数据与理论的契合度。
在操作层面上,探索性因子分析相对简单,只需要将所有量表题放入,设定想要输出的因子个数即可。如果没有明确的因子个数预期,系统也可以自动判断。而验证性因子分析则更为明确和具体,研究者需要将同属于一个因子下的题目放入到一个因子中,每一题项都需要有明确的归类。
最后,从应用的角度来看,探索性因子分析更适用于理论构建或初步研究阶段,而验证性因子分析则更多用于对已有理论的验证和修正。
综上所述,探索性因子分析和验证性因子分析在目的、应用前提、操作以及应用阶段等方面都存在着明显的差异。研究者应根据研究目的和实际情况选择合适的方法进行分析。
样本量
在 EFA 中,样本量非常重要,推荐的最小样本通常至少为 100 个样本(Kline,1994)。 一些资料来源建议每个题目至少有 5 个样本,因此如果您的量表包含 30 个题目,则至少需要 150 名参与者(Hatcher,1994)。
总结
作为一个总结, 我们用一个表格来对比EFA和CFA的区别。
特征 |
EFA |
CFA |
软件 |
SPSS |
AMOS |
难易 |
容易 |
难 |
因子结构 |
未知 |
已知 |
因子个数 |
未知 |
已知 |
理论验证 |
探索 |
验证 |
题目跨因子 |
可以 |
不可以 |
样本量 |
>5倍 |
>5倍 |