- 1. meta分析视频教程
- 2. 关键统计概念
- 3. Example 1: Continuous outcome
- 4. 示例1:连续性结局
- 4.1. 表2:连续性结局数据
- 4.2. 步骤2:进行Meta分析
- 4.3. 解释和报告结果
- 4.4. 步骤3:进行Meta回归
- 4.5. 解释和报告结果
- 4.6. Step 1: Import data into SPSS
- 4.7. 步骤1:使用以下命令将数据导入SPSS
- 4.8. Step 2: Conducting Meta-analysis
- 4.9. 步骤2:进行Meta分析
- 4.10. Interpreting and reporting the results
- 4.11. 解释和报告结果
- 4.12. Step 3: Conducting Meta-regression
- 4.13. 步骤3:进行Meta回归
- 4.14. Interpreting and reporting the results
- 4.15. 解释和报告结果
- 5. Example 2: Binary Outcom e
- 6. 示例2:二元结局
- 6.1. 表6:二元结局数据
- 6.2. 步骤1:使用以下命令将数据导入SPSS
- 6.3. 步骤2:进行Meta分析
- 6.4. 解释和报告结果
- 6.5. 步骤3:进行Meta回归
- 6.6. 解释和报告结果
- 6.7. Step 1: Import data into SPSS
- 6.8. 步骤1:使用以下命令将数据导入SPSS
- 6.9. Step 2: Conducting Meta-analysis
- 6.10. 步骤2:进行Meta分析
- 6.11. Interpreting and reporting the results
- 6.12. 解释和报告结果
- 6.13. Step 3: Conducting Meta-regression
- 6.14. 步骤3:进行Meta回归
- 6.15. Interpreting and reporting the results
- 6.16. 解释和报告结果
- 7. Example 3: Correlation
- 8. 示例3:相关性
- 8.1. 表11:相关性数据
- 8.2. 步骤1:使用以下命令将数据导入SPSS
- 8.3. 步骤2:进行Meta分析
- 8.4. 解释和报告结果
- 8.5. 步骤3:进行Meta回归
- 8.6. 解释和报告结果
- 8.7. Step 1: Import data into SPSS
- 8.8. 步骤1:使用以下命令将数据导入SPSS
- 8.9. Step 2: Conducting Meta-analysis
- 8.10. 步骤2:进行Meta分析
- 8.11. Interpreting and reporting the results
- 8.12. 解释和报告结果
- 8.13. Step 3: Conducting Meta-regression
- 8.14. 步骤3:进行Meta回归
- 8.15. Interpreting and reporting the results
- 8.16. 解释和报告结果
- 9. Ancillary cases
- 10. 附加情况
- 11. Future directions
- 12. 未来方向
- 12.1. 森林图中的异质性探索
- 12.2. 与其他Meta分析软件的协调
- 12.3. 敏感性分析
- 12.4. 出版偏差评估的替代方法
- 12.5. 贝叶斯Meta分析
- 12.6. Heterogeneity exploration in forest plots
- 12.7. 森林图中的异质性探索
- 12.8. Harmon is ation with other MA software
- 12.9. 与其他Meta分析软件的协调
- 12.10. Sensitivity analysis
- 12.11. 敏感性分析
- 12.12. Alternative methods for publication bias assessment
- 12.13. 出版偏差评估的替代方法
- 12.14. Bayesian meta-analysis
- 12.15. 贝叶斯Meta分析
这是一篇介绍如何使用SPSS做Meta分析的教程, 看过以后你可能会觉得 SPSS 做Meta分析真简单.
当然, 如果有不懂的地方请留言, 如果觉得对你有帮助, 请打赏. 教程中用到的数据我都有, 找我要就行, 下面有方法.
我们每天都会为童鞋们代做meta分析, 因为其中的工作量很大, 所以很多童鞋会放弃这种方法, 我建议你在放弃之前, 看下这篇文章:Meta分析-从找数据到出报告
meta分析视频教程
https://www.bilibili.com/video/BV1irU3YsExg/?vd_source=a196c58475bb84633185dbd4a3bdaf20
关键统计概念
不同类型的Meta分析
表1:不同类型Meta分析的概述
异质性度量
评估Meta分析中的异质性是一个关键的考量,因为异质性(研究间变异)的程度(或不存在)会影响应用的统计模型的选择[17]。以下技术用于评估异质性:
Tau平方
Tau平方 $\left(\mathsf{T}^{2}\right)$
度量Meta分析中包含的个别研究效应量之间的异质性程度。它通常是在随机效应Meta分析模型中计算的。随机效应模型假设真实效应量在研究间可以变化,而tau平方代表效应量之间估计的组间方差[18]。
H平方
$\mathsf{H}^{2}$
是随机效应Meta分析中估计的总体效应量方差与固定效应Meta分析中方差的比值。较高的 $\mathsf{H}^{2}$
值表示更大的异质性,而较低的值表示较小的异质性[19]。
I平方
I2统计量是异质性的度量,它量化了研究间效应量方差中归因于效应的真实差异而非抽样误差的比例。它是一个基于百分比的度量,范围从 $0\%$
(异质性最小)到 $100\%$
(异质性最大)[20]。然而,使用阈值来定义异质性程度的I2的常用解释是有缺陷的[21]。它只是说明了多少百分比的方差是由于抽样误差造成的。
预测区间
$95\%$
预测区间($95\%$
PI)是Meta分析中研究间异质性的更实用估计[22]。$95\%$
PI 给出了我们预期来自 $95\%$
类似研究的效应量将落入的范围。它不应该与 $95\%$
置信区间($95\%$
CI)混淆。虽然汇总效应量的 $95\%$
CI 关注的是我们估计的精确度,并且与点估计有关,但它并没有评论效应量的方差。$95\%$
PI 反而提供了关于这种方差的信息。尽管它没有被广泛报道[23-25],但它仍然应该被用作更优选的异质性标记[21]。
Meta分析中的模型
Meta分析中使用两种类型的模型:(i)固定效应和(ii)随机效应。
固定效应模型:在这个固定效应模型中,假设所有研究的真实效应量都是相同的。
随机效应模型:在这个模型中,假设干预措施或治疗的真实效应量在研究间存在差异,这是由于研究人群、测量方法或其他因素之间的真实差异造成的。当Meta分析中存在异质性证据时,随机效应模型更合适。
标准化均值差
当使用不同的方法(例如,用于评估抑郁症严重程度的不同量表或问卷)测量相同的结局时,我们无法将它们组合或平均,因为它们本身不是可比的。但是,测量的目的是相同的。因此,这里使用标准化均值差 (SMD)。
Cohen 的 d:它用于以标准差的形式量化两组或两种条件之间的差异。Cohen 的 d 可以解释为治疗组的平均结局与对照组的平均结局相差多少个标准差[26]。Cohen 的 d 通常解释如下:
${\mathsf{d}}=0.2$
表示效应量很小${\mathsf{d}}=0.5$
表示效应量中等${\mathsf{d}}=0.8$
表示效应量很大
Hedges 的 g:Hedges 的 g 是一个标准化的效应量度量,通常用于连续数据。它是 Cohen 的 d 的修改版本,Cohen 的 d 是另一个常用的标准化效应量度量。Hedges 的 g 和 Cohen 的 d 之间的主要区别在于 Hedges 的 g 针对每个研究的样本量进行了调整[26]。
Hedges 的 g 可以解释为治疗组的平均结局与对照组的平均结局相差多少个标准差。Hedges 的 g 为 0.2 表示效应量很小,Hedges 的 g 为 0.5 表示效应量中等,而 Hedges 的 g 为 0.8 表示效应量很大。
出版偏差
当研究的发表严重依赖结果的性质和方向时,就会发生出版偏差[27]。如果结果显著,研究更有可能发表,而结果不显著的研究不太可能发表。这种差异在较小的研究中尤为突出。较大的研究可能无论结果如何都会发表,但较小研究的发表可能会取决于其结果。因此,Meta分析可能无法包含所有相关研究。通常,漏斗图用于评估Meta分析中的出版偏差。
Example 1: Continuous outcome
示例1:连续性结局
我们将在此讨论如何对来自两组的连续数据进行Meta分析。在这个例子中,我们查看了比较糖尿病患者实验组的空腹血糖 (FBS) 与对照组的 FBS 的随机对照试验。我们怀疑 FBS 的影响可能会根据两个变量而有所不同。它可能因是否存在其他合并症以及参与者的年龄而有所不同。
因此,我们需要提取以下数据:研究标签(Study)、实验组 FBS 的平均值(mean.e)、实验组 FBS 的标准差(sd.e)、实验组的参与者数量(n.e)、对照组 FBS 的平均值(mean.c)、对照组 FBS 的标准差(sd.c)、对照组的参与者数量(n.c)、编码的亚组数据(存在或不存在患有其他合并症的糖尿病患者)(subgroup)以及研究参与者的平均年龄(age)[表2]。
表2:连续性结局数据
步骤1:使用以下命令将数据导入SPSS
在菜单栏中,点击文件 > 导入数据 > Excel [图1]。现在,您可以选择包含提取数据的电子表格。或者,您可以通过重新制作这个表格[表2]来使用它。
图1:将Excel数据导入SPSS
步骤2:进行Meta分析
- 一旦电子表格打开,检查菜单栏,然后点击分析 > Meta分析 > 连续性结局 > 原始数据 [图2]
- 将变量“mean.e”移动到治疗组下的“平均值”,“sd.e”移动到“标准差”,“n.e”移动到“研究”。
- 将变量“mean.c”移动到对照组下的“平均值”,“sd.c”移动到“标准差”,“n.c”移动到“研究”。
- 将“Study”移动到“研究标签”。
- 在“效应量”下选择“非标准化均值差”。
- 在“模型”下选择“随机效应”。
- 点击“偏差” > 选择“基于回归的Egger检验”。
- 点击“修剪填充” > 选择“估计缺失研究数量”。
- 点击“打印” > 在“效应量”下选择“随机效应模型下的预测区间”。
- 点击“保存” > 选择“个体效应量”和“标准误”。
- 点击“绘图” > 点击“森林图”选项卡 > 选择“森林图” > 在“显示列”下,选择“效应量”、“置信区间限”和“权重” > 将变量“mean.e”、“sd.e”、“n.e”、“mean.c”、“sd.c”和“n.c”移动到“附加列(s)”下 > 在“参考线”下,选择“总体效应量”和“零效应量” > 在“注释”下,选择“同质性”和“异质性”[图4]
- 在“绘图”内 > 点击“漏斗图”选项卡 > 选择“漏斗图” > 在“Y轴值”下,选择“标准误的倒数” > 选择“包含使用修剪填充的推断研究” > 将“Study”移动到“标签”[图5]。
- 一旦所有设置都正确选择,请点击“确定”。
图2:选择Meta分析
图3:输入变量并选择选项
图4:自定义森林图
解释和报告结果
点击“确定”后,将在新的SPSS窗口中显示大量输出。为了简化大量的输出,我们将查看一些关键的图表和表格。我们将首先解释所需的图表,并在需要时参考相关的表格。主要的输出是一个森林图[图6]。森林图中的每一行对应于一项研究,并显示了该研究的效应量(位于右侧)。蓝色方块的中心表示汇总估计值,而黑线的末端表示置信区间限。蓝色方块的大小表示每项研究在Meta分析中的权重(换句话说,它表示每项研究在计算总体汇总效应或平均效应时的重要性或代表性)。黑色/灰色垂直线表示无效应线(均值差为零,风险比或优势比为一)。红色虚线表示汇总效应。
最后一行对应于汇总(或平均)估计值。在这里,效应量由一个深红色的菱形表示(而不是单个研究的蓝色方块)。菱形的中心表示平均汇总效应量,而黑线的末端表示汇总效应量的上限和下限 $95\%$
置信区间限。
在这里,森林图显示,实验组和对照组之间的空腹血糖(mg/dl)的均值差为 -9.40 [ $95\%$
CI:-13.73 至 -5.07] [图6]。研究间异质性在森林图的底部显示。它报告了一个tau2为57.23,H2为69.23,I2为0.99(或 $99\%$
),以及一个具有统计学意义的Q统计量 $[\mathsf{Q}\ =\ 620.48,$
, $\mathsf{p}\ <\ 0.01]$
。然而,这些异质性指标并不容易解释,也不能完全描述情况,正如我们之前讨论的那样。因此,我们使用 $95\%$
预测区间($95\%$
PI)。表3通过提供 $95\%$
PI(-26.96 至 8.16)来评估异质性。在 $95\%$
的情况下,我们预计效应量将落入这个范围内。我们可以使用Meta回归来探索或尝试回答这种异质性,这将在下一节中讨论。
表3:连续性结局数据的效应量估计值
A. 基于t分布。
接下来,我们检查漏斗图以评估出版偏差[图7]。这个漏斗图可能最初看起来像一个典型的出版偏差示例。较小的研究(即,标准误较大或标准误倒数较小的研究)被不对称地排列,主要集中在中心黑色垂直线(汇总效应量)的一侧。漏斗图的不对称性通过Egger回归得到进一步证实[表4]。Egger回归中 $p$
值小于 $0.1$
被认为与漏斗图的不对称性一致。但是,需要注意一个更细微的点。漏斗图右下象限中的所有五项研究都属于第二亚组,而其他七项研究都属于第一亚组。因此,漏斗图的不对称性可以用研究间异质性来解释,导致研究估计值集中。我们不能将漏斗图的不对称性归因于出版偏差。
表4:连续性结局数据的Egger回归
a 基于回归的Egger检验
B. 效应量的标准误。
步骤3:进行Meta回归
- 在菜单栏中,点击分析 > Meta分析 > Meta回归。
- 将“效应量的预测值 [ES]”移动到“效应量”。
- 将“效应量预测值的估计标准误 [seES]”移动到“标准误”。
- 将“subgroup”移动到“因素(s)”。
- 将“age”移动到“协变量(s)”。
- 在“模型”下选择“随机效应”。
- 点击“打印” > 选择“显示指数化统计量”。
- 点击“绘图” > 选择“age” > 将“Study”移动到“标签”。
- 一旦所有设置都正确选择,请点击“确定”。
解释和报告结果
Meta回归可以帮助我们探索异质性。我们可以评估其他变量是否也会影响效应量。我们最初怀疑额外的合并症(一个分类变量)和年龄(一个连续变量)可能会影响空腹血糖。因此,我们使用Meta回归对它们进行了检验。我们看到,第一亚组(与第二亚组相比)显著影响估计值 $(\cdot9.24.~\cdot13.87$
$\mathsf{p}\,<\,0.01)$
$\mathsf{p}<0.01]$
A. 这个参数被设置为零,因为它冗余。
连续变量(如年龄)的调节效应也可以使用气泡图进行图形化展示[图9]。Y轴显示效应量(因变量),X轴显示年龄(自变量)。每个圆圈代表一项研究的效应量和参与者的平均年龄。圆圈的大小代表一项研究的权重。因此,空腹血糖的变化随着年龄的增长而更大。由于大多数值和汇总估计值都是负数,因此我们可以推断,随着年龄的增长,两组之间的 FBS 差异会变小。
Step 1: Import data into SPSS
步骤1:使用以下命令将数据导入SPSS
在菜单栏中,点击文件 > 导入数据 > Excel [图1]。现在,您可以选择包含提取数据的电子表格。或者,您可以通过重新制作这个表格[表2]来使用它。
图1:将Excel数据导入SPSS
Step 2: Conducting Meta-analysis
步骤2:进行Meta分析
- 一旦电子表格打开,检查菜单栏,然后点击分析 > Meta分析 > 连续性结局 > 原始数据 [图2]
- 将变量“mean.e”移动到治疗组下的“平均值”,“sd.e”移动到“标准差”,“n.e”移动到“研究”。
- 将变量“mean.c”移动到对照组下的“平均值”,“sd.c”移动到“标准差”,“n.c”移动到“研究”。
- 将“Study”移动到“研究标签”。
- 在“效应量”下选择“非标准化均值差”。
- 在“模型”下选择“随机效应”。
- 点击“偏差” > 选择“基于回归的Egger检验”。
- 点击“修剪填充” > 选择“估计缺失研究数量”。
- 点击“打印” > 在“效应量”下选择“随机效应模型下的预测区间”。
- 点击“保存” > 选择“个体效应量”和“标准误”。
- 点击“绘图” > 点击“森林图”选项卡 > 选择“森林图” > 在“显示列”下,选择“效应量”、“置信区间限”和“权重” > 将变量“mean.e”、“sd.e”、“n.e”、“mean.c”、“sd.c”和“n.c”移动到“附加列(s)”下 > 在“参考线”下,选择“总体效应量”和“零效应量” > 在“注释”下,选择“同质性”和“异质性”[图4]
- 在“绘图”内 > 点击“漏斗图”选项卡 > 选择“漏斗图” > 在“Y轴值”下,选择“标准误的倒数” > 选择“包含使用修剪填充的推断研究” > 将“Study”移动到“标签”[图5]。
- 一旦所有设置都正确选择,请点击“确定”。
图2:选择Meta分析
图3:输入变量并选择选项
图4:自定义森林图
Interpreting and reporting the results
解释和报告结果
点击“确定”后,将在新的SPSS窗口中显示大量输出。为了简化大量的输出,我们将查看一些关键的图表和表格。我们将首先解释所需的图表,并在需要时参考相关的表格。主要的输出是一个森林图[图6]。森林图中的每一行对应于一项研究,并显示了该研究的效应量(位于右侧)。蓝色方块的中心表示汇总估计值,而黑线的末端表示置信区间限。蓝色方块的大小表示每项研究在Meta分析中的权重(换句话说,它表示每项研究在计算总体汇总效应或平均效应时的重要性或代表性)。黑色/灰色垂直线表示无效应线(均值差为零,风险比或优势比为一)。红色虚线表示汇总效应。
最后一行对应于汇总(或平均)估计值。在这里,效应量由一个深红色的菱形表示(而不是单个研究的蓝色方块)。菱形的中心表示平均汇总效应量,而黑线的末端表示汇总效应量的上限和下限 $95\%$
置信区间限。
在这里,森林图显示,实验组和对照组之间的空腹血糖(mg/dl)的均值差为 -9.40 [ $95\%$
CI:-13.73 至 -5.07] [图6]。研究间异质性在森林图的底部显示。它报告了一个tau2为57.23,H2为69.23,I2为0.99(或 $99\%$
),以及一个具有统计学意义的Q统计量 $[\mathsf{Q}\ =\ 620.48,$
, $\mathsf{p}\ <\ 0.01]$
。然而,这些异质性指标并不容易解释,也不能完全描述情况,正如我们之前讨论的那样。因此,我们使用 $95\%$
预测区间($95\%$
PI)。表3通过提供 $95\%$
PI(-26.96 至 8.16)来评估异质性。在 $95\%$
的情况下,我们预计效应量将落入这个范围内。我们可以使用Meta回归来探索或尝试回答这种异质性,这将在下一节中讨论。
表3:连续性结局数据的效应量估计值
A. 基于t分布。
接下来,我们检查漏斗图以评估出版偏差[图7]。这个漏斗图可能最初看起来像一个典型的出版偏差示例。较小的研究(即,标准误较大或标准误倒数较小的研究)被不对称地排列,主要集中在中心黑色垂直线(汇总效应量)的一侧。漏斗图的不对称性通过Egger回归得到进一步证实[表4]。Egger回归中 $p$
值小于 $0.1$
被认为与漏斗图的不对称性一致。但是,需要注意一个更细微的点。漏斗图右下象限中的所有五项研究都属于第二亚组,而其他七项研究都属于第一亚组。因此,漏斗图的不对称性可以用研究间异质性来解释,导致研究估计值集中。我们不能将漏斗图的不对称性归因于出版偏差。
表4:连续性结局数据的Egger回归
a 基于回归的Egger检验
B. 效应量的标准误。
Step 3: Conducting Meta-regression
步骤3:进行Meta回归
- 在菜单栏中,点击分析 > Meta分析 > Meta回归。
- 将“效应量的预测值 [ES]”移动到“效应量”。
- 将“效应量预测值的估计标准误 [seES]”移动到“标准误”。
- 将“subgroup”移动到“因素(s)”。
- 将“age”移动到“协变量(s)”。
- 在“模型”下选择“随机效应”。
- 点击“打印” > 选择“显示指数化统计量”。
- 点击“绘图” > 选择“age” > 将“Study”移动到“标签”。
- 一旦所有设置都正确选择,请点击“确定”。
Interpreting and reporting the results
解释和报告结果
我们看到,第一亚组(与第二亚组相比)显著影响估计值 $(\cdot9.24.~\cdot13.87$
$\mathsf{p}\,<\,0.01)$
$\mathsf{p}<0.01]$
。类似地,年龄也显著调节 $\mathsf{p}\,<\,0.01_{,}^{\,}$
变换后的效应量(对数尺度),不应解释为原始RR。气泡图显示,相对风险随着年龄的增加而增加[图12]。
图12:气泡图
A. 这个参数被设置为零,因为它冗余。
Example 2: Binary Outcom e
示例2:二元结局
在这个例子中,我们将展示如何使用样本数据对二元结局进行Meta分析——风险比 (RR)。延续上一个例子,我们查看了比较实验组中出现不良事件的参与者数量与对照组中出现不良事件的参与者数量的随机对照试验。这是一个二元结局,因为患者要么出现不良事件(即事件发生),要么没有出现不良事件(即事件没有发生)。我们怀疑这也会像之前讨论的那样,根据两个变量而有所不同——是否存在其他合并症以及参与者的平均年龄。
我们提取与之前类似的数据,除了结局测量方法不同。我们不再提取每组的均值、标准差和参与者数量(如连续性结局),而是提取了每组中出现感兴趣事件(这里是不良事件)的参与者数量和未出现事件的参与者数量。因此,我们提取以下数据:研究标签(Study)、实验组中出现事件的参与者数量(event.e)、实验组中未出现事件的参与者数量(no_event.e)、对照组中出现事件的参与者数量(event.c)、对照组中未出现事件的参与者数量(no_event.c)、编码的亚组数据(存在或不存在患有其他合并症的糖尿病患者)(subgroup)以及研究参与者的平均年龄(age)[表6]。
表6:二元结局数据
步骤1:使用以下命令将数据导入SPSS
您可以按照之前的步骤导入数据,要么复制此表格[表6]。
步骤2:进行Meta分析
- 一旦电子表格打开,检查菜单栏,然后点击分析 > Meta分析 > 二元结局 > 原始数据。
- 将变量“event.e”移动到治疗组下的“成功”,“no_event.e”移动到“失败”。
- 将变量“event.c”移动到对照组下的“成功”,“no_event.c”移动到“失败”。
- 将“Study”移动到“研究标签”。
- 在“效应量”下选择“对数风险比”。
- 在“模型”下选择“随机效应”。
- 点击“偏差” > 选择“Harbord检验”。
- 点击“修剪填充” > 选择“估计缺失研究数量”。
- 点击“打印” > 在“效应量”下选择“随机效应模型下的预测区间”和“显示指数化统计量”。
- 点击“保存” > 选择“个体效应量”和“标准误”。
- 点击“绘图” > 点击“森林图”选项卡 > 选择“森林图” > 在“显示列”下,选择“效应量”、“置信区间限”、“权重”和“显示指数化形式” > 将变量“event.e”、“no_event.e”、“event.c”和“no_event.c”移动到“附加列(s)”下 > 在“参考线”下,选择“总体效应量”和“零效应量” > 在“注释”下,选择“同质性”和“异质性”。
- 在“绘图”内 > 点击“漏斗图”选项卡 > 选择“漏斗图” > 在“Y轴值”下,选择“标准误的倒数” > 选择“包含使用修剪填充的推断研究” > 将“Study”移动到“标签”。
- 一旦所有设置都正确选择,请点击“确定”。确保您已选择指数化形式/统计量(对于连续数据不需要)。
解释和报告结果
森林图显示,实验组中参与者出现不良事件的相对风险(或风险比)与对照组中参与者出现不良事件的相对风险相比为 1.31 [$95\%$
CI: 0.90 至 1.90] [图10]。虽然估计值显示风险较高,但由于置信区间限跨越了无效应阈值(这里是 1),因此它没有统计学意义。
图10:二元结局的森林图
为了评估异质性,我们检查表7-8 中的 $95\%$
PI。这两个表格提醒我们一个重要的统计考虑因素。在均值差 (MD) 中,汇总 MD(或平均估计值)的计算涉及从个别研究中提供的 MD。但是,对于二元结局(如风险比 (RR) 和优势比 (OR)),效应量首先要进行对数转换。然后,根据权重进行平均。之后,平均或汇总估计值被反向转换(对数的反函数或指数化),并表示为风险比。因此,即使森林图仅显示风险比,而没有显示对数转换的值,在幕后也会进行转换和反向转换。为了方便临床解释,我们将考虑指数化表 8 中的 $95\%$
PI,而不是表 7,因为表 7 还没有进行反向转换。
A. 基于t分布。
漏斗图看起来是对称的,研究在汇总估计值(中心黑色垂直线)的两侧分布较为均匀[图11]。Harbord 回归进一步证实了这一点[表 9]。因此,我们不怀疑这种情况下的出版偏差。
图11:二元结局的漏斗图
表 9:二元结局数据的 Harbord 回归
a 基于回归的 Harbord 检验
步骤3:进行Meta回归
- 在菜单栏中,点击分析 > Meta分析 > Meta回归。
- 将“效应量的预测值 [ES]”移动到“效应量”。
- 将“效应量预测值的估计标准误 [seES]”移动到“标准误”。
- 将“subgroup”移动到“因素(s)”。
- 将“age”移动到“协变量(s)”。
- 在“模型”下选择“随机效应”。
- 点击“打印” > 选择“显示指数化统计量”。
- 点击“绘图” > 选择“age” > 将“Study”移动到“标签”。
- 一旦所有设置都正确选择,请点击“确定”。
解释和报告结果
我们看到,第一亚组(与第二亚组相比)显著影响估计值 $(-0.99,\ -0.46$
to -1.53, $\mathsf{p}\,<\,0.01\big)$
) [表10]。类似地,年龄也显著调节 $\mathsf{p}\,<\,0.01_{,}^{\,}$
变换后的效应量(对数尺度),不应解释为原始RR。气泡图显示,相对风险随着年龄的增加而增加[图12]。
图12:气泡图
A. 这个参数被设置为零,因为它冗余。
Step 1: Import data into SPSS
步骤1:使用以下命令将数据导入SPSS
您可以按照之前的步骤导入数据,要么复制此表格[表6]。
Step 2: Conducting Meta-analysis
步骤2:进行Meta分析
- 一旦电子表格打开,检查菜单栏,然后点击分析 > Meta分析 > 二元结局 > 原始数据。
- 将变量“event.e”移动到治疗组下的“成功”,“no_event.e”移动到“失败”。
- 将变量“event.c”移动到对照组下的“成功”,“no_event.c”移动到“失败”。
- 将“Study”移动到“研究标签”。
- 在“效应量”下选择“对数风险比”。
- 在“模型”下选择“随机效应”。
- 点击“偏差” > 选择“Harbord检验”。
- 点击“修剪填充” > 选择“估计缺失研究数量”。
- 点击“打印” > 在“效应量”下选择“随机效应模型下的预测区间”和“显示指数化统计量”。
- 点击“保存” > 选择“个体效应量”和“标准误”。
- 点击“绘图” > 点击“森林图”选项卡 > 选择“森林图” > 在“显示列”下,选择“效应量”、“置信区间限”、“权重”和“显示指数化形式” > 将变量“event.e”、“no_event.e”、“event.c”和“no_event.c”移动到“附加列(s)”下 > 在“参考线”下,选择“总体效应量”和“零效应量” > 在“注释”下,选择“同质性”和“异质性”。
- 在“绘图”内 > 点击“漏斗图”选项卡 > 选择“漏斗图” > 在“Y轴值”下,选择“标准误的倒数” > 选择“包含使用修剪填充的推断研究” > 将“Study”移动到“标签”。
- 一旦所有设置都正确选择,请点击“确定”。确保您已选择指数化形式/统计量(对于连续数据不需要)。
Interpreting and reporting the results
解释和报告结果
森林图显示,实验组中参与者出现不良事件的相对风险(或风险比)与对照组中参与者出现不良事件的相对风险相比为 1.31 [$95\%$
CI: 0.90 至 1.90] [图10]。虽然估计值显示风险较高,但由于置信区间限跨越了无效应阈值(这里是 1),因此它没有统计学意义。
图10:二元结局的森林图
为了评估异质性,我们检查表7-8 中的 $95\%$
PI。这两个表格提醒我们一个重要的统计考虑因素。在均值差 (MD) 中,汇总 MD(或平均估计值)的计算涉及从个别研究中提供的 MD。但是,对于二元结局(如风险比 (RR) 和优势比 (OR)),效应量首先要进行对数转换。然后,根据权重进行平均。之后,平均或汇总估计值被反向转换(对数的反函数或指数化),并表示为风险比。因此,即使森林图仅显示风险比,而没有显示对数转换的值,在幕后也会进行转换和反向转换。为了方便临床解释,我们将考虑指数化表 8 中的 $95\%$
PI,而不是表 7,因为表 7 还没有进行反向转换。
A. 基于t分布。
漏斗图看起来是对称的,研究在汇总估计值(中心黑色垂直线)的两侧分布较为均匀[图11]。Harbord 回归进一步证实了这一点[表 9]。因此,我们不怀疑这种情况下的出版偏差。
图11:二元结局的漏斗图
表 9:二元结局数据的 Harbord 回归
a 基于回归的 Harbord 检验
Step 3: Conducting Meta-regression
步骤3:进行Meta回归
- 在菜单栏中,点击分析 > Meta分析 > Meta回归。
- 将“效应量的预测值 [ES]”移动到“效应量”。
- 将“效应量预测值的估计标准误 [seES]”移动到“标准误”。
- 将“subgroup”移动到“因素(s)”。
- 将“age”移动到“协变量(s)”。
- 在“模型”下选择“随机效应”。
- 点击“打印” > 选择“显示指数化统计量”。
- 点击“绘图” > 选择“age” > 将“Study”移动到“标签”。
- 一旦所有设置都正确选择,请点击“确定”。
Interpreting and reporting the results
解释和报告结果
我们看到,第一亚组(与第二亚组相比)显著影响估计值 $(-0.99,\ -0.46$
to -1.53, $\mathsf{p}\,<\,0.01\big)$
) [表10]。类似地,年龄也显著调节 $\mathsf{p}\,<\,0.01_{,}^{\,}$
变换后的效应量(对数尺度),不应解释为原始RR。气泡图显示,相对风险随着年龄的增加而增加[图12]。
图12:气泡图
A. 这个参数被设置为零,因为它冗余。
Example 3: Correlation
示例3:相关性
在这个例子中,我们将展示如何对相关性进行Meta分析。延续之前的例子,我们查看了报告空腹血糖与糖化血红蛋白 (HbA1c) 之间相关性的研究。同样,我们怀疑这也会像之前讨论的那样,根据两个变量而有所不同——是否存在其他合并症以及参与者的平均年龄。
相关性结局的资料提取略有不同。我们只有一组(而不是两组),只需要每个研究的相关系数和参与者数量。虽然这些数据足以进行统计分析,但SPSS并不原生支持相关性的Meta分析。因此,我们必须找到一种变通方法来实现这一点(与R中的meta::metacor()函数不同)。
相关系数 (r) 和参与者数量 (n) 用于推导出一个变换后的效应量 (z),以及该变换后的效应量的标准误 (SE_z)。这个变换后的效应量实际上是Fisher的z转换。据说这种转换可以稳定相关系数的方差,并使它们近似呈正态分布,这对于假设正态性的统计分析至关重要[28]。为了方便起见,我们已经在github上附带的数据文件中预先填充了z和SE_z的公式…… 因此,如果输入r和 $\mathsf{n}_{i}$
,那么z和SE_z会自动计算并显示。如果无法访问该文件,可以使用这些公式分别计算z和SE_z。
z:
$=$
FISHER(B2)SE_z:
$=$
1/SQRT(C2-3)这里,B2单元格代表r,C2单元格代表n。可以根据需要进行编辑。
我们将这个修改后的文件加载到SPSS中。因此,上传的表格包含以下数据:研究标签(Study)、相关系数 (r)、参与者数量 (n)、编码的亚组数据(存在或不存在患有其他合并症的糖尿病患者)(subgroup)、研究参与者的平均年龄(age)、变换后的效应量 (z) 以及该变换后的效应量的标准误 (SE_z) [表11]。
表11:相关性数据
步骤1:使用以下命令将数据导入SPSS
您可以按照之前的步骤导入数据,要么复制此表格[表11]。
步骤2:进行Meta分析
- 一旦电子表格打开,检查菜单栏,然后点击分析 > Meta分析 > 连续性结局 > 预先计算的效应量。
- 将变量
$\backprime$
移动到“效应量”,“SE_z”移动到“标准误”,“Study”移动到“研究标签”。 - 在“模型”下选择“随机效应”。
- 点击“偏差” > 选择“基于回归的Egger检验”。
- 点击“修剪填充” > 选择“估计缺失研究数量”。
- 点击“打印” > 在“效应量”下选择“随机效应模型下的预测区间”。
- 点击“绘图” > 点击“森林图”选项卡 > 选择“森林图” > 在“显示列”下,选择“效应量”、“置信区间限”和“权重” > 将变量
$\mathbf{\dot{r}}_{}^{\prime},$
和$\mathsf{\deltar}$
移动到“附加列(s)”下 > 在“参考线”下,选择“总体效应量”和“零效应量” > 在“注释”下,选择“同质性”和“异质性”。 - 在“绘图”内 > 点击“漏斗图”选项卡 > 选择“漏斗图” > 在“Y轴值”下,选择“标准误的倒数” > 选择“包含使用修剪填充的推断研究” > 将“Study”移动到“标签”。
- 一旦所有设置都正确选择,请点击“确定”。
解释和报告结果
这并不像看起来那么简单,并且带来了新的挑战。结果是基于Fisher的z转换。我们需要将它们反向转换回相关系数,以便更好地解释它们。森林图显示,给定参与者中 FBS 和 HbA1c 之间相关性的变换后的效应量为 1.46 ($95\%$
CI: 1.33 至 1.58,$95\%$
PI: 0.94 至 1.97) [图13,表12]。您可能会注意到,该值超出了 -1 到 +1 的范围,这种情况不会发生在原始相关性中。因此,这很难解释和应用于临床实践。
我们在github上附带的数据文件的“结果”选项卡中添加了公式…… 或者,您可以在MS Excel中使用此公式来计算反向变换后的相关系数。
$=$
FISHERINV(B3)
这里,B3 可以是变换后的系数、置信区间限或预测区间限,上述公式的结果给出该数字的反向变换后的等效值。在本例中,它表明给定参与者中 FBS 和 HbA1c 之间的相关性为 0.90 $95\%$
CI: 0.87 至 0.92,$95\%$
PI: 0.74 至 0.96)。这表明强烈的正相关。它很容易解释,从而可以应用于现实生活中的情况,无论是在诊所还是在公共卫生场景中。
图13:相关性的森林图
A. 基于t分布。
漏斗图看起来是对称的,研究在汇总估计值(中心黑色垂直线)的两侧分布较为均匀[图14]。Egger回归进一步证实了这一点[表13]。因此,我们不怀疑这种情况下的出版偏差。
表13:相关性的Egger回归
a 基于回归的Egger检验
B. 效应量的标准误。
步骤3:进行Meta回归
- 在菜单栏中,点击分析 > Meta分析 > Meta回归。
- 将“效应量的预测值 [ES]”移动到“效应量”。
- 将“效应量预测值的估计标准误 [seES]”移动到“标准误”。
- 将“subgroup”移动到“因素(s)”。
- 将“age”移动到“协变量(s)”。
- 在“模型”下选择“随机效应”。
- 点击“打印” > 选择“显示指数化统计量”。
- 点击“绘图” > 选择“age” > 将“Study”移动到“标签”。
- 一旦所有设置都正确选择,请点击“确定”。
解释和报告结果
我们注意到,亚组和年龄都没有显著调节估计值[表14]。气泡图也显示,效应不会随着年龄的变化而变化[图15]。
A. 这个参数被设置为零,因为它冗余。
Step 1: Import data into SPSS
步骤1:使用以下命令将数据导入SPSS
您可以按照之前的步骤导入数据,要么复制此表格[表11]。
Step 2: Conducting Meta-analysis
步骤2:进行Meta分析
- 一旦电子表格打开,检查菜单栏,然后点击分析 > Meta分析 > 连续性结局 > 预先计算的效应量。
- 将变量
$\backprime$
移动到“效应量”,“SE_z”移动到“标准误”,“Study”移动到“研究标签”。 - 在“模型”下选择“随机效应”。
- 点击“偏差” > 选择“基于回归的Egger检验”。
- 点击“修剪填充” > 选择“估计缺失研究数量”。
- 点击“打印” > 在“效应量”下选择“随机效应模型下的预测区间”。
- 点击“绘图” > 点击“森林图”选项卡 > 选择“森林图” > 在“显示列”下,选择“效应量”、“置信区间限”和“权重” > 将变量
$\mathbf{\dot{r}}_{}^{\prime},$
和$\mathsf{\deltar}$
移动到“附加列(s)”下 > 在“参考线”下,选择“总体效应量”和“零效应量” > 在“注释”下,选择“同质性”和“异质性”。 - 在“绘图”内 > 点击“漏斗图”选项卡 > 选择“漏斗图” > 在“Y轴值”下,选择“标准误的倒数” > 选择“包含使用修剪填充的推断研究” > 将“Study”移动到“标签”。
- 一旦所有设置都正确选择,请点击“确定”。
Interpreting and reporting the results
解释和报告结果
这并不像看起来那么简单,并且带来了新的挑战。结果是基于Fisher的z转换。我们需要将它们反向转换回相关系数,以便更好地解释它们。森林图显示,给定参与者中 FBS 和 HbA1c 之间相关性的变换后的效应量为 1.46 ($95\%$
CI: 1.33 至 1.58,$95\%$
PI: 0.94 至 1.97) [图13,表12]。您可能会注意到,该值超出了 -1 到 +1 的范围,这种情况不会发生在原始相关性中。因此,这很难解释和应用于临床实践。
我们在github上附带的数据文件的“结果”选项卡中添加了公式…… 或者,您可以在MS Excel中使用此公式来计算反向变换后的相关系数。
$=$
FISHERINV(B3)
这里,B3 可以是变换后的系数、置信区间限或预测区间限,上述公式的结果给出该数字的反向变换后的等效值。在本例中,它表明给定参与者中 FBS 和 HbA1c 之间的相关性为 0.90 $95\%$
CI: 0.87 至 0.92,$95\%$
PI: 0.74 至 0.96)。这表明强烈的正相关。它很容易解释,从而可以应用于现实生活中的情况,无论是在诊所还是在公共卫生场景中。
图13:相关性的森林图
A. 基于t分布。
漏斗图看起来是对称的,研究在汇总估计值(中心黑色垂直线)的两侧分布较为均匀[图14]。Egger回归进一步证实了这一点[表13]。因此,我们不怀疑这种情况下的出版偏差。
表13:相关性的Egger回归
a 基于回归的Egger检验
B. 效应量的标准误。
Step 3: Conducting Meta-regression
步骤3:进行Meta回归
- 在菜单栏中,点击分析 > Meta分析 > Meta回归。
- 将“效应量的预测值 [ES]”移动到“效应量”。
- 将“效应量预测值的估计标准误 [seES]”移动到“标准误”。
- 将“subgroup”移动到“因素(s)”。
- 将“age”移动到“协变量(s)”。
- 在“模型”下选择“随机效应”。
- 点击“打印” > 选择“显示指数化统计量”。
- 点击“绘图” > 选择“age” > 将“Study”移动到“标签”。
- 一旦所有设置都正确选择,请点击“确定”。
Interpreting and reporting the results
解释和报告结果
我们注意到,亚组和年龄都没有显著调节估计值[表14]。气泡图也显示,效应不会随着年龄的变化而变化[图15]。
A. 这个参数被设置为零,因为它冗余。
Ancillary cases
附加情况
标准化均值差
通常,连续性结局在所有研究中都使用相同的量表进行测量。这对于实验室结局很常见。但是,问卷或量表经常缺乏统一性。抑郁症严重程度、疼痛和生活质量通常在不同的研究中使用不同的量表或工具进行测量。在这种情况下,当测量相同的结局时,标准化均值差通常用于连续性结局。在SPSS中,可以通过在分析面板中选择Cohen的d、Hedges的g或Glass的Delta来实现这一点[图3]。
优势比
风险比 (RR) 和优势比 (OR) 的选择是一个长期争论的话题[29]。虽然两者都用于前瞻性研究,但只有OR用于横断面研究和回顾性研究。我们在前面的例子中实践了RR。对于OR,我们必须在Meta分析面板中选择对数优势比。
亚组分析
作者有时希望在森林图本身中展示亚组分析。在这种情况下,读者需要点击Meta分析面板中的分析。在这里,他们可以将亚组变量(左侧变量列表中)移动到亚组分析字段(右侧)。然后,一旦生成输出,所有图表——森林图、漏斗图、气泡图等——都会考虑总体分析和亚组分析来生成。
虽然不需要写出结果,但为了更好地理解这些概念,您可以对表7中的值进行逆自然对数(或指数化)运算,并检查结果是否与表8匹配。
Standardised mean difference
标准化均值差
通常,连续性结局在所有研究中都使用相同的量表进行测量。这对于实验室结局很常见。但是,问卷或量表经常缺乏统一性。抑郁症严重程度、疼痛和生活质量通常在不同的研究中使用不同的量表或工具进行测量。在这种情况下,当测量相同的结局时,标准化均值差通常用于连续性结局。在SPSS中,可以通过在分析面板中选择Cohen的d、Hedges的g或Glass的Delta来实现这一点[图3]。
图3:输入变量并选择选项
Odds ratio
优势比
风险比 (RR) 和优势比 (OR) 的选择是一个长期争论的话题[29]。虽然两者都用于前瞻性研究,但只有OR用于横断面研究和回顾性研究。我们在前面的例子中实践了RR。对于OR,我们必须在Meta分析面板中选择对数优势比。
Subgroup analyses
亚组分析
作者有时希望在森林图本身中展示亚组分析。在这种情况下,读者需要点击Meta分析面板中的分析。在这里,他们可以将亚组变量(左侧变量列表中)移动到亚组分析字段(右侧)。然后,一旦生成输出,所有图表——森林图、漏斗图、气泡图等——都会考虑总体分析和亚组分析来生成。
虽然不需要写出结果,但为了更好地理解这些概念,您可以对表7中的值进行逆自然对数(或指数化)运算,并检查结果是否与表8匹配。
Future directions
未来方向
森林图中的异质性探索
森林图通常汇总单个结局的证据。来自所有个别研究的估计值、最终的汇总估计值、异质性估计值和亚组效应都可以在森林图中展示。更重要的是,一个敏锐的眼睛甚至可以在森林图本身中筛选出版偏差。虽然SPSS提供了许多必需的功能,但有一些建议可以提高森林图的全面性。预测区间是评估异质性的必不可少工具[10]。这可以整合到森林图本身中。
此外,亚组分析可以像之前讨论的那样在森林图中描绘出来。但是,I2、tau2和其他异质性估计值在每个亚组中不可见。添加这些信息可以帮助评估每个亚组内的异质性。第三,每个组或整个分析中的总参与者数量很重要。这是对证据质量或我们对汇总效应的信心进行评级的必要条件[30]。
我们在github上附带的数据文件中添加了使用SPSS[图16A]和使用R中的meta包[31][图16B]构建的亚组分析森林图。我们在图16B中突出显示了希望在未来版本的SPSS的Meta分析模块中整合的功能。
图16A:使用SPSS的亚组分析森林图
图16B:使用R中的meta包的亚组分析森林图
与其他Meta分析软件的协调
二元结局数据提取最常用的方法是提取事件数量和每组的总数。在我们的例子中,这意味着提取出现不良事件的参与者数量和每组的总参与者数量。这就是其他软件(如R、RevMan和STATA)通常进行Meta分析的方式。但是,这里略有不同,因为它需要每组出现不良事件的参与者数量和未出现不良事件的参与者数量。因此,它需要未出现不良事件的参与者数量,而不是总参与者数量。虽然在访问界面时可以清楚地理解这一点,但这并非通常的做法。因此,习惯使用其他软件并现在使用SPSS但时间紧迫的研究人员可能会输入总参与者数量,而不是多次失败。这可能会无意中导致错误的输出。因此,SPSS可以协调这些字段。或者,他们可以保留这个额外的功能。并且他们可以保留一个选项,以便给定其中任何一个,就像他们给出选择标准差、方差或权重之一的选项一样。
敏感性分析
评估汇总估计值在不同情况下是否保持稳健非常重要。这有助于我们评估结果的一般性。留一法Meta分析逐一省略每个研究,并评估汇总效应是否有所变化。
出版偏差评估的替代方法
出版偏差评估对于解释证据综述的结果非常重要。SPSS在朝着这个方向迈出了一步,它没有局限于Egger回归。它允许我们使用推荐用于二元结局的Harbord检验和Peters检验[32]。另一个朝着这个方向迈出的步骤是整合Doi图和LFK指数。当我们评估单组研究(非比较)或包含5-9个研究的Meta分析的出版偏差时,漏斗图和Egger回归的有效性尚未得到验证[33]。然而,Doi图和LFK指数在这些情况下也显示出可接受的结果[34]。因此,它们是比例或其他此类情况的Meta分析的关键[23-25]。因此,它们已在MetaXL、R和STATA中实现。因此,这将是朝这个方向迈出的一个很好的补充。
贝叶斯Meta分析
当研究数量较少时,贝叶斯Meta分析框架通常更受欢迎,因为它有助于更好地估计不确定性[35]。此外,它允许我们使用先验知识,并计算汇总估计值大于或小于预先指定阈值的精确概率[36]。
Heterogeneity exploration in forest plots
森林图中的异质性探索
森林图通常汇总单个结局的证据。来自所有个别研究的估计值、最终的汇总估计值、异质性估计值和亚组效应都可以在森林图中展示。更重要的是,一个敏锐的眼睛甚至可以在森林图本身中筛选出版偏差。虽然SPSS提供了许多必需的功能,但有一些建议可以提高森林图的全面性。预测区间是评估异质性的必不可少工具[10]。这可以整合到森林图本身中。
此外,亚组分析可以像之前讨论的那样在森林图中描绘出来。但是,I2、tau2和其他异质性估计值在每个亚组中不可见。添加这些信息可以帮助评估每个亚组内的异质性。第三,每个组或整个分析中的总参与者数量很重要。这是对证据质量或我们对汇总效应的信心进行评级的必要条件[30]。
我们在github上附带的数据文件中添加了使用SPSS[图16A]和使用R中的meta包[31][图16B]构建的亚组分析森林图。我们在图16B中突出显示了希望在未来版本的SPSS的Meta分析模块中整合的功能。
图16A:使用SPSS的亚组分析森林图
图16B:使用R中的meta包的亚组分析森林图
Harmon is ation with other MA software
与其他Meta分析软件的协调
二元结局数据提取最常用的方法是提取事件数量和每组的总数。在我们的例子中,这意味着提取出现不良事件的参与者数量和每组的总参与者数量。这就是其他软件(如R、RevMan和STATA)通常进行Meta分析的方式。但是,这里略有不同,因为它需要每组出现不良事件的参与者数量和未出现不良事件的参与者数量。因此,它需要未出现不良事件的参与者数量,而不是总参与者数量。虽然在访问界面时可以清楚地理解这一点,但这并非通常的做法。因此,习惯使用其他软件并现在使用SPSS但时间紧迫的研究人员可能会输入总参与者数量,而不是多次失败。这可能会无意中导致错误的输出。因此,SPSS可以协调这些字段。或者,他们可以保留这个额外的功能。并且他们可以保留一个选项,以便给定其中任何一个,就像他们给出选择标准差、方差或权重之一的选项一样。
Sensitivity analysis
敏感性分析
评估汇总估计值在不同情况下是否保持稳健非常重要。这有助于我们评估结果的一般性。留一法Meta分析逐一省略每个研究,并评估汇总效应是否有所变化。
Alternative methods for publication bias assessment
出版偏差评估的替代方法
出版偏差评估对于解释证据综述的结果非常重要。SPSS在朝着这个方向迈出了一步,它没有局限于Egger回归。它允许我们使用推荐用于二元结局的Harbord检验和Peters检验[32]。另一个朝着这个方向迈出的步骤是整合Doi图和LFK指数。当我们评估单组研究(非比较)或包含5-9个研究的Meta分析的出版偏差时,漏斗图和Egger回归的有效性尚未得到验证[33]。然而,Doi图和LFK指数在这些情况下也显示出可接受的结果[34]。因此,它们是比例或其他此类情况的Meta分析的关键[23-25]。因此,它们已在MetaXL、R和STATA中实现。因此,这将是朝这个方向迈出的一个很好的补充。
Bayesian meta-analysis
贝叶斯Meta分析
当研究数量较少时,贝叶斯Meta分析框架通常更受欢迎,因为它有助于更好地估计不确定性[35]。此外,它允许我们使用先验知识,并计算汇总估计值大于或小于预先指定阈值的精确概率[36]。