(附录) 附录



问答环节


第一章:导论


1. 元分析如何定义?元分析与其他类型的文献综述有何区别?

元分析可以定义为对分析的分析(Glass 的定义)。与其他类型的(系统性)综述相比,元分析旨在以定量的方式综合证据。通常,目标是得出一个数值估计,整体描述一个界限明确的研究领域。

2. 你能说出一位元分析的创始者(不论男女)吗?他/她的成就体现在哪里?

卡尔·皮尔逊:整合大英帝国各地的伤寒疫苗接种数据;罗纳德·费舍尔:农业研究数据综合方法;玛丽·史密斯和吉恩·格拉斯:创造了“元分析”一词,首次对心理治疗试验进行元分析;约翰·亨特和弗兰克·施密特:通过校正测量误差(心理测量元分析)进行元分析;丽贝卡·德西莫尼安和南·莱尔德:计算随机效应模型元分析的方法;彼得·埃尔伍德和阿奇·科克伦:医学元分析的先驱。

3. 说出元分析的三个常见问题,并用一两句话描述它们。

“苹果和橘子”:研究差异太大,无法综合;“垃圾进,垃圾出”:无效证据只会通过元分析重现;“文件抽屉”:阴性结果未发表,导致元分析结果存在偏差;“研究者议程”:研究者可以调整元分析来证明他们想证明的东西。

4. 说出定义一个好的元分析研究问题的品质。

FINER:可行、有趣、新颖、符合伦理、相关;PICO:明确定义的人群、干预/暴露、对照组/比较、以及分析的结果。

5. 再次查看大学生睡眠干预元分析的纳入标准(第 1.4.1 节末尾)。你能从这项研究的纳入和排除标准中提取 PICO 吗?

人群:高等教育学生;干预:以睡眠为中心的心理干预;比较:被动控制条件;结果:睡眠障碍,通过标准化症状测量量表进行测量。

6. 说出一些可以用来搜索研究的重要来源。

综述文章,研究中的参考文献,“向前搜索”(搜索引用了相关文章的研究),搜索相关期刊,书目数据库搜索。

7. 用一两句话描述“研究质量”和“偏差风险”之间的区别。

一项研究可以满足研究领域中被认为重要的所有研究质量标准,但仍然具有很高的偏差风险(例如,因为对于这种类型的研究或研究课题,偏差很难避免)。



第二章:探索 R


1. 显示变量 Author

data$Author

2. 将 subgroup 转换为因子。

data$subgroup <- as.factor(data$subgroup)

3. 选择 “Jones” 和 “Martin” 研究的所有数据。

library(tidyverse)
data %>%
    filter(Author %in% c("Jones", "Martin"))

4. 将研究 “Rose” 的名称更改为 “Bloom”。

data[5,1] <- "Bloom"

5. 通过从 TE 中减去 seTE 来创建一个新的变量 TE_seTE_diff。将结果保存在 data 中。

TE_seTE_diff <- data$TE - data$seTE

6. 使用管道来(1)过滤所有在 subgroup “one” 或 “two” 中的研究,(2)选择变量 TE_seTE_diff,(3)取该变量的平均值,然后将 exp 函数应用于它。

data %>%
    deplyr::filter(subgroup %in% c("one", "two")) %>%
    pull(TE_seTE_diff) %>%
    mean() %>%
    exp()



第三章:效应量


1. 对于“效应量”一词是否有明确的定义?当人们谈论效应量时,他们指的是什么?

不,没有普遍接受的定义。有些人保留“效应量”一词来表示干预组和对照组之间的差异。另一些人使用更自由的定义,仅排除“单变量”测量(例如,均值和比例)。

2. 说出观察到的效应量偏离人群真实效应量的主要原因。如何量化它?

假设观察到的效应量因抽样误差而偏离真实效应量。一项研究的抽样误差的预期大小可以用其标准误差来表示。

3. 为什么大型研究比小型研究更能更好地估计真实效应?

因为假设它们具有较小的抽样误差,这会导致更精确的效应估计。

4. 效应量指标必须满足哪些标准才能用于元分析?

它需要具有可比性、可计算性、可靠性和可解释性。

5. 标准化均值差 1 代表什么?

它代表两组的均值相差一个合并标准差。

6. 需要进行什么样的转换才能合并基于比率的效应量(例如,优势比)?

效应量需要进行对数转换(为了使用逆方差合并方法)。

7. 说出三种类型的效应量校正。

标准化均值差的小样本偏差校正(Hedges’ \(g\));不可靠性校正;范围限制校正。

8. 什么时候会发生单位分析问题?如何避免它?

当我们的数据集中的效应量相关时(例如,因为它们是同一研究的一部分)。单位分析问题可以通过以下方式(部分或完全)避免:(1)拆分共享组的样本量,(2)移除比较,(3)合并组,或(4)使用考虑效应量依赖性的模型(例如,三级模型)。



第四章:效应量的合并


1. 固定效应模型和随机效应模型之间有什么区别?

固定效应模型假设所有研究都是相同真实效应量的估计量。随机效应模型假设研究的真实效应量因研究间的异质性(由方差 \(\tau^2\) 捕获)而异,这需要进行估计。

2. 你能想到固定效应模型和随机效应模型的结果相同的情况吗?

当研究间的异质性方差 \(\tau^2\) 为零时。

3. 什么是 \(\tau^2\)?如何估计它?

研究间的异质性方差。可以使用不同的方法来估计它,例如限制最大似然法(REML)、Paule-Mandel 估计量或 DerSimonian-Laird 估计量。

4. Knapp-Hartung 调整基于哪个分布?它有什么影响?

它基于 \(t\)-分布。Knapp-Hartung 调整通常会导致更保守(即更宽)的置信区间。

5. 什么是“逆方差”合并?这种方法什么时候不是最佳解决方案?

该方法称为逆方差合并,因为它使用研究方差的倒数作为合并权重。对于二元结果数据的元分析(例如,风险或优势比),通用的逆方差方法不是首选选项。

6. 你想对二元结果数据进行元分析。研究组中的观察数量大致相似,观察到的事件非常罕见,并且你不期望治疗效果很大。你会使用哪种合并方法?

在这种情况下,Peto 方法可能表现良好。

7. 广义线性混合模型可以用于哪些结果测量?

比例。也可以将它们用于其他二元结果测量,但不建议这样做。



第五章:研究间异质性


1. 为什么检查元分析的研究间异质性很重要?

当研究间异质性很大时,可以假设真实效应量差异很大。在这种情况下,平均真实效应的点估计可能无法很好地代表所有数据。研究间异质性也可能导致效应估计不稳健,例如,因为一些离群研究扭曲了总体结果。

2. 你能说出异质性的两种类型吗?哪一种与计算元分析相关?

基线/设计相关异质性和统计异质性。只有统计异质性在元分析中进行定量评估。

3. 为什么 Cochran 的 \(Q\) 的显著性不是研究间异质性的充分测量?

因为 \(Q\) 检验的显著性很大程度上取决于我们元分析中包含的研究数量及其规模。

4. 使用预测区间来表达元分析中异质性量的优势是什么?

预测区间允许在与汇总测量相同的尺度上表达研究间异质性对未来研究的影响。

5. 统计离群值和有影响力研究之间的区别是什么?

统计离群值是具有极端效应量的研究。当研究对总体结果的影响很大时,研究是有影响力的。一项研究有可能被定义为统计离群值但影响力不大,反之亦然。例如,一项大型研究可能对合并结果产生很大影响,即使其效应量不是特别小或大。

6. GOSH 图可以用于什么?

GOSH 图可用于探索我们数据中的异质性模式,以及哪些研究导致了这些模式。



第六章:森林图


1. 森林图的关键组成部分是什么?

每项研究的观察到的效应量及其置信区间的图形表示;每项研究的权重,由观察到的效应量周围的正方形的大小表示;每项研究的观察到的效应和权重的数值;合并效应,由菱形表示;参考线,通常表示无效应。

2. 展示我们元分析的森林图的优势是什么?

它们可以快速检查所有包含的研究的数量、效应量和精度,以及观察到的效应如何“加起来”形成合并效应。

3. 森林图的局限性是什么?并且幕帘图如何克服这一局限性?

森林图只能显示假设固定显著性阈值的效应的置信区间(通常 \(\alpha\) = 0.05)。幕帘图可用于显示不同 \(p\)-值的效应大小的置信区间(以及因此的显著性)。



第七章:亚组分析


1. 在最好的情况下,亚组分析可以告诉我们影响和离群值分析无法提供的信息是什么?

亚组分析有可能解释为什么我们的数据中存在某些异质性模式,而不仅仅是告诉我们它们存在

2. 为什么亚组分析背后的模型被称为固定效应(复数)模型?

因为它假设,虽然亚组内的研究遵循随机效应模型,但亚组级别本身是固定的。存在几个固定的亚组效应。

3. 作为元分析的一部分,你想检查教育培训计划的效果是否因其交付的学区而异。使用固定效应(复数)模型进行亚组分析是否适合回答这个问题?

可能不适合。假设学区代表从更大的学区人群中抽取,而不是所有存在的学区,更有意义。

4. 你的一个朋友进行了一项元分析,共包含九项研究。其中五项研究属于一个亚组,四项研究属于另一个亚组。她问你进行亚组分析是否有意义。你会推荐什么?

进行亚组分析可能不是一个好主意,因为研究总数小于十项。

5. 你发现了一项元分析,其中的作者声称分析的治疗在女性中比在男性中更有效。这一发现基于一项亚组分析,在该分析中,研究根据研究人群中包含的女性的份额分为亚组。这一发现可信吗?为什么(不)?

该发现基于使用聚合研究数据创建的亚组变量。这可能会引入生态偏差,因此结果值得怀疑。



第八章:元回归


1. 初级研究中使用的传统回归分析和元回归之间有什么区别?

分析单位是研究(而不是人),其效应量或多或少是精确的。在元回归中,我们必须构建回归模型,该模型考虑到某些研究应比其他研究具有更大的权重。

2. 亚组分析和元回归密切相关。如何调整元回归公式以适应亚组数据?

通过使用虚拟/分类预测变量。

3. 元回归中使用哪种方法来给各个研究不同的权重?

元回归使用加权最小二乘法来给具有更高精度的研究更大的权重。

4. 什么特征标志着一个元回归模型能够很好地拟合我们的数据?可以使用哪个指标来检查这一点?

一个“好”的元回归模型应该导致未解释的研究间异质性方差的减少。涵盖这种解释方差增加的指标是 \(R^2\) 类似物。

5. 当我们使用元回归技术计算亚组分析时,我们假设亚组中 \(\tau^2\) 的单独值还是共同值?

在亚组中假设 \(\tau^2\) 的共同估计。

6. (多重)元回归的局限性和陷阱是什么?

过度拟合元回归可能导致假阳性结果;多重共线性可能导致不稳健的参数估计。

7. 说出两种可以用来提高(多重)元回归模型稳健性的方法,以及它们为什么有用。

我们可以进行排列检验或使用多模型推断。



第九章:发表偏倚


1. “发表偏倚”一词如何定义?为什么它在元分析中存在问题?

当一项研究的发表概率取决于其结果时,就存在发表偏倚。这在元分析中存在问题,因为它可能导致有偏差的结果。由于并非所有证据都被考虑,因此元分析可能会导致在考虑所有现有信息时不会实现的发现。

2. 还有哪些其他的报告偏倚?说出并解释至少三个。

引用偏倚:具有阴性发现的研究不太可能被引用;时间滞后偏倚:具有阴性发现的研究发表较晚;多重发表偏倚:具有阳性发现的研究更可能在几篇文章中报告;语言偏倚:证据可能因为未以英语发表而被省略;结果报告偏倚:一项研究的阳性结果比阴性结果更可能被报告。

3. 说出两种可疑的研究实践 (QRPs),并解释它们如何威胁我们元分析的有效性。

P 值操纵 (P-hacking),结果后假设 (HARKing)。两者都会导致阳性发现的膨胀,即使没有真正的效果。

4. 解释小样本效应方法背后的核心假设。

大型研究(即具有小标准误差的研究)很可能被发表,无论他们的发现如何。较小的研究具有较小的精度,这意味着需要非常高的效应量才能达到统计显著性。因此,只有具有非常高效应的小型研究才会被发表,而其余的研究则最终出现在“文件抽屉”中。

5. 当我们发现我们的数据表现出小样本效应时,这是否自动意味着存在发表偏倚?

不。还有几种其他的解释,说明为什么我们发现小样本效应,包括研究间异质性、协变量的影响(例如,较小研究中的治疗保真度更高)或机会。

6. P 曲线估计什么:包含在我们元分析中的所有研究的真实效应,还是仅所有_显著_效应量的真实效应?

P 曲线仅估计所有显著效应量的真实效应。这就是为什么当存在研究间异质性时,它的表现不佳的原因之一。

7. 哪种发表偏倚方法具有最佳性能?

没有一种发表偏倚方法始终优于所有其他方法。因此,应用几种方法并查看它们的结果是否一致是有帮助的。



第十章:“多层”元分析


1. 说“三级”模型而不是“多层”模型更准确的原因是什么?

因为“传统”随机效应模型已经是多层模型。它假设参与者嵌套在研究中,并且研究本身是从真实效应量人群中抽取的。

2. 三级元分析模型什么时候有用?

当我们处理相关或嵌套数据时。当研究贡献多个效应量,或者有充分的理由相信研究本身属于更大的集群时,三级模型特别有用。

3. 说出效应量依赖性的两个常见原因。

由参与初级研究的研究人员引起的依赖性;由元分析师自己创建的依赖性。

4. 如何解释多层 \(I^2\) 统计量?

它告诉我们不属于抽样误差的方差量,并区分集群的异质性方差和集群的异质性方差。

5. 如何扩展三级模型以纳入调节变量的影响?

通过将固定效应项整合到模型公式中。



第十一章:结构方程建模元分析


1. 什么是结构方程建模?它用于什么?

结构方程建模是一种统计方法,可用于测试显变量和潜变量之间假设的关系。

2. 可以通过哪两种方式表示 SEM?

SEM 可以通过图形或矩阵表示。

3. 从 SEM 的角度描述随机效应元分析。

从 SEM 的角度来看,随机效应元分析中的真实总体效应量可以被视为潜变量。它受到两个方面的影响:第一级的抽样误差和第二级的真实效应量异质性方差。

4. 什么是多元元分析?它什么时候有用?

多元元分析允许同时合并研究的两个(或更多)结果。联合估计两个结果变量的一个优点是可以考虑结果之间的相关性。

5. 当我们发现我们提出的元分析 SEM 能够很好地拟合数据时,这是否自动意味着该模型是“正确”的模型?

不。通常,有不止一个模型能够很好地拟合数据。



第十二章:网络元分析


1. 网络元分析什么时候有用?与标准元分析相比,它们的优势是什么?

当某些问题领域存在几种相互竞争的治疗方法,并且我们想估计哪种治疗方法具有最大的益处时,网络元分析很有用。与传统的元分析相比,网络元分析模型可以整合直接和间接证据。

2. 在治疗网络中,直接证据和间接证据之间有什么区别?如何使用直接证据来生成间接证据?

直接证据是包含的研究中实际调查的比较所提供的信息。间接证据是通过从相关比较的效应中减去一个(直接观察到的)比较的效应来从直接证据中得出的(例如,使用相同对照组的比较)。

3. 网络元分析中传递性假设背后的主要思想是什么?

传递性假设规定,直接证据可用于推断未观察到的间接证据,并且直接和间接证据是一致的。

4. 传递性和一致性之间的关系是什么?

传递性是进行网络元分析的先决条件,不能直接测试。传递性的统计表现形式是一致性,当基于直接证据的效应量估计与基于间接证据的估计相同/相似时,即满足一致性。

5. 说出两种可用于进行网络元分析的建模方法。其中一种比另一种更好吗?

可以使用频率主义或贝叶斯模型进行网络元分析。两种模型是等效的,并且随着样本量的增加产生收敛的结果。

6. 当我们包含来自一项研究的几个比较(即多臂研究)时,这会导致什么问题?

这意味着效应估计是相关的,从而导致单位分析错误。

7. 在解释不同治疗的 P 或 SUCRA 分数时,我们必须牢记什么?

不同治疗的效应估计经常重叠。这意味着 P-/SUCRA 分数应始终谨慎解释。



第十三章:贝叶斯元分析


1. “传统”随机效应模型和贝叶斯分层模型之间的异同是什么?

频率主义元分析背后的随机效应模型在概念上与贝叶斯分层模型相同。主要区别在于贝叶斯分层模型包括总体真实效应量 \(\mu\) 和研究间异质性 \(\tau\) 的(弱信息)先验分布。

2. 与频率主义对应物相比,说出贝叶斯元分析的三个优势。

\(\tau^2\) 估计的不确定性被直接建模;生成 \(\mu\) 的后验分布,可用于计算 \(\mu\) 位于某个值以下的概率;先验知识或信念可以整合到模型中。

3. 解释弱信息先验和非信息先验之间的区别。

非信息先验假设所有或一系列可能的值同样可能。弱信息先验表示对某些值比其他值更可能的微弱信念。

4. 什么是半柯西分布?为什么它对贝叶斯元分析有用?

半柯西分布是一种仅为正值定义的柯西分布。它由一个位置和缩放参数控制,后者决定了分布的尾部有多重。半柯西分布可以用作 \(\tau\) 的先验。

5. 什么是 ECDF?如何在贝叶斯元分析中使用它?

ECDF 代表经验累积分布函数。基于 \(\mu\)(或 \(\tau\))的后验分布的 ECDF 可用于确定估计参数低于或高于某个指定阈值的(累积)概率。



效应量公式


Warning: 'xfun::attr()' is deprecated.
Use 'xfun::attr2()' instead.
See help("Deprecated")
效应量 ($\hat\theta$) 标准误差 (SE) 函数
算术平均值 (\@ref(means)) $\bar{x} = \dfrac{\sum^{n}_{i=1}x_i}{n}$ $\text{SE}_{\bar{x}} = \dfrac{s}{\sqrt{n}}$ mean
比例 (\@ref(props)) $p = \dfrac{k}{n}$ $\text{SE}_{p} = \sqrt{\dfrac{p(1-p)}{n}}$
比例 (\@ref(props)) $p_{\text{logit}} = \log_{e}\left(\dfrac{p}{1-p}\right)$ $\text{SE}_{p_{\text{logit}}} = \sqrt{\dfrac{1}{np}+\dfrac{1}{n(1-p)}}$
相关性
乘积矩相关 (\@ref(pearson-cors)) $r_{xy} = \dfrac{\sigma^{2}_{xy}}{\sigma_x \sigma_y}$ $SE_{r_{xy}} = \frac{1-r_{xy}^2}{\sqrt{n-2}}$ cor
乘积矩相关 (\@ref(pearson-cors)) $z = 0.5\log_{e}\left(\dfrac{1+r}{1-r}\right)$ $\text{SE}_{z} = \dfrac{1}{\sqrt{n-3}}$
点二列相关1 (\@ref(pb-cors)) \bgroup\fontsize{4}{6}\selectfont ${r_{\text{pb}}}= \dfrac{(\bar{y_1}-\bar{y_2})\sqrt{\dfrac{n_1}{N}\left(1-\dfrac{n_1}{N}\right)}}{s_y}$\egroup{} cor
(标准化)均值差
组间均值差 (\@ref(b-group-md)) $\text{MD} = \bar{x}_1 - \bar{x}_2$ \bgroup\fontsize{6}{8}\selectfont $\text{SE}_{\text{MD}} = {s_{\text{pooled}}}^*\sqrt{\dfrac{1}{n_1}+\dfrac{1}{n_2}}$\egroup{}
组间标准化均值差 (\@ref(b-group-smd)) $\text{SMD} = \dfrac{\bar{x}_1 - \bar{x}_2}{{s_{\text{pooled}}}^*}$ \bgroup\fontsize{6}{8}\selectfont $\text{SE}_{\text{SMD}} = \sqrt{\dfrac{n_1+n_2}{n_1n_2} + \dfrac{\text{SMD}^2_{\text{between}}}{2(n_1+n_2)}}$\egroup{} esc\_mean\_sd
组内均值差 (\@ref(w-group-smd)) $\text{MD} = \bar{x}_{t_2} - \bar{x}_{t_1}$ \bgroup\fontsize{6}{8}\selectfont $SE_{\text{MD}}=\sqrt{\dfrac{s^2_{\text{t}_{\text{2}}}+s^2_{\text{t}_{\text{1}}}-(2r_{\text{t}_{\text{1}}\text{t}_{\text{2}}}s_{\text{t}_{\text{1}}}s_{\text{t}_{\text{2}}})}{n}}$\egroup{}
组内标准化均值差 (\@ref(w-group-smd)) \bgroup\fontsize{6}{8}\selectfont $\text{SMD}= \dfrac{\bar{x}_{t_2} - \bar{x}_{t_1}}{s_{\text{t}_1}}$\egroup{} \bgroup\fontsize{6}{8}\selectfont $\text{SE}_{\text{SMD}} = \sqrt{\dfrac{2(1-r_{t_1t_2})}{n}+\dfrac{\text{SMD}^2_{\text{within}}}{2n}}$\egroup{}
二元结果效应量
风险比 (\@ref(rr)) ${p_{e}}_{\text{treat}} =\dfrac{a}{n_{\text{treat}}}$ \bgroup\fontsize{6}{8}\selectfont $\text{SE}_{\log \text{RR}} = \sqrt{\dfrac{1}{a}+\dfrac{1}{c} - \dfrac{1}{a+b} - \dfrac{1}{c+d}}$\egroup{}
风险比 (\@ref(rr)) ${p_{e}}_{\text{control}} = \dfrac{c}{n_{\text{control}}}$
风险比 (\@ref(rr)) $\text{RR} = \dfrac{{p_{e}}_{\text{treat}}}{{p_{e}}_{\text{control}}}$
风险比 (\@ref(rr)) $\log \text{RR} = \log_{e}(\text{RR})$
优势比 (\@ref(or)) $\text{Odds}_{\text{treat}} = \dfrac{a}{b}$ $\text{SE}_{\log \text{OR}} = \sqrt{\dfrac{1}{a}+\dfrac{1}{b}+\dfrac{1}{c}+\dfrac{1}{d}}$ esc\_2x2
优势比 (\@ref(or)) $\text{Odds}_{\text{control}} = \dfrac{c}{d}$
优势比 (\@ref(or)) $\text{OR} = \dfrac{a/b}{c/d}$
优势比 (\@ref(or)) $\log \text{OR} = \log_{e}(\text{OR})$
发病率比 (\@ref(irr)) $\text{IRR} = \dfrac{ E_{\text{treat}}/T_{\text{treat}} }{E_{\text{control}}/T_{\text{control}}}$ $\text{SE}_{\log \text{IRR}} = \sqrt{\dfrac{1}{E_{\text{treat}}}+\dfrac{1}{E_{\text{control}}}}$
发病率比 (\@ref(irr)) $\log \text{IRR} = \log_{e}(\text{IRR})$
效应量校正
小样本偏差 (\@ref(hedges-g)) $g = \text{SMD} \times \left(1-\dfrac{3}{4n-9}\right)$ hedges\_g
不可靠性 (\@ref(unrealiable)) ${r_{xy}}_{c} = \dfrac{r_{xy}}{\sqrt{r_{xx}}}$ $\text{SE}_c = \dfrac{\text{SE}}{\sqrt{r_{xx}}}$
不可靠性 (\@ref(unrealiable)) ${r_{xy}}_{c} = \dfrac{r_{xy}}{\sqrt{r_{xx}}\sqrt{r_{yy}}}$ $\text{SE}_c = \dfrac{\text{SE}}{\sqrt{r_{xx}}\sqrt{r_{yy}}}$
不可靠性 (\@ref(unrealiable)) $\text{SMD}_c = \dfrac{\text{SMD}}{\sqrt{r_{xx}}}$
范围限制 (\@ref(range)) $\text{U} = \dfrac{s_{\text{unrestricted}}}{s_{\text{restricted}}}$ $\text{SE}_{{r_{xy}}_c} = \dfrac{{r_{xy}}_c}{r_{xy}}\text{SE}_{r_{xy}}$
范围限制 (\@ref(range)) \bgroup\fontsize{6}{8}\selectfont ${r_{xy}}_c = \dfrac{\text{U}\times r_{xy}}{\sqrt{(\text{U}^2-1)r_{xy}^2+1}}$\egroup{}
范围限制 (\@ref(range)) \bgroup\fontsize{6}{8}\selectfont $\text{SMD}_c = \dfrac{\text{U}\times \text{SMD}}{\sqrt{(\text{U}^2-1)\text{SMD}^2+1}}$\egroup{} $\text{SE}_{{\text{SMD}}_c} = \dfrac{{\text{SMD}}_c}{\text{SMD}}\text{SE}_{\text{SMD}}$
1 点二列相关可以转换为 SMD 进行元分析(参见 \@ref(pb-cors) 章)。
* 合并标准差定义为 $s_{\text{pooled}} = \sqrt{\dfrac{(n_1-1)s^2_1+(n_2-1)s^2_2}{(n_1-1)+(n_2-1)}}$。



符号列表


$~$ $~$ $~$ $~$
$~$
$a,b,c,d$ Events in the treatment group, non-events in the treatment group, events in the control group, non-events in the control group. $\beta_0, \beta_1, \beta$ Regression intercept, regression coefficient, Type II error rate.
$~$
$c_{\alpha}$ Critical value assumed for the Type I error rate $\alpha$ (typically 1.96). $\mathcal{HC}(x_0,s)$ Half-Cauchy distribution with location parameter $x_0$ and scaling parameter $s$.
$~$
$\chi^2$ Chi-squared statistic. $\text{Cov}(x,y)$ Covariance of $x$ and $y$.
$~$
$d$ Cohen's $d$ (standardized mean difference). $D_g$ Regression dummy.
$~$
$\delta$ Non-centrality parameter (non-central $t$ distribution). d.f. Degrees of freedom.
$~$
$\epsilon$ Sampling error. $F$ Snedecor's $F$ statistic (used by the $F$-tests in ANOVAs).
$~$
$g$ Small sample bias-corrected standardized mean difference (Hedges' $g$). $I^2$ Higgins' and Thompson's $I^2$ measure of heterogeneity (percentage of variation not attributable to sampling error).
$~$
$\int f(x) dx$ Integral of $f(x)$. $k,K$ Some study in a meta-analysis, total number of studies in a meta-analysis.
$~$
$\kappa$ True effect of an effect size cluster. $MD$, $SMD$ (Standardized) mean difference (Cohen's $d$).
$~$
$\bar{x}$ Arithmetic mean (based on an observed sample), identical to $m$. $\mu, m$ (True) population mean, sample mean.
$~$
$n,N$ (Total) sample size of a study. $\mathcal{N}(\mu, \sigma^2)$ Normal distribution with population mean $\mu$ and variance $\sigma^2$.
$~$
$\Phi(z)$ Cumulative distribution function (CDF), where $z$ follows a standard normal distribution. $\pi, p$ True population proportion, proportion based on an observed sample.
$~$
$P(\text{X}|\text{Y})$ Conditional probability of X given Y. $\hat\psi$ (Estimate of) Peto's odds ratio, or some other binary effect size.
$~$
$Q$ Cochran's $Q$ measure of heterogeneity. $RR$, $OR$, $IRR$ 风险比,优势比,发病率比。
$~$
$\hat{R}$ R-hat value in Bayesian modeling. $R^2_*$ $R^2$ (explained variance) analog for meta-regression models.
$~$
$\rho, r$ True population correlation, observed correlation. $SE$ Standard error
$~$
$\sigma^2$ (True) population variance. $t$ Student's $t$ statistic.
$~$
$\tau^2, \tau$ True heterogeneity variance and standard deviation. $\theta$ A true effect size, or the true value of an outcome measure.
$~$
$V$, $v$, $s^2$, $\widehat{\text{Var}}(x)$ Sample variance (of $x$), where $s$ is the standard deviation. $w$, $w^*$, $w(x)$ (Inverse-variance) weight, random-effects weight of an effect size, function that assigns weights to $x$.
$~$
$z$ Fisher's $z$ or $z$-score. $\zeta, u$ ``Error'' due to between-study heterogeneity, random effect in (meta-)regression models.
$~$

注意。 向量和矩阵以粗体书写。例如,我们可以用向量 \(\boldsymbol{\hat\theta} = (\hat\theta_1, \hat\theta_2, \dots, \hat\theta_K)^\top\) 表示元分析中所有观察到的效应量,其中 \(K\) 是研究总数。\(\top\) 符号表示向量是转置的。这意味着向量中的元素是垂直排列而不是水平排列。有时需要这样做才能对向量进行进一步的操作,例如将其与另一个矩阵相乘。



R & 包信息




本书使用 R 版本 4.2.0(“Vigorous Calisthenics”,2022-04-22)在 macOS Catalina 10.15.4(Apple Darwin 17.0 64-bit x86-64)下编译。本书中使用的包版本如下:

brms 2.18.0                 clubSandwich 0.5.6
dmetar 0.0.9000             dplyr 1.0.10             
esc 0.5.1                   extraDistr 1.9.1            
forcats 0.5.1               gemtc 0.8-6                 
ggplot2 3.3.5               ggridges 0.5.2              
glue 1.4.1                  igraph 1.2.5                
meta 6.1.0                  metafor 3.8.1              
metaSEM 1.3.0               metasens 1.5.1              
netmeta 2.1.0               openxlsx 4.2.5              
osfr 0.2.8                  PerformanceAnalytics 2.0.4  
rjags 4-10                  robvis 0.3.0                
semPlot 1.1.5               stringr 1.4.0               
tidybayes 2.1.1             tidyverse 1.3.1
wildmeta 0.1.0

附加的基础包:

base 4.2.0        datasets 4.2.0    graphics 4.2.0     
grDevices 4.2.0   methods 4.2.0     stats 4.2.0
utils 4.2.0

区域设置:en_US.UTF-8

安装特定包版本

您在运行本指南中呈现的某些代码时遇到问题吗?有时,这是由于您的计算机上安装了较旧或较新版本的包引起的。如果是这种情况,安装我们也用于编译本书的包的精确版本可能会有所帮助。有关如何安装 R 包的特定版本的一些有用提示可以在此处找到。



归属

图 @ref(fig:eysenck):Sirswindon 在 English Wikipedia, CC BY-SA 3.0, 通过 Wikimedia Commons。从原始图像中降低了饱和度。



更正 & 说明


```{block2