现在也越来越多的期刊要求论文中汇报效应量, 在均值比较的分析时,
效应量往往指的是均值差异大小的一个衡量, 但是因为存在量纲不同的因素,
均值之差不能进行横向比较, 比如身高只差为10cm, 而体重之差时10公斤,
那么我们可以不可以说, 身高之差等于体重之差? 当然不能! (认为能的请自行关闭本网页)
cohen’d 计算公式
所以有好事者, 发明了效应量这个词, 其实就是差值除以标准差, 但是两组均值有两个标准差,
所以需要合成一个联合标准差, 也就是$s_p$
, 废话不多说, 上公式:
在独立样本T检验中, 效应量计算公式是:
$ d = { {m1 - m2} \over s_p} $
$ s_p = \sqrt{ {(n_1-1)*s_1^2 + (n_2-1)*s_2^2)} \over {n_1+n_2-2} } $
当两组样本量相同时, 也就是$n_1=n_2$
, 可以化简$s_p$
:
$ s_p = (s_1^2 + s_2^2)/2 $
注意: 很多网站给出的计算公式都只用化简后的$s_p$
公式, 但是这个公式的前提(两样本量相同)被忽略,
简直是误人子弟!
比如这个计算器没有考虑两组量本量不同, 直接假设两组样本相同, 而绝大部分童鞋不太可能有完全相等的两组样本的!
另外, cohen’d 对总体效应量的估计是有偏的, 并且样本量较小的时候, cohen’d 值偏大, 所有当样本量小于50时,
需要对d进行矫正:
$ \hat d =d { (N-3)/(N-2.25) \sqrt{ {N-2} \over N } } $
Hedge’s g 效应量
很多人都认为计算g的方法是通过d的转换得到的:
$ g = d * \sqrt{df/N} $
但是我翻阅了很多文献, 我发现Cohen其实先于Hedge提出了上面的公式,
而我们说 Hedge’s g 的时候实际上指的是这个公式:
$ g = d * (\frac{\Gamma(df/2)}{\sqrt{df/2 \,}\,\Gamma((df-1)/2)}) $
但是因为计算比较复杂, Hedge提出一个替代的经验公式:
$ g^* = d*(1 - \frac{3}{4(df) - 1}) $
其中自由度df对于独立样本的t检验来说是:
$ df = n_1 + n_2 - 2 $
方差不齐时计算 Glass’s Delta
上面的两个指标都要计算联合方差, 联合方差要求两个样本来自同一个总体, 但是当方差不齐时, 这个假设就被推翻了,
这时候只能计算Glass’s Delta:
$ \delta = (m_1-m_2)/s_2 $
它实际上以第二组的标准差为基准的。
配对样本计算公式
$ d = {M / SD} (M是差值的均值, SD是差值的标准差) $
下面的计算器没有涉及配对样本!
计算器
视频教程
参考文献
1 Cohen, J. (1988). Statistical Power Analysis for the Behavioral Sciences. New York, NY: Routledge Academic.
2 Lakens, D. (2013). Calculating and reporting effect sizes to facilitate cumulative science: A practical primer for t-tests and ANOVAs. Frontiers in Psychology, 4:863. doi:10.3389/fpsyg.2013.00863
3 https://www2.psych.ubc.ca/~schaller/528Readings/RosnowRosenthal2003.pdf
5 https://www.frontiersin.org/articles/10.3389/fpsyg.2013.00863/full
6 Stephanie Glen. “Glass’s Delta” From StatisticsHowTo.com: Elementary Statistics for the rest of us! https://www.statisticshowto.com/glasss-delta/
7 https://www.polyu.edu.hk/mm/effectsizefaqs/effect_size_equations2.html