文章目录
在回归中, 解释变量(自变量)之间如果存在多重共线性就会导致回归系数的估计不准确, 因为方差变得很大, 如果你发现模型的总体回归指标是显著的, 但是单个系数的t检验却不显著, 那么我们就可以怀疑是否存在多重共线性。
诊断多重共线性的方法就是计算解释变量的膨胀因子(VIF), 经验上来说, VIF不超过10。
我们仍然使用”nerlove.dta”数据:
1 | use data/nerlove.dta, clear |
输出(stream):
(Nerlove 1963 paper)
(Nerlove 1963 paper)
回归分析:
1 | reg lntc lnq lnpl lnpk lnpf |
输出(stream):
Source | SS df MS Number of obs = 145 -------------+---------------------------------- F(4, 140) = 437.90 Model | 269.524728 4 67.3811819 Prob > F = 0.0000 Residual | 21.5420958 140 .153872113 R-squared = 0.9260 -------------+---------------------------------- Adj R-squared = 0.9239 Total | 291.066823 144 2.02129738 Root MSE = .39227 ------------------------------------------------------------------------------ lntc | Coef. Std. Err. t P>|t| [95% Conf. Interval] -------------+---------------------------------------------------------------- lnq | .7209135 .0174337 41.35 0.000 .6864462 .7553808 lnpl | .4559645 .299802 1.52 0.131 -.1367602 1.048689 lnpk | -.2151476 .3398295 -0.63 0.528 -.8870089 .4567136 lnpf | .4258137 .1003218 4.24 0.000 .2274721 .6241554 _cons | -3.566513 1.779383 -2.00 0.047 -7.084448 -.0485779 ------------------------------------------------------------------------------
Source | SS df MS Number of obs = 145 -------------+---------------------------------- F(4, 140) = 437.90 Model | 269.524728 4 67.3811819 Prob > F = 0.0000 Residual | 21.5420958 140 .153872113 R-squared = 0.9260 -------------+---------------------------------- Adj R-squared = 0.9239 Total | 291.066823 144 2.02129738 Root MSE = .39227 ------------------------------------------------------------------------------ lntc | Coef. Std. Err. t P>|t| [95% Conf. Interval] -------------+---------------------------------------------------------------- lnq | .7209135 .0174337 41.35 0.000 .6864462 .7553808 lnpl | .4559645 .299802 1.52 0.131 -.1367602 1.048689 lnpk | -.2151476 .3398295 -0.63 0.528 -.8870089 .4567136 lnpf | .4258137 .1003218 4.24 0.000 .2274721 .6241554 _cons | -3.566513 1.779383 -2.00 0.047 -7.084448 -.0485779 ------------------------------------------------------------------------------
然后使用estat命令计算VIF:
1 | estat vif |
输出(stream):
Variable | VIF 1/VIF -------------+---------------------- lnpf | 1.21 0.824250 lnpl | 1.21 0.829013 lnpk | 1.09 0.918113 lnq | 1.04 0.960914 -------------+---------------------- Mean VIF | 1.14
Variable | VIF 1/VIF -------------+---------------------- lnpf | 1.21 0.824250 lnpl | 1.21 0.829013 lnpk | 1.09 0.918113 lnq | 1.04 0.960914 -------------+---------------------- Mean VIF | 1.14
从结果中我们可以看出, VIF都处于1多一点, 远小于10, 所以不必担心存在多重共线性的风险。
注意
本文由jupyter notebook转换而来, 您可以在这里下载notebook
统计咨询请加QQ 2726725926, 微信 mllncn, SPSS统计咨询是收费的
微博上@mlln-cn可以向我免费题问
请记住我的网址: mlln.cn 或者 jupyter.cn