温馨提示: 定期 清理浏览器缓存,可以获得最佳浏览体验。
作者: 贺旭 (中央财经大学)
目录
本文介绍 AIC, BIC 等信息准则以及在 Stata 中的相关命令。
该小节将介绍 AIC , BIC 等信息准则以及在 Stata 中的相关命令
在建模过程中,会有一些备选解释变量,选择不同的变量组合会得到不同的模型,而信息准则就是刻画这些模型相对于 “ 真实模型 ” 的信息损失。AIC, BIC, HQIC 等信息准则的计算公式为:
赤池信息准则 (akaike information criterion):
贝叶斯信息准则 (bayesian information criterion):
汉南 - 奎因信息准则 (quinn criterion):
其中 :
在模型拟合时,增加参数可使得似然概率增大,但是却引入了额外的变量,因此 AIC 和 BIC 都在目标式中添加了模型参数个数的惩罚项,也就是第二项。当
在估计完模型后用,用命令 estat ic
来获得模型的 AIC,BIC , 例如 :
. sysuse auto ///载入数据
. regress price headroom trunk length mpg ///利用数据估计模型
. estat ic ///获得模型地AIC和BIC
结果为
Akaike's information criterion and Bayesian information criterion
-------------------------------------------------------------
Model | Obs ll(null) ll(model) df AIC BIC
-------+-----------------------------------------------------
. | 74 -695.7129 -685.0518 5 1380.104 1391.624
-------------------------------------------------------------
该小节将介绍 MSE、MAE、MAPE、R2、Adjusted R2 等回归评价指标以及在 Stata 中的相关命令。
MSE、MAE、MAPE、R2、Adjusted R2 等指标用来表示回归模型拟合数据的精确程度。以下是各个指标的具体公式:
均方误差 MSE(Mean Square Error):
平均绝对误差 MAE(Mean Absolute Error):
平均绝对百分比误差 MAPE(Mean Absolute Percentage Error):
决定系数 R2(R-Square):
校正决定系数 adj-R2(Adjusted R-Square):
其中:
我们继续用 Stata 自带的 auto.dta 数据来做演示。
(一) R2 和 Adjusted R2 的计算:
. sysuse auto ///载入数据
. regress price headroom trunk length mpg ///利用数据估计模型 ,R2 和 Adjusted R2也在结果中显示了///
结果为:
Source | SS df MS Number of obs = 74
----------+---------------------------------- F(4, 69) = 5.76
Model | 158982705 4 39745676.1 Prob > F = 0.0005
Residual | 476082692 69 6899749.15 R-squared = 0.2503
----------+---------------------------------- Adj R-squared = 0.2069
Total | 635065396 73 8699525.97 Root MSE = 2626.7
---------------------------------------------------------------------------
price | Coef. Std. Err. t P>|t| [95% Conf. Interval]
----------+----------------------------------------------------------------
headroom | -680.2898 486.0063 -1.40 0.166 -1649.846 289.2663
trunk | 80.9094 119.8176 0.68 0.502 -158.1201 319.9389
length | 23.28608 27.02926 0.86 0.392 -30.63583 77.20798
mpg | -173.9507 87.75118 -1.98 0.051 -349.0095 1.108165
_cons | 6416.948 6036.935 1.06 0.292 -5626.407 18460.3
---------------------------------------------------------------------------
(二) MSE 的计算:
. sysuse auto ///载入数据
. regress price headroom trunk length mpg ///利用数据估计模型 ///
. predict e,xb ///获得模型拟合值保存为变量 e
. gen mse=(price-e)*(price-e) ///计算并创建变量 mse
. sum mse//得到结果栏中mean那一列为MSE
结果为:
Variable | Obs Mean Std. Dev. Min Max
----------+------------------------------------------------
mse | 74 6433550 1.26e+07 2230.343 8.80e+07
(三) MAE 的计算:
. sysuse auto ///载入数据
. regress price headroom trunk length mpg ///利用数据估计模型 ///
. predict e,xb ///获得模型拟合值保存为变量 e
. gen mae=abs(price-e) ///计算并创建变量 mae
. sum mae//mae的均值即为结果,也就是结果栏中mean那一列的值
结果为:
Variable | Obs Mean Std. Dev. Min Max
----------+---------------------------------------------------
mae | 74 1958.684 1622.555 47.22651 9380.703
(三) MAE 的计算:
. sysuse auto ///载入数据
. regress price headroom trunk length mpg ///利用数据估计模型 ///
. predict e,xb ///获得模型拟合值保存为变量 e
. gen mape=abs(price-e)/price ///计算并创建变量 mae
. sum mape///mape的均值即为结果,也就是结果栏中mean那一列的值
结果为:
Variable | Obs Mean Std. Dev. Min Max
----------+------------------------------------------------
mape | 74 .3138812 .1892069 .0060338 .9669298
连享会-直播课 上线了!
http://lianxh.duanshu.com
免费公开课:
直击面板数据模型 - 连玉君,时长:1小时40分钟 Stata 33 讲 - 连玉君, 每讲 15 分钟. 部分直播课 课程资料下载 (PPT,dofiles等)
支持回看,所有课程可以随时购买观看。
专题 | 嘉宾 | 直播/回看视频 |
---|---|---|
⭐ 最新专题 ⭐ | DSGE, 因果推断, 空间计量等 | |
⭕ Stata数据清洗 | 游万海 | 直播, 2 小时,已上线 |
研究设计 | 连玉君 | 我的特斯拉-实证研究设计,-幻灯片- |
面板模型 | 连玉君 | 动态面板模型,-幻灯片- |
面板模型 | 连玉君 | 直击面板数据模型 [免费公开课,2小时] |
Note: 部分课程的资料,PPT 等可以前往 连享会-直播课 主页查看,下载。
关于我们
课程, 直播, 视频, 客服, 模型设定, 研究设计, stata, plus, 绘图, 编程, 面板, 论文重现, 可视化, RDD, DID, PSM, 合成控制法
等
连享会小程序:扫一扫,看推文,看视频……
扫码加入连享会微信群,提问交流更方便
✏ 连享会学习群-常见问题解答汇总:
✨ https://gitee.com/arlionn/WD