Stata连享会 主页 || 视频 || 推文 || 知乎 || Bilibili 站
温馨提示: 定期 清理浏览器缓存,可以获得最佳浏览体验。
New!
lianxh
命令发布了:
随时搜索推文、Stata 资源。安装:
. ssc install lianxh
详情参见帮助文件 (有惊喜):
. help lianxh
连享会新命令:cnssc
,ihelp
,rdbalance
,gitee
,installpkg
⛳ Stata 系列推文:
作者:毕英睿 (中央财经大学)
邮箱:judybi2017@163.com
编者按:本文主要摘译自下文,特此致谢!
Source:Bellégo C, Benatia D, Pape L. Dealing with logs and zeros in regression models[J]. arXiv preprint arXiv:2203.11820, 2022. -PDF-
目录
对数线性和对数模型是实证研究中最常用的方法之一。对数线性回归在研究中被用于许多目的,例如:
通过调查 2016-2020 年 AER (American Economic Review) 发表的论文,我们发现近 40% 的实证论文使用了对数规格,其中 36% 的论文面临对数为零的问题。针对对数为零的问题,在实践中采用了几种解决方案:
五种已确定的“零对数”解决方案:
最流行的方案是在
局限性:
误差项
参考文献:Silva J M C S, Tenreyro S. The log of gravity[J]. The Review of Economics and statistics, 2006, 88(4): 641-658. -PDF-
最简单的解决方案是删除零观测值,然后直接用 OLS 估计
局限性:这样做是不可取的,它将改变研究的范围,把重点缩小到
另一种方法是依靠适用于非正值的类对数转换。最受欢迎的是 IHS 或相关的变换。它包括将
这种转换主要是在应用对数函数之前,在响应变量上增加一个正的观察特定值。它与对数函数的相似性可能导致被互换处理。然而,对于
经验上的对应方法产生了一个与泊松伪对数似然估计相当的解决方案 (Gourieroux 等,1984)。这种方法在计算上是有效的,因为它是一个定义明确的凹形问题。这种方法被 Santos Silva 和 Tenreyro (2006) 推广到引力模型中,一般被称为 PPML。它是基于
关于泊松模型的另一个重要考虑是异方差所起的作用。Santos Silva 和 Tenreyro (2006) 得出结论:在异方差的情况下,用 OLS 估计的对数线性化模型的参数会导致对真实弹性的估计出现偏差,并建议使用 PPML 作为解决方案。这个结果并不像它看起来那样普遍。它只在泊松限制条件
局限性:然而,泊松模型有几个缺点:
参考文献:
Cohn J B, Liu Z, Wardlaw M I. Count (and count-like) data in finance[J]. Journal of Financial Economics, 2022, 146(2): 529-551. -PDF- Silva J M C S, Tenreyro S. The log of gravity[J]. The Review of Economics and statistics, 2006, 88(4): 641-658. -PDF- Silva J M C S, Tenreyro S. Poisson: Some convergence issues[J]. The Stata Journal, 2011, 11(2): 207-212. -PDF-
混合模型包括明确地对选择进行建模,
在模型
可以使用
参考文献:
Eaton J, Tamura A. Bilateralism and regionalism in Japanese and US trade and direct foreign investment patterns[J]. Journal of the Japanese and international economies, 1994, 8(4): 478-510. -PDF- Heckman J J. Sample selection bias as a specification error[J]. Econometrica: Journal of the econometric society, 1979: 153-161. -PDF-
迭代普通最小二乘法 (iOLS) 旨在解决零的对数问题。该方法是在结果中加入一个特定的观察值,而不是一个常数,这个常数是用一个超参数缩放的。这个参数控制着用于估计的基本时刻条件,可以由用户选择,也可以使用模型选择方法由数据驱动。
可接受的时刻条件范围形成一个连续体,其极限分别对应于对数线性模型和泊松模型中使用的限制。模型选择程序相当于找到超参数值,使模型所隐含的零观测的条件概率与数据一致。
该方法使用 Dominitz 和 Sherman (2005) 提出的渐进理论研究 iOLS (和 i2SLS) 的理论属性,包括一致性和渐进正态性。估计值对应于 (渐进的) 收缩映射的固定点,它是通过反复运行 OLS (或 2SLS) 来解决的。
假设
这种转换后的因变量对应于
优势:
与其他方法对比:
该方法贡献通过数字模拟和 Michalopoulos 和 Papaioannou (2013) 以及 Santos Silva 和 Tenreyro (2006) 的 (部分) 复制来说明。前者通过使用流行的固定方法来解决零的对数问题,研究了殖民前民族制度对经济发展的作用,而后者则普及了使用伪泊松最大似然法 (PPML) 来估计贸易中的引力模型。该方法在两次复制中都产生了合理的、有根据的估计值,而 PPML 的估计值则被发现与观察到的零点模式在外部上是不一致的。
参考文献:
Bellégo C, Benatia D, Pape L. Dealing with logs and zeros in regression models[J]. arXiv preprint arXiv:2203.11820, 2022. -PDF- Dominitz J, Sherman R P. Some convergence theory for iterative estimation procedures with an application to semiparametric estimation[J]. Econometric Theory, 2005, 21(4): 838-863. -PDF-
Note:产生如下推文列表的 Stata 命令为:
lianxh 对数 heckman, m
安装最新版lianxh
命令:
ssc install lianxh, replace
免费公开课
最新课程-直播课
专题 | 嘉宾 | 直播/回看视频 |
---|---|---|
⭐ 最新专题 | 文本分析、机器学习、效率专题、生存分析等 | |
研究设计 | 连玉君 | 我的特斯拉-实证研究设计,-幻灯片- |
面板模型 | 连玉君 | 动态面板模型,-幻灯片- |
面板模型 | 连玉君 | 直击面板数据模型 [免费公开课,2小时] |
⛳ 课程主页
⛳ 课程主页
关于我们
课程, 直播, 视频, 客服, 模型设定, 研究设计, stata, plus, 绘图, 编程, 面板, 论文重现, 可视化, RDD, DID, PSM, 合成控制法
等
连享会小程序:扫一扫,看推文,看视频……
扫码加入连享会微信群,提问交流更方便
✏ 连享会-常见问题解答:
✨ https://gitee.com/lianxh/Course/wikis
New!
lianxh
和songbl
命令发布了:
随时搜索连享会推文、Stata 资源,安装命令如下:
. ssc install lianxh
使用详情参见帮助文件 (有惊喜):
. help lianxh