FAQs答疑-2021寒假-Stata论文班-Day3-江艇

发布时间:2021-02-04 阅读 2603

连享会·课程答疑


Stata 论文班-Day3,任课老师:江艇

Update: 2021/2/4

⭕ 课程主页:https://gitee.com/arlionn/PX
板书和答疑

Stata连享会   主页 || 视频 || 推文 || 知乎

温馨提示: 定期 清理浏览器缓存,可以获得最佳浏览体验。

New! lianxh 命令发布了:
随时搜索连享会推文、Stata 资源,安装命令如下:
. ssc install lianxh
使用详情参见帮助文件 (有惊喜):
. help lianxh

课程详情 https://gitee.com/arlionn/Course   |   lianxh.cn

课程主页 https://gitee.com/arlionn/Course


Q1. 江老师您好,能否从潜在结果分析框架的角度,把断点回归和合成控制法理解成作为寻找其他个体的潜在结果,把双重差分理解成作为寻找同一个体其他时期的潜在结果?谢谢。

A: (1) 在潜在控制组模型下,RDD模型由于无法观测到临界值两端样本的潜在结果,因此当我们将带宽限制在某一范围内是,近似认为我们实现了样本的随机分配,能够使用控制组的可观测结果近似替代处理组的潜在结果。(2) 合成控制法在估计处理组的潜在结果时,是通过对潜在控制组的加权平均的方式得到的。其条件是干预前时期处理组与潜在控制组的变动轨迹能够很好的拟合。

Q2. 江老师您好,我举一个例子来说明一下疑惑,如果树木身高为(Y),光照时间为(D),土壤的肥力、湿度、品种等为X(向量),如果这里的X对D没有影响,那么在回归中,就不需要控制,但是用潜在结果框架来看,需要按照X来分组,这里是否意味着控制了X,如果是这样不就和回归矛盾了吗?

A: 如果X对D没有影响,那就不需要控制X,潜在结果框架没说非得控制X。 回归中控制X一个原因是X可能对Y有影响,控制X会提高回归拟合程度。

Q3. 请问老师,因果推断框架有一个SUTVA假设(即稳定性假设),该假设要求不同个体的潜在结果间不会有交互影响。如果研究一项政策对企业市场份额的影响,在短期内总市场份额是不变的,一个企业的份额增加,意味着另一个企业市场份额减少,这是不是违背了SUTVA假设?是否能在因果推断框架下进行研究?

A: 是的,确实违反了SUTVA假设。对SUTVA假设的间接检验没有系统的方法,需要具体问题具体分析。比如可以参考讲义第180页的示例15获得一些灵感。

Q4. 老师,协变量匹配时,协变量怎么选择呢?

A: 可参考讲义第126页,"匹配方法操作细节"的内容。

Q5. 请问老师,在协变量和PSM匹配中,一配几,这个如何选择呢

A: 这个没有一定之规,要具体问题具体分析。如果让我来选择,我会遵循这样的原则:匹配个体越多,意味着匹配样本的变动性和信息含量越大,但可能会导致匹配质量下降,所以我会选择在保证匹配质量的前提下尽量多地设定匹配个体。

Q6. 匹配中,放回和不放回,一配一和一配多的适用情况有何区别?

A: 后半个问题的回答见Q5,前半个问题的回答和Q5的精神是一致的,放回则有可能匹配样本的变动性和信息含量下降,不放回则有可能匹配质量下降,要找到适当的平衡。

Q7. 请问老师,既然作为非参数估计的匹配和加控制变量的线性回归效果是一样的,那我们为什么还要做匹配呢?谢谢老师。

A: 参见讲义第124页对匹配方法何时适用的讨论。

Q8. 倾向得分值相同的控制组有两个样本,那这两个样本该怎么选择呢?"

A: 对于1对n匹配,可以用核匹配构建两个样本的权重,使用哪一种具体核密度函数没有先验的结论。

Q9. 老师,1比2匹配的话,样本量是不是相较处理组会增加两倍呢?

A: 不一定。和是否放回有关。

Q10. 请问老师,协变量匹配的平衡性是不是比倾向得分匹配好?

A: 两种匹配方法的平衡性效果不存在先验的结论。有一些检查平衡性的方法,除了课上讲的normalized difference指标,还有诸如pstest 命令等。

Q11. 江老师你好,我现在在跟导师做一个关于保护区设立对农户收入影响的研究,但由于保护区的成立是在较早的时间,而相关数据的获取是在近两年,所以没有办法使用差分方法来对保护区成立的前后进行比较,但今天听了老师的课后,我觉得可以使用保护区内外的农户数据进行配对,然后进行匹配估计,想问问老师除了PSM之外还有什么方法对农户收入进行一个较好的估计呢?同时为了更准确的匹配,老师觉得使用哪种匹配方法比较好呢?

A: 匹配方法一般分为以下三类:(1) 以协变量X本身作为匹配对象的方法称为协变量匹配。类比于分块,协变量X选择越多,分块越细致,因而容易出现组内缺乏变动,即维度诅咒问题。(2) 通过构造处理组和控制组协变量向量的距离指标的近似匹配。(3) 倾向得分匹配。这里您需要根据自己的研究问题确定使用哪种方法进行匹配。

Q12.江老师,您好,匹配方法对于外推预测存在较大偏误问题,我们已经明白了,但是文献中提到的内插偏误较小应该怎么想呢。

A: 非参数匹配方法没有外推问题,我说的是参数方法有时候外推不准确。我不知道在匹配方法的语境下,你说的内插偏误具体是什么意思,是不是需要估计条件平均处理效应?按理说此时非参数匹配方法应该也不存在内插偏误。

Q13. 请问老师,您画的第二个图,为什么没有外推的必要性?

A: 您这个问题,我不太确定是哪一张图。如果您指的是课件P124中的关于由于模型误设引起的外推偏误问题的话,我觉得应该是这样理解的。在第二张图中,尽管处理组与控制组均为非线性形式,但是在整个样本范围内均满足共同支撑的要求,因此采用非参数估计方法的到的ATE与使用线性参数法的到的ATE近似相等。没必要外推是因为在这里,处理组和控制组在共同支撑意外部分并不存在样本取值,所以没必要通过线性外推方式预测其对应的“反事实”取值。

Q14. 请问江老师,假设我们有一个截面数据,如果关键解释变量D是虚拟变量,我们对样本中D等于1的比例有什么要求吗?比如样本中只有10%(甚至更少的比例,5%或1%)是D=1,这会影响估计结果的可信程度吗?从另一个方面来问,如果被解释变量Y是虚拟变量,样本中Y=1的比例有类似的要求吗?如果有的话,Y=1在什么范围内比较合适呢?

A: 这个不可能会有什么“要求”,也不会有人先验地就因为数据的分布性质就推翻你统计上显著的结果。很多时候我们是先尝试得到结果,如果结果不如我们的预期,再去找原因,如果最后发现是数据质量的问题,那恐怕就无可奈何了。

不过,你可以参考一下Gary King的相关研究。

Q15. 老师好,关于控制变量的选择上,如果利用一个短期的时间窗口(比如说30天)的日度面板数据(比如现在研究疫情对股票市场影响的文章),研究某一个日度变量对个股日回报率的影响,但是显然一方面公司层面或是宏观层面的日度数据无法获得(至少季报,也就是说同一家公司每个日度观测值控制变量如资产负债率都是所在季度的数据),那这样较短的时间窗口下,这些特质性因素也可以认为是不随时间发生变化。如果我控制个体固定效应,采用固定效应模型估计,消除这些不随时间变化的因素(不再控制其他控制变量),能够说得通呢?xtreg y x,fe roubust

A: 你没告诉我这个日度变量是什么,我没法准确回答。我的意思是,这类问题的标准答案一定是具体情况具体分析,就你目前的描述来看,固定效应模型是最起码的,但在此基础上还值得考虑,是否存在个股层面时变的遗漏变量。

Q16. 江老师好,平时回归做组间系数差异是在原模型中的x乘以dummy 还有再加上一个dummy。1)那did模型做组间系数差异是不是把dummy乘以treat#post再一个dummy?2)有没有相关的did经典文献推荐谢谢老师。

A: 做组间系数差异要用分组变量和核心解释变量做交互。在DID模型中就是把分组变量和treat#post(或相当于这个性质的变量)做交互。这方面文献太多了,比如可以参考讲义第180页的示例15。

Q17. 江老师,您好,我有两个问题:1、多期DID,怎么进行psm的匹配,(即如何从对照组里面找到准确的post点)。2、如何做政策试点与全面实施,这前后的政策效应,该如何运用DID(前期试点没有平行趋势,该如何做?)

A: 1)关于如何匹配,可参考关于多期DID的视频讲解(对应讲义第P180页)。2)如果有明确的全面实施的时点,那还是可以使用标准的DID方法,只要恰当地定义“前后”即可。前期试点没有平行趋势是什么意思?是说没有试点前数据?那就没法做平行趋势检验了。

Q18. 老师,时间趋势和时间固定效应有什么差异呢?还是不太理解。

A: 时间趋势是您之间将研究时间如 T=1,2,3,4,5,6 看做是一个变量加入到回归模型中,而时间固定效应则是通过生成时间虚拟变量的方式加入的回归方程中,以实现对于特定时期的共同冲击的控制。

Q19. 请问老师,平行趋势检验要涵盖整个区间吗?比如区间是-5到+5,平行趋势检验可以检验-2到+5吗?

A: 平行趋势检验的目的是为了间接检验控制组作为处理组“反事实”估计的有效性问题。因此我们更关注的是干预前时期的平行趋势的满足。可以覆盖所有的处理前时期,也可以覆盖一部分处理前时期,而把更远的处理前时期合并为一期。

Q20. 江老师,您好!检验平行趋势采用灵活估计形式,只能以第一期为基准组,还是每期都可以作为基准组?

A: 理论上每期都可以,但一般会选择第一期,或处理的前一期。关于多期did进行平行趋势检验,查看这篇推文介绍 倍分法DID详解 (二):多时点 DID (渐进DID)

Q21. 用DID识别一个政策的影响,数据是state-year-panel,但是因为有些州实施政策的时间早,甚至早于面板数据最早的那一年,就意味着这些实验州没有pre_policy trend。因此在检验平行趋势时,这些州无法做检验。这样的数据问题会对政策估计有什么影响吗?

A: 对于处理时点不一致的数据,在样本期内一直被处理的观测单位实际上是一种特殊的“控制组”,可以参考Goodman-Bacon的研究。

Q22. 通常研究政策影响如果有面板数据,用DID就可以了。但是很多survey data是截面数据,那这种情况下实验组和对照组都看不到政策之前的数据。这种情况下可以从政策之前的截面数据中match到类似的个体作为实验组和对照组的pre-policy 数据再按照DID来研究政策影响吧?应该如何实操呢?

A: 这相当于是混合横截面数据的DID研究,模型的构造和面板数据类似,惟一的区别是没法控制个体固定效应,但也许可以控制比个体层级略高的固定效应。

Q23. 江老师好,在研究某政策影响被解释变量的双重差分模型中,同是也发生了其他事件,此事件也会对被解释变量造成挺大影响,此时应该怎么剔除这种内生性?

A: 如果这个混淆事件对相同的处理组在相同的时点上产生了影响,那是无法剔除的,如果不是完全重合,那可以构造这个混淆事件的DID项,也放到回归模型中去,看会不会削弱原DID项的效应。

Q24. 老师能否把上课提到的计量经济学的书都列一下?

A: 1)入门教材:Wooldridge, Jeffrey. Introductory Econometrics: A Modern Approach. Cengage Learning, 2012. Stock, James H., and Mark W. Watson. Introduction to Econometrics. Addison-Wesley, 2011. 2)进阶教材:伍德里奇的《横截面与面板数据的计量经济分析》;3)应用计量:安格里斯特、皮施克的《基本无害的计量经济学》;和《精通计量:从原因到结果的探寻之旅》

Q25. 老师好,想问一下昨天课堂上讲的altonji系数稳定性理论中,gama的一致性估计为什么需要beta=0?若beta不等于0,尽管D与扰动项相关,但X与扰动项不相关,不也能够得到gama的一致性估计吗

A: 不能。D与扰动项相关会影响X的系数的一致估计,哪怕X与扰动项不相关。

Q26. 江老师昨天讲到selection ratio, 想请问老师在估计Restricted regression(即包含部分控制变量X1的回归)中核心解释变量系数时,哪些变量应该放在X1中呢?有什么讲究吗?

A: 具体情况具体分析。可以是一些“寻常的”控制,也可以是一些“关键的”控制。

Q27. 请问江老师,因为最近一直在研学习中介效应,想请问您对中介效应的看法,谢谢老师。

A: 与论文班主题不相关,恕不提供全面的回答,请参见对Q31的回答。

Q28. 请问老师,存在U形关系的中介效应吗?比如A到B理论上为正向的线性关系,B到C理论上为倒U关系,可以做以B为中介的A到C的倒U关系吗?感觉老师比较批评目前中介效应的做法,可以简单讲讲原因吗?或者给一些进一步阅读材料也可。

A: 与论文班主题不相关,恕不提供全面的回答,请参见对Q31的回答。

Q29. 请教老师:期间有关于提高学生身体素质的学校层面的强制执行的落地政策,分别是1997年,2007年及2017年颁布的政策,全国31个省同时执行。三个政策一直没有中断,即1997-2007年实施1997年颁布的政策, 2007—2017实施1997年和2007年的政策,2017-2021三个政策都在执行,老师,假如研究期间没有其他重要政策进来,请问用什么方法可以做出比较干净的单个政策的政策效应?具体用什么方法?如果无法做出单个政策的政策效应,那么如何做出比较干净的政策联合效应?具体用什么方法?感觉老师讲的所有政策研究方法都不适合我的这个研究。我是按照一下方法做的做的,但是我知道这不是好方法。xtreg lnweight lnGDP P90 P97 P07 yr*, fe robust其中(P90 = 1, if year >1990;P90 = 0, if not. P97 = 1, if year >1997; P97 = 0, if not.P07 = 1, if year >2007; P07 = 0, if not)?

A: 由于所有样本都同时实施政策,无法采用普通的DID方法。如果不同地区政策实施强度不同,可考虑构建强度DID来进行政策评估。你当前的这个做法没法分离政策效应和其它宏观趋势的影响。

Q30. 请问老师在面板数据中如何控制pre- treatment的控制变量呢?另外一个问题是如果政策是城市层面,是否控制企业固定效应呢?谢谢老师!

A: 1)如果这个pre-treatment 变量不是时变的,那么可以考虑控制它和时间固定效应的交互项。2)不能,此时核心解释变量会和企业固定效应共线。

Q31. 老师可否简单讲一下channel 分析的一般做法?把可能的渠道同时放进基准方程吗?谢谢?

A: 取决于channel是什么意思。文献中其实对channel和mechanism的用法比较混乱。借用大家可能比较习惯的术语,我喜欢把调节叫做mechanism,把中介叫做channel。mechanism的一般做法就是交互项模型。channel的一般做法有两个,一个是像第一讲的文章那样,把竞争性的channels同时放入回归。第二个是找到刻画channel的变量(也就是大家喜欢叫的中介变量),然后用这个变量对核心解释变量回归。

Q32. 请问老师,直接控制虚拟变量的估计和带有交互项的did估计有什么区别呢?

A: 比较讲义第117页和第119-120页。

Q33. 请问老师做iv-oprobit的命令是否是cmp?

A: 听说是。

Q34. 近邻1:4匹配后,weight值是非整数,再做did回归,如何把weight值考虑进去呢? 对照组和控制组weight值分别应该如何处理?

A: 用加权回归的选项[aweight=weight]

Q35. 老师您好,工具变量回归时,可否加入不同的控制变量,因为影响z的cv和影响x的cv不同了?

A: 可以。

Q36. 做回归时,全文必须用一个变量吗?比如计算过度投资时用的tobin1,主回归(过度投资此时为y)用的tobin3?

A: 你的意思是被解释变量Y是用tobin1构造的,而核心解释变量是tobin3?如果tobin1和tobin3很接近,那岂不是用左脚在对右脚做回归?有什么意义呢?

Q37. 江老师好,DID与匹配结合可以用混合截面数据来做吗?

A: 技术上是可以实现的,但我没见过这样的文章。

Q38. 江老师你好,我想再问问Nunn and Qian的那篇文章关于1900年生长率的反事实估计如何求?

A: 对照阅读原文和do文档如何?

Q39. "1.江老师ppt200页说的那个(无需控制X)是什么意思呀;2.DID有严格要求政策前后几期是相同的么?

A: 1)我的意思是X作为协变量的作用在进行匹配和构造权重时已经发挥了,如果匹配质量足够好,在用匹配样本进行参数估计时就不需要再控制X了,当然也有的文章还在控制X。2)没有这个要求。

Q40. 请问老师,因城市而异的时间趋势,和因城市而异的时间固定效应,其经济含义有什么差别?

A: 前者是线性趋势,后者没有线性要求。

Q41. 请问老师,一配多和有放回的匹配是一样的吗?

A: 不一样,一配多是配几个的问题,有无放回是匹配个体可否被重复使用的问题。

Q42. 如果用面板数据,则固定效应和DID的区别是?

A: 从本质上说,没有区别,DID无非就是核心解释变量呈交互项特征的特殊的固定效应模型。

Q43. 请教老师,例如,1984-1997年学生耐力素质逐年下降,1997年初中升高中体育考试的政策实施后(全国实施),全国31省学生的平均耐力的下降率逐年降低,直至2005年出现上升的拐点,想做出1997政策对这个拐点产生的作用力,或者说判断拐点产生的主要原因是否是97年的政策,还是说是和经济规律的联合效应。假如1997-2005年间没有其他落地政策。我的做法是 xtreg y lnGDP(provincial-level) lnGDP平方项 P97 yr*, fe robust,请问老师有更好的方法吗?

A: 我不了解这个政策的细节,但你当前的做法是不可行的,因为P97和yr*是共线的。一般原则是,如果政策是普遍实施的,还是要去构造政策实施强度的指标,生成横截面的变动性。

Q44. 请教老师,很多动态面板数据在面板数据中都占不小比份在介绍,但是大量阅读外文文献却没有看到用动态面板数据,难道只是因为后置项这个工具变量就在原始数据中,很容易获取的原因吗?还是说有其他原因?因为我在想只要能解决内生性问题就是好的工具变量,正所谓白猫黑猫只要抓到老鼠就是好猫,为什么一定要偏向于比较难获取的工具变量呢?

A: 你只要去深入了解动态面板模型的识别假设,就知道它为什么并不受欢迎了。1)它要求当期的D和过去的D相关,这种相关性很可能是弱的。2)它要求和当期D和未来的ε不相关,但因为预期的因素,很可能是相关的。3)它要求ε没有序列相关性,这不太可能。 Y=α+βX1+γX2+ε

Q45. 请教老师,面板数据做回归,需要做出年龄,性别等个体效应值,因此不能用FE,请问老师RE和OLS 我应该选择哪一个?为什么?

A: 非要得到个体层面变量的估计的话,建议控制比个体稍高层级的固定效应。

Q46. 面板自向量回归(PVAR)模型中的格兰杰因果(双向因果)与GMM估计后存在内生性问题(反向因果)的区别是啥?能否存在一篇论文中,有点不太理解这两个点,谢谢。

A: 格兰杰因果不是这门课所说的因果,而是预测意义上的,即一个因素的变动是否可以预测另一个因素的变动。所以这是两种不同的方法论,不会出现在同一篇论文中。

相关课程

免费公开课

最新课程-直播课

专题 嘉宾 直播/回看视频
最新专题 文本分析、机器学习、效率专题、生存分析等
研究设计 连玉君 我的特斯拉-实证研究设计-幻灯片-
面板模型 连玉君 动态面板模型-幻灯片-
面板模型 连玉君 直击面板数据模型 [免费公开课,2小时]
  • Note: 部分课程的资料,PPT 等可以前往 连享会-直播课 主页查看,下载。

课程主页

课程主页

关于我们

  • Stata连享会 由中山大学连玉君老师团队创办,定期分享实证分析经验。
  • 连享会-主页知乎专栏,700+ 推文,实证分析不再抓狂。直播间 有很多视频课程,可以随时观看。
  • 公众号关键词搜索/回复 功能已经上线。大家可以在公众号左下角点击键盘图标,输入简要关键词,以便快速呈现历史推文,获取工具软件和数据下载。常见关键词:课程, 直播, 视频, 客服, 模型设定, 研究设计, stata, plus, 绘图, 编程, 面板, 论文重现, 可视化, RDD, DID, PSM, 合成控制法

连享会小程序:扫一扫,看推文,看视频……

扫码加入连享会微信群,提问交流更方便

✏ 连享会-常见问题解答:
https://gitee.com/lianxh/Course/wikis

New! lianxh 命令发布了:
随时搜索连享会推文、Stata 资源,安装命令如下:
. ssc install lianxh
使用详情参见帮助文件 (有惊喜):
. help lianxh