⏫NEW-面板数据因果推断:从入门到精通

发布时间:2023-09-01 阅读 1973

Update: 2022.9.1PDF 课纲


目录


0. 课程概览

专题: CIP-面板数据因果推断——从入门到精通

  • 授课安排: 2022 年 10 月 15-16;22-23;29-30 日 (三个周末)
    • 讲授: 9:00-12:00,答疑: 12:00-12:30 ( 6 个半天;每次 3 小时授课,半小时答疑)
    • Note:如此安排,让大家有充裕的时间复习、演练和阅读相关论文。
    • 方式: 网络直播 + 回放
    • 授课方式: 幻灯片+Stata16/17 实操演示,全程电子板书+Stata 演示截图,课后以 PDF 形式分享给学员。
  • 授课嘉宾: 徐轶青 ( 斯坦福大学 CV )
  • 全程答疑: 20 位经验丰富的助教,答疑文档公布于 课程主页
  • 课程主页: https://gitee.com/lianxh/CIP
  • 备讲论文: 点击查看/下载
  • 报名链接: http://junquan18903405450.mikecrm.com/lgGhkTZ
  • 回放安排
    • 10 月 15-16 日课程回放:10 月 17-31 日 (15天)
    • 10 月 22-23 日课程回放:10 月 24 日-11 月 7 日 (15天)
    • 10 月 29-30 日课程回放:10 月 31 日-11 月 14 日 (15天)

1. 课程缘起

基于面板数据 (Panel Data) 的因果推断方法是目前实证分析的主流方法,更新速度非常快。尤其是与倍差法 (DID) 相关的方法,在近五年中发生了近乎革命性的变化。比如,DID 中应用最为频繁的双向固定效应模型 (TWFE) 便颇受质疑。

对于诸多普通的研究人员来讲,这些革命性的变化可能导致那些基于传统方法得到的结果不再可信,甚至被完全否定。与此同时,各类新方法不断涌现,伴以复杂的推导和证明,导致我等「功底不深」的大众无所适从,但审稿人似乎更喜欢以这些新方法为基础提出问题,这让我们陷入更为茫然的境地。

为此,我从去年 9 月份便开始与徐轶青老师沟通,尝试通过几天的专题课程精讲这些方法,并结合一些经典论文来展示这些方法的应用。期间徐老师先是忙于修改几篇重磅论文,随后又被邀请在人气爆棚的 杜克-西北大学因果推断工作坊 讲授 Advanced Causal Inference 专题。同台布道的有大名鼎鼎的 伍德里奇 教授和因果推断大牛 Christian Hansen 教授。虽然徐老师多次自谦地表示自己是「凑数」的,但一个不争的事实是:他在面板数据因果推断 (Causal Inference with Panel Data, CIP) 方面的研究成果和教学表现,已经受到了广泛的关注和认可。

尽管我们这个专题课程酝酿了一年多才推出,但我却觉得这个略显漫长的等待是有价值的。因为,本次课程的内容,是以徐老师在「杜克-西北大学」工作坊的授课内容基础上进一步优化而来的。除此之外,徐老师还精心挑选了 6 位助教,对课件和讲义进行了细致的校对和翻译。

徐老师说:争取把这门课打造成一门深入浅出的精品课程! 我深表赞同!

我在连享会的助教群中发布了课程通知后,短短半天时间,就有 26 位同学报名参加本次课程,其受欢迎程度可见一斑。

:dog: 小插曲:我开始时把这门课缩写为「PC」,即 Panel Data Causul Inference;徐轶青老师建议用「CIP」,因为 Causul Inference with Panel Data 更规范一些。

by 连玉君 (连享会课程负责人)

2. 授课嘉宾

徐轶青,斯坦福大学政治学系助理教授 (CV)。北京大学中国经济研究中心 (现国家发展研究院) 硕士、麻省理工学院 (MIT) 政治学系博士。徐老师曾在国际政治学各大顶级期刊发表论文,如 American Political Science Review (APSR)、American Journal of Political Science (AJPS)、Journal of Politics (JOP)、Political Analysis (PA),也曾在经济学杂志如 Journal of Development Economics (JDE) 发表文章。根据谷歌学术统计,截至 2022 年 8 月,他的引用数已达到 3,446,h-10 指数为 19。

徐老师已获得多个专业奖项,如 John Williams 最佳博士论文选题奖 (2014)、Malcolm Jewell 最佳研究生论文奖 (2015)、AJPS 年度最佳论文奖 (2016)、PA 年度编辑推荐论文奖 (2017)、PA 年度最佳论文奖 “The Miller Prize” (2018、2020)。他还是多家政治学、经济学 (如 Econometrica、QJE、AEJ、JDE、JoE) 和统计学 (如 JASA、JRSS) 顶级期刊的审稿人。

近年来,徐老师主要研究基于面板数据的因果推断问题,在学术发表之外,他与合作者开发了多个 RStata 软件包,包括:panelViewgsynthfecttjbalbpCausalinterflex 等等。他曾多次应邀在著名的「杜克-西北大学因果推断工作坊」(2018、2019、2022) 讲授面板数据因果推断专题。

3. 为什么要学习这门课?

近年来,因果推断在经济学、政治学等社会科学领域大行其道。由于进行随机实验的难度较大,采用观察性数据 (observational data) 进行因果推断仍是社会科学研究的主流,而这其中尤以面板数据 (panel data) 应用最广,主要有如下三个原因:

  • 其一,在 “大数据” 时代,面板数据越来越容易获得;
  • 其二,工具变量、断点回归等 “自然实验” 法对研究设计的要求较高,很多研究中并不能找到合适的工具变量或断点;
  • 其三,面板数据兼具时间和空间两个维度,使其在因果推断中具有独特优势。

2000 年以来,使用面板数据进行因果推断的方法论经历了几轮革新和演进。先是固定效应和随机效应模型并驾其驱,继而是倍差法 (DID) 的异军突起以及双重固定效应 (TWFE) 模型的大行其道,接着是合成控制法 (SCM) 的兴起,再到过去 5 年以来对于 DID 和 TWFE 的大规模反思 (后文简称「大反思」)。在诸多方法面前,研究者常常感到无所适从。

这门短课程的一个主要目的就是讲清楚这些方法的来龙去脉。我将采取 先「正着讲」,再「反着讲」 的授课方式。

所谓 「正着讲」 是指,先把「大反思」之前与 DID 和 TWFE 相关的各类估计方法、应用细则梳理一遍,使刚接触这些方法的学员能够追赶上目前国际、国内期刊的主流方法论。

所谓 「反着讲」 是指,将这轮「大反思」到目前为止的前因后果与学员交待明白,进而引导学员使用一些好用的方法来直接回应这轮反思中出现的各类批评。

为此,我力求将三天的课程设置成一个比较完整的体系,并达到以下 教学目的

  • 第一,希望学员经过 6 个半天的学习 (尚需另外花费 1-2 个月的时间演练吸收),能对目前国际、国内主流的面板数据因果推断方法有所掌握,能读懂多数期刊论文中使用的相关方法;
  • 第二,紧跟学术前沿,至少从直觉上明白最新的方法要解决的问题、执行思路;
  • 第三,在研究中能够上手实操,合理应用上述方法。

为此,本次课程突出 两个特点

  • 一方面,我会尽力把基础知识讲解透彻,进度上不求快,并尽可能回答学员们的问题;
  • 另一方面,我在每个专题中都会提供几篇比较经典的论文,展示这些方法的合理应用。

内容安排上,基本上遵循了由浅入深、循序渐进的原则。

第 1 讲“正着讲”。介绍经典倍差法 (DID) 的历史、和它被引入经济学的过程。介绍 DID 的前提假设、估计方法,及其估计量的性质。在 2x2 DID 的基础上,拓展到适合多期数据的经典多期 DID 法 (注意,此时所有干预组获得干预的时间是一样的)。介绍这种情况下,如果利用交叉项回归获得动态效应图,并基于此图判断“平行趋势”假设的可靠性。讨论经典 DID 模型估计结果不确定性的来源和潜在影响。本讲中,我们将以 Card & Kruege (1994) 和 Sances (2016) 为主要的案例,并学习相关代码。

第 2 讲 介绍双重固定效应 (TWFE) 模型,包括它的假设、估计方法和性质。理解为什么在 强参数假定 下,TWFE 是 DID 的拓展,并可以用来估计交错 DID 或更一般情况下干预的因果效应。学习如何使用动态设计 (dynamic specification) 来估计动态效应,并由此判断“强外生性”的可靠性。介绍如何在 TWFE 模型中控制时间趋势和因为 (不随时间变化的) 协变量造成的趋势差异。

介绍 TWFE 的多个拓展,包括如何使用连续的干预变量,如何将 DID 的思路应用于截面数据 (如问卷调查),如何估计所谓的“广义”的 DID (以及如何做稳健性检验),如何使用三重差分 (triple-differences) 估计因果效应的异质性。本讲将使用 Bleakley (2010) 和 Cao, Xu & Zhang (2022) 作为主要案例,并学习相关代码。

第 1-2 讲所涵盖的内容,目前仍然是国际、国内应用研究的主流方法。

第 3 讲 讨论近年来对 DID 的反思和“平行趋势”假设的更深入的理解。本讲包含三个部分:(1) 再次讨论如何在 DID 中引入不随时间变化的协变量;(2) 介绍如何将匹配、加权法与经典 DID 结合起来;(3) 介绍双重稳健估计量的涵义和应用。本讲以 Truex (2014) 为主要案例,并学习相关代码。

第 4 讲 开始 “反着讲”。重新审视 TWFE 的识别假设,理解三种违反识别假设的情况。其中,会重点讲解因果效应存在异质性的后果。我将通过讲授两篇理论计量论文 (Goodman-Bacon (2021) 和 de Chaisemartin and D’Haultfœuille (2020)) 和一篇实操应用论文 (Stevenson & Wolfers (2006)) 的方式,引导大家深入理解因果效应异质性对于交错型 DID 模型无偏性估计的影响。

第 5 讲 介绍五种新的估计量,包括 interaction weighted (交互加权法) 、csdidpanelmathdid_mimputation method (插补法)。讲解他们的异同;手动实现交互加权法和插补法;讲解如何使用新的估计和诊断工具。本讲以 Grumbach & Sahn (2020) 和 Christensen & Garfias (2021) 作为主要案例,并学习相关代码。

第 6 讲 介绍合成控制法 ( SCM )。本讲将重点介绍 SCM 的基本原理、前提假设和估计方法,讨论 SCM 的优点和主要缺陷。在此基础上,介绍文献中对 SCM 的几种改进思路,并就其中两种方法 (ASCM 和 SDID) 进行深入讲解。 在这一讲中,我们将使用 ADH (2010)、ADH (2015) 以及 Cao & Chen (2022) 作为主要案例,并学习相关代码。

第 7 讲 最后一讲着重讲解 潜因子法。该方法既可以视为插补法的拓展,也可以视为单位时间趋势的拓展,它还和 SCM 有紧密的联系。我们将介绍基于交互固定效应的潜因子法、矩阵填补法 (matrix completion),以及基于贝叶斯框架的潜因子法,并讨论他们的优缺点。本讲使用 Xu (2017)、Fouirnaies and Mutlu-Eren (2015),以及 Qian, Vreeland & Zhao (2022) 作为主要案例,并学习相关代码。

4. 专题介绍

T1. 倍差法 (DID) 追本溯源

  • 经典 2x2 DID:假设与估计
  • 适合多期数据的经典 DID
  • 动态效应的估计
  • 不确定性的估计
  • 重点分析:Card & Kruege (1994):最低工资和就业
  • 论文重现:Sances (2016):税务官和房地产税
    • Card D, Krueger A B. Minimum wages and employment: a case study of the fast-food industry in New Jersey and Pennsylvania[J]. American Economic Review, 1994, 84(4): 772-798. -PDF-
    • Sances, Michael W. The distributional impact of greater responsiveness: Evidence from New York towns. Journal of Politics, 2016, 78(1): 105-119. -PDF-

T2. 双重固定效应 (TWFE) 模型

  • 模型的设定、假设和估计
  • 阐释:强参数假定下对 DID 的拓展
  • 使用 TWFE 估计动态效应
  • 使用 TWFE 控制协变量造成的趋势差异
  • 拓展 1:连续的干预变量
  • 拓展 2:应用于截面数据的 DID
  • 拓展 3:“广义”的 DID
  • 拓展 4:三重差分法分析效应异质性
  • 论文重现:Bleakley (2010):根除疟疾
  • 论文重现:Cao, Xu & Zhang (2022):宗族与饥荒
    • Bleakley H. Malaria eradication in the Americas: A retrospective analysis of childhood exposure[J]. American Economic Journal: Applied Economics, 2010, 2(2): 1-45. -PDF-
    • Cao J, Xu Y, Zhang C. Clans and calamity: How social capital saved lives during China's Great Famine[J]. Journal of Development Economics, 2022, 157: 102865. -PDF-

T3. DID 与匹配或加权

  • 对 DID 假设的深入理解
  • DID 与协变量:再讨论
  • 经典倍差法与匹配/加权
  • 双重稳健的估计量
  • 论文重现:Truex (2014):企业人大代表的作用
    • Truex, R. The Returns to Office in a "Rubber Stamp"[J]. American Political Science Review, 2014, 108(2): 235-252. -PDF-

T4. TWFE 的重新认识

  • 对 TWFE 识别假设的再认识
  • 理解因果效应异质性的后果
  • 详细讲解 Goodman-Bacon (2021)
  • 详细讲解 de Chaisemartin and D’Haultfœuille (2020)
  • 论文分析:Stevenson & Wolfers (2006):无过错离婚与女性自杀率
    • Goodman-Bacon A. Difference-in-differences with variation in treatment timing[J]. Journal of Econometrics, 2021, 225(2): 254-277. -PDF-
    • De Chaisemartin C, d'Haultfoeuille X. Two-way fixed effects estimators with heterogeneous treatment effects[J]. American Economic Review, 2020, 110(9): 2964-96. -PDF-
    • Stevenson, Betsey, and Justin Wolfers. Bargaining in the shadow of the law: Divorce laws and family distress. Quarterly Journal of Economics, 2006, 121(1): 267-288. -PDF-

T5. 对异质性稳健的新估计量

  • 五种新的估计量及其异同
  • 手动实现交互加权法和插补法
  • 使用新的估计和诊断工具
  • 论文重现:Grumbach & Sahn (2020):少数族裔候选人的动员能力
  • 论文重现:Christensen & Garfias (2021):明晰产权对税收的影响
    • Grumbach, J. M., & Sahn, A. Race and Representation in Campaign Finance.[J]. American Political Science Review, 2020, 114(1): 1–16. -PDF-
    • Christensen D, Garfias F. The politics of property taxation: Fiscal infrastructure and electoral incentives in Brazil[J]. Journal of Politics, 2021, 83(4): 1399-1416. -PDF-

T6. 合成控制法 (SCM)

  • SCM 的原理、假设和估计
  • SCM 的缺陷及改进
  • ASCM 介绍 (增广合成控制法)
  • SDID 介绍 (合成 DID)
  • 论文重现:ADH (2010):加州烟草法案的效果
  • 论文重现:ADH (2015):德国统一的经济影响
  • 论文重现:Cao & Chen (2022):运河与叛乱
    • Abadie A, Diamond A, Hainmueller J. Synthetic control methods for comparative case studies: Estimating the effect of California’s tobacco control program[J]. Journal of the American statistical Association, 2010, 105(490): 493-505. -PDF-
    • Abadie A, Diamond A, Hainmueller J. Comparative politics and the synthetic control method[J]. American Journal of Political Science, 2015, 59(2): 495-510. -PDF-
    • Cao Y, Chen S. Rebel on the Canal: Disrupted Trade Access and Social Conflict in China, 1650–1911[J]. American Economic Review, 2022, 112(5): 1555-90. -PDF-

T7. 潜因子法

  • 插补框架与潜因子法
  • 矩阵填补法 (matrix completion)
  • 基于贝叶斯框架的潜因子法
  • 论文重现:Xu (2017):投票注册改革和投票率
  • 论文重现:Fouirnaies and Mutlu-Eren (2015):英国央地政治关系和财政转移
  • 论文重现:Qian, Vreeland & Zhao (2022):亚开行设立对世行的影响
    • Xu Y. Generalized synthetic control method: Causal inference with interactive fixed effects models[J]. Political Analysis, 2017, 25(1): 57-76. -PDF-
    • Fouirnaies A, Mutlu-Eren H. English bacon: Copartisan bias in intergovernmental grant allocation in England[J]. The Journal of Politics, 2015, 77(3): 805-817. -PDF-
    • Qian J, Vreeland J R, Wu Z, et al. Compete or Complement? How the World Bank Responds to the Establishment of the AIIB[J]. International Organization, 2022, forthcoming. -PDF-

参考文献

下载所有参考文献:点击此处

  • Abadie A, Diamond A, Hainmueller J. Synthetic control methods for comparative case studies: Estimating the effect of California’s tobacco control program[J]. Journal of the American statistical Association, 2010, 105(490): 493-505. -PDF-
  • Abadie A, Diamond A, Hainmueller J. Comparative politics and the synthetic control method[J]. American Journal of Political Science, 2015, 59(2): 495-510. -PDF-
  • Bleakley H. Malaria eradication in the Americas: A retrospective analysis of childhood exposure[J]. American Economic Journal: Applied Economics, 2010, 2(2): 1-45. -PDF-
  • Cao Y, Chen S. Rebel on the Canal: Disrupted Trade Access and Social Conflict in China, 1650–1911[J]. American Economic Review, 2022, 112(5): 1555-90. -PDF-
  • Cao J, Xu Y, Zhang C. Clans and calamity: How social capital saved lives during China's Great Famine[J]. Journal of Development Economics, 2022, 157: 102865. -PDF-
  • Card D, Krueger A B. Minimum wages and employment: a case study of the fast-food industry in New Jersey and Pennsylvania[J]. American Economic Review, 1994, 84(4): 772-798. -PDF-
  • De Chaisemartin C, d'Haultfoeuille X. Two-way fixed effects estimators with heterogeneous treatment effects[J]. American Economic Review, 2020, 110(9): 2964-96. -PDF-
  • Christensen D, Garfias F. The politics of property taxation: Fiscal infrastructure and electoral incentives in Brazil[J]. The Journal of Politics, 2021, 83(4): 1399-1416. -PDF-
  • Fouirnaies A, Mutlu-Eren H. English bacon: Copartisan bias in intergovernmental grant allocation in England[J]. The Journal of Politics, 2015, 77(3): 805-817. -PDF-
  • Goodman-Bacon A. Difference-in-differences with variation in treatment timing[J]. Journal of Econometrics, 2021, 225(2): 254-277. -PDF-
  • Grumbach, J. M., & Sahn, A. Race and Representation in Campaign Finance.[J]. American Political Science Review, 2020, 114(1): 1–16. -PDF-
  • Qian J, Vreeland J R, Wu Z, et al. Compete or Complement? How the World Bank Responds to the Establishment of the AIIB[J]. International Organization, 2022, forthcoming. -PDF-
  • Sances, Michael W. The distributional impact of greater responsiveness: Evidence from New York towns. The Journal of Politics, 2016, 78(1): 105-119. -PDF-
  • Stevenson, Betsey, and Justin Wolfers. Bargaining in the shadow of the law: Divorce laws and family distress. The Quarterly Journal of Economics, 2006, 121(1): 267-288. -PDF-
  • Truex, R. The Returns to Office in a "Rubber Stamp"[J]. American Political Science Review, 2014, 108(2): 235-252. -PDF-
  • Xu Y. Generalized synthetic control method: Causal inference with interactive fixed effects models[J]. Political Analysis, 2017, 25(1): 57-76. -PDF-

5. 报名和缴费信息

  • 主办方: 太原君泉教育咨询有限公司
  • 标准费用:3800 元/班/人
  • 优惠方案:(以下各项优惠不能叠加使用)
    • 专题课/现场班老学员报名: 9 折,3420 元/人
    • 学生 (需提供学生证/卡照片):9 折,3420 元/人
    • 会员报名: 85 折,3230 元/人
  • 联系方式:
    • 邮箱:wjx004@sina.com
    • 王老师:18903405450 (微信同号);李老师:18636102467 (微信同号)

报名链接: http://junquan18903405450.mikecrm.com/lgGhkTZ

:cat: 长按/扫描二维码报名:

缴费方式

方式 1:对公转账

  • 户名:太原君泉教育咨询有限公司
  • 账号:35117530000023891 (山西省太原市晋商银行南中环支行)
  • 温馨提示: 对公转账时,请务必提供「汇款人姓名-单位」信息,以便确认。

方式 2:扫码支付

温馨提示: 扫码支付后,请将「付款记录」截屏发给王老师:18903405450 (微信同号)

6. 听课指南

6.1 软件和课件

听课软件:本次课程可以在手机,ipad ,平板以及 windows/Mac 系统的电脑上听课 (台式机除外)。

特别提示:

  • 为保护讲师的知识产权和您的账户安全,系统会自动在您观看的视频中嵌入您的「用户名」信息
  • 一个账号绑定一个设备,且听课电脑不能外接显示屏,请大家提前准备好自己的听课设备。
  • 本课程为虚拟产品,一经报名,不得退换

6.2 实名制报名

本次课程实行实名参与,具体要求如下:

  • 高校老师/同学报名时需要向连享会课程负责人 提供真实姓名,并附教师证/学生证图片
  • 研究所及其他单位报名需提供 能够证明姓名以及工作单位的证明
  • 报名即默认同意「连享会版权保护协议条款」。

7. 助教招聘

说明和要求

  • 名额: 10 名
  • 任务:
    • A. 课前准备:协助完成 3 篇介绍 Stata 和计量经济学基础知识的文档;
    • B. 开课前答疑:协助学员安装课件和软件,在微信群中回答一些常见问题;
    • C. 上课期间答疑:针对前一天学习的内容,在微信群中答疑 (8:00-9:00,19:00-22:00);
    • Note: 下午 5:30-6:00 的课后答疑由主讲教师负责。
  • 要求: 热心、尽职,熟悉 Stata 的基本语法和常用命令,能对常见问题进行解答和记录
  • 特别说明: 往期按期完成任务的助教可以直接联系连老师直录。
  • 截止时间: 2022 年 10 月 8 日 (将于 10 月 10 日公布遴选结果于 课程主页,及 连享会主页 lianxh.cn)

申请链接: https://www.wjx.top/vm/tURp90R.aspx#

扫码填写助教申请资料:

课程主页: https://gitee.com/lianxh/CIP

关于我们