连玉君 ,中山大学岭南学院副教授,博士生导师。毕业于西安交通大学金禾经济研究中心,获经济学博士学位。研究方向为公司金融和金融计量,研究兴趣包括公司治理、现金持有、股权质押、投融资行为,成果见诸 Stata Journal、China Economic Review、《经济研究》、《管理世界》、《经济学(季刊)》、《金融研究》、《统计研究》、《世界经济》等期刊,主持国家自然科学基金 2 项。
沙文彪,经济学博士,中山大学岭南学院“百人计划”助理教授、硕士生导师。博士毕业于香港科技大学社会科学部 (导师:Prof. Albert Park),曾在美国加州大学伯克利分校经济学系访问求学 (合作导师:Prof. Edward Miguel)。目前有一篇论文发表于 Journal of Development Economics。
Fisman, R., J. Shi, Y. Wang, W. Wu, 2020, Social ties and the selection of China’s political elite, American Economic Review, 110 (6): 1752-1781. -Link-, -PDF1-, -cited-, -Replication-
Akcigit, U., J. Grigsby, T. Nicholas, S. Stantcheva, 2022, Taxation and innovation in the twentieth century, The Quarterly Journal of Economics, 137 (1): 329-385. -Link-, -PDF-, -Appendix-, -cited-, -Replication-
本专题的目标是通过 1 篇 Top 期刊论文的精讲和复现,辅以 2-3 篇文献的扩展讲解,帮助大家全面认识中国家庭追踪调查 (China Family Panel Studies, CFPS),发掘新的选题。主要包括两部分内容:
T3:CFPS - 认识、清理与论文精讲 (3 小时)
从深入了解 CFPS 数据库入手,包括:CFPS 数据库的结构;涵盖主要问卷和变量;如何清理 CFPS 数据库、转换为面板数据、构造核心变量。用具体的 CFPS 数据与 Stata 代码进行操作讲解。接下来,精讲 Sha (2023) —— 主讲人基于 CFPS 完成并发表在 Journal of Development Economics 上的论文。我会对文章的 idea 的产生、数据分析、论文撰写、投稿以及审稿意见的处理等完整过程进行详细介绍,帮助学员们深入了解如何撰写自己的第一篇应用微观实证文章。实操层面,将介绍如何利用 Stata 和 R 实现文中的模型估计、因果推断和结果可视化展示。
认识 CFPS:数据库结构、主要问卷、核心变量
清理 CFPS:离群值、变量定义、面板构造
讲解 Sha (2023, JDE):估计、检验、内生性和稳健性检验
T4:CFPS - 如何发掘和拓展新的研究主题 (3 小时)
以 T3 为基础,进一步介绍在 Sha (2023) 基础上拓展开的两篇工作论文:Sha (2021) 和 Sha & Zou (2022),以便帮助大家学习如何从 CFPS 中发掘互相关联的研究主题,有序地开展系列研究。为进一步扩展大家的思路,我会介绍 CFPS 数据在不同领域的应用,包括发展经济 (Han et al., 2022)、健康经济 (Zhang et al., 2017, 2018) 和劳动经济 (Fan et al., 2021) 等应用微观领域。
Sha (2023, JDE)的拓展:Sha (2021) + Sha and Zou (2023)
发展经济学领域:Han et al. (2022)
健康经济学领域:Zhang et al. (2017) + Zhang et al. (2018)
劳动经济学领域:Fan et al. (2021)
参考文献:
Fan, Y., J. Yi, J. Zhang, 2021, Rising intergenerational income persistence in china, American Economic Journal: Economic Policy, 13 (1): 202-230. -Link-, -PDF-, Appendix, Replication, -cited-
Han, L., X. Li, G. Xu, 2022, Anti-corruption and poverty alleviation: Evidence from china, Journal of Economic Behavior & Organization, 203: 150-172. -Link-, -PDF-, PDF2
Sha, W., X. Zou, 2022, The political economy of eminent domain: The economic and political effects of housing demolition in china, SSRN 4237524. PDF2
Sha, W., 2023, The political impacts of land expropriation in china, Journal of Development Economics, 160: 102985. -Link-, -PDF-
Zhang, X., X. Zhang, X. Chen, 2017, Happiness in the air: How does a dirty sky affect mental health and subjective well-being?, Journal of Environmental Economics and Management, 85: 81-94. -Link-, -PDF-, PDF2, Appendix
Zhang, X., X. Chen, X. Zhang, 2018, The impact of exposure to air pollution on cognitive performance, Proceedings of the National Academy of Sciences, 115 (37): 9193-9197. -Link-, -PDF-, PDF2, Appendix, -cited-
Day3:基于机器学习的因果推断 + 迁移学习算法
目前多数文献在进行政策评价时主要集中于回答「政策是否有效?」这一问题。然而,更为有趣,也更具挑战性的是「迁移学习问题」。从横截面角度来看,我们需要回答的是“一个在 A 地区成功的政策能否复制到其他地区?”;从时间序列角度来看,我们需要进一步分析“如果某项政策被证实有效,那么在下一轮政策实施过程中,是否可以对现有政策优化?如何优化?”
本专题介绍两类前沿的政策方法:「双重稳健 DID 估计 (DRDID)」和「迁移学习算法」。主要涵盖如下主题:(1) 现行 DID 方法的缺陷以及双重稳健 DID 估计的应用场景、估计方法和结果解读;(2) 如何使用机器学习方法 (ML) 估计 Double-Robust Scores (即处理效应) ,重点集中于 Partial-linear 和 Interaction 两种设定的优势和实操;(3) 迁移学习算法——成功经验的可复制性及其如何在其他地区进行复制。
专题中将精讲 3-5 篇近三年的 Top 期刊论文 (附 R+Stata 代码和复现数据),以便大家了解模型在不同政策情景下的设定和解读方法。作为拓展,我们还将介绍基本模型及其变种在制度经济学、环境经济学、财政以及区域经济学等领域中的应用,以便大家将这些方法「迁移」到自己的研究中去。
各个专题的具体介绍如下:
T5: 双重稳健 DID:DRDID 和 CSDID (2 小时)
概要: 专题 1 讲解首先比较 DID 估计方法中的双重固定效应(TWFE)、结果回归法 (Outcome Regression,OR)和逆倾向得分概率加权法 (Inverse Propesnity Weight Regression,IPW),进而讲解建立在 OR 和 IPW 基础上的双重稳健-双重差分估计 (DRDID, Sant & Zhao (2020)),以及有 Callaway & Sant (2021) 提出的 DRDID 的扩展模型:CSDID。其次,本课程不仅会介绍基于「非平衡面板」和「混合截面数据」的 ATE 估计方法,而且将讨论如何灵活地划分处理组,获得子组事后 n 期等情形的处理效应。如此帮助学员们丰富回归结果。最后,课程将以最低工资政策对青少年就业的数据为例,引导学员们如何利用 Stata 和 R 计算 CSDID 估计量。
回顾 1:TWFE、OR 以及 IPW 的区别和联系
回顾 2:多期 DID - Callaway & Sant (2021), Goodman-Bacon (2019), Athey & Imbens (2018), Sun & Abraham (2020) 估计量的对比和应用场景
双重稳健 DID 模型 (DRDID): Sant & Zhao (2020)
双重稳健 DID 扩展模型 (CSDID):Callaway & Sant (2021)
基于「非平衡面板」和「混合截面数据」的 ATE 和异质性效应
案例:Semenova et.al (2020) , Sant & Zhao (2020) ,Callaway & Sant (2021)
福利:CSDID 的扩展
T6: 机器学习在双重稳健估计中的应用 (2 小时)
在 T5 的基础上,详细介绍 ChernoZhukov et al. (2018) 在 partial linear model/interaction model 设定下的双重稳健估计方法,分别简称为 PL-DRE 和 Int-DRE,并以两种常用的机器学习方法:Lasso 和随机森林 (RF) 为例,讲解如何利用 Neyman 正交和 K 折检验进行误差修正。最后以名刊工程的政策效果估计为例,通过 R 讲解 Lasso 的具体使用方法。
partial-linear model 和 interaction model 中的双重稳健估计
误差修正:Neyman 正交和 K 折检验
机器学习:Lasso 和随机森林 (RF)
福利:“名刊工程”的政策效应 (工作论文)
T7: 迁移学习算法及实现 (2 小时)
针对学员们普遍面对的“政策建议过于空泛”这一问题,介绍 Tian & Feng (2022) 提出的基于广义线性模型的「迁移学习算法」。具体而言,为了更好地判断某地区是否应该实施 A 政策,我们可以充分利用“源数据” (实施过政策 A 的地区数据) ,在此基础上识别政策 A 的对于该地区的可移植性。本讲从广义线性模型入手,讲解如何使用 R 对目标模型由帮助的数据集进行筛选,及如何进行迁移估计。此外,还将帮助学员们可视化地获得各个政策或政策组合的适用范围,提出因地制宜的政策建议和组合方案。最后,将给出迁移学习在雾霾治理中的应用实例。
此外,本课程将结合三个专题的前沿研究分享一系列的福利,主要是关于双重稳健估计及迁移学习算法的应用场景及结果多元化、可视化。
迁移学习算法的由来
广义线性模型(GLM)的介绍
Two-Step Transfer Learning 算法理论及实现
Transferable Source Detection 算法理论及实现
目标系数渐进置信区间 (CI) 的构造
案例:雾霾治理的政策组合效果及路径优化
参考文献:
Athey, S., G. W. Imbens, 2022, Design-based analysis in difference-in-differences settings with staggered adoption, Journal of Econometrics, 226 (1): 62-79. -Link-, -PDF-, PDF2
Callaway, B., P. H. C. Sant'Anna, 2021, Difference-in-differences with multiple time periods, Journal of Econometrics, 225 (2): 200-230. -Link-, -PDF-, PDF2
Chernozhukov, V., D. Chetverikov, M. Demirer, E. Duflo, C. Hansen, W. Newey, J. Robins, 2018, Double/debiased machine learning for treatment and structural parameters, The Econometrics Journal, 21 (1): C1-C68. -Link-, -PDF-, Replication
LaLonde, R. J., 1986, Evaluating the econometric evaluations of training programs with experimental data, The American Economic Review, 76 (4): 604-620. -Link-, [-PDF-], PDF2, -cited-
Sant’Anna, P. H. C., J. Zhao, 2020, Doubly robust difference-in-differences estimators, Journal of Econometrics, 219 (1): 101-122. -Link-, -PDF-, PDF2,
Sun, L., S. Abraham, 2021, Estimating dynamic treatment effects in event studies with heterogeneous treatment effects, Journal of Econometrics, 225 (2): 175-199. -Link-, -PDF-, PDF2
Tian, Y., Y. Feng, 2022, Transfer learning under high-dimensional generalized linear models, Journal of the American Statistical Association: 1-14. -Link-, -PDF-, PDF2, Appendix, -cited-