2022连享会:Stata初级班
目录 [TOC]
连玉君,西安交通大学经济学博士,中山大学岭南学院副教授,博士生导师。已在《China Economic Review》、《经济研究》、《管理世界》、《经济学(季刊)》、《金融研究》、《统计研究》等期刊发表论文 60 余篇。目前已完成 Panel VAR、Panel Threshold、Two-tier Stochastic Frontier 等计量模型的 Stata 实现程序,并编写过几十个小程序,如 lianxh
, ihelp
, sftt
, winsor2
, xtbalance
, bdiff
, ua
等。连玉君老师团队一直积极分享 Stata 应用中的经验,开设了 连享会-主页,连享会-直播间,连享会-知乎 等专栏,已在微信公众号 (连享会(ID: lianxh_cn)) 分享推文 700 余篇,各平台阅读量逾 1700 万人次。
实证分析中,最伤神和耗时的事情莫过于研究设计和数据处理。在以往的授课中,很多同学和老师都是在听完了高级班的课程以后,又返回头来听初级班的内容。他们有一个共同的感触就是,没有一个扎实的基础,以及对计量经济学和 Stata 整体架构的认识,后续的学习成本会越来越高。
在初级班中,我力求将三天的课程设置成一个比较完整的体系,目的有二:
其一,希望大家经过三天的学习(尚需另外花费 1-2 个月的时间演练吸收),能对基本的统计和计量分析方法有所掌握,能读懂多数期刊论文中使用的分析方法;
其二,希望诸位能建立起 Stata 的基本架构,熟知 Stata 能做什么、如何做?以期为后续学习打下宽厚扎实的基础。
翻阅 Top 期刊上的论文,你会发现多数论文并没有使用非常复杂的方法,关键在于论文的想法或视角比较独特,并使用了恰当的方法来论证。这里的关键在于研究设计,而这在目前的计量教科书中鲜有涉及。为此,本次研讨班突出两个特点:一方面,我会努力把基础知识讲解透彻,进度上不求快;另一方面,我在每个专题中都会提供 2-3 篇比较经典的论文,展示这些方法的合理应用。
在内容安排上,基本上遵循了由浅入深,循序渐进的原则。
第 1-3 讲依序介绍 Stata 的基本用法、数据处理和程序编写,学习这些内容无需太多的计量经济学基础,但对于提高实证分析能力和分析效率,大有裨益。
第 4-5 讲介绍文献中使用频率最高的线性回归模型,包括 OLS 的原理、结果的解释,以及虚拟变量和交乘项的使用等。对于这些内容的深刻理解和熟练掌握,构成了后续多种主流实证模型的基础,例如,目前文献中广泛使用的固定效应模型 (FE),倍分法 (DID),断点回归设计 (RDD) 等方法,本质上就是在传统的线性模型基础上,增加一些虚拟变量或交乘项,配合巧妙的研究设计,来实现对不可观测的个体效应的控制,以及对政策效应的估计。
第 6 讲介绍固定效应模型 (FE),是第 4 讲和第 5 讲内容的延伸和应用,也是目前解决遗漏变量和内生性问题比较常用的方法。
具体说明如下:
在第 1-2 讲中,我会以一篇文章为实例,说明 Stata 的基本语法结构,并对数据处理过程中的关键问题进行介绍,如离群值的处理、文字变量的处理等。就我个人的经验而言,数据处理能力的高低直接决定实证分析的效率,而对于离群值等问题的处理是否妥善会直接影响全文结果的稳健性,是多数人不够重视但却至关重要的问题。此前有不少学完了高级班的同学又回炉初级班,便是感悟到了这一点。
第 3 讲介绍 Stata 编程的基础知识。但凡提及写程序,很多人都会产生恐惧心理,其实,一旦掌握了最基本的原理和语法格式,Stata 中的程序设定并没有想象的那么困难。更为重要的是,对于多数人而言,由于并不需要写完整的 ado 文档,因此只需要学会最基本的条件语句和循环语句即可,难度又会进一步降低。一旦掌握了基本的编程知识和理念,你的实证分析便开始进入「快车道」了。
第 4 讲和第 5 讲介绍实证分析中的模型设定和结果解释问题。很多人会觉得 OLS 很简单,但 Top 期刊中使用最多的仍然是 OLS,如何合理的构建模型、解释结果便成为实证分析中必须掌握的。我精选了大家经常面临的几个专题并结合论文进行讲解,包括:虚拟变量的使用、交乘项的使用和解释、分组回归的合理设定和假设检验,还有在经济学和金融学中相对较新的 R2 贡献度分析。这部分内容构成了进阶学习的重要基础。首经贸的一个博士生前两天发信息给我:「连老师,我发现只要把你初级里面的虚拟变量相关的知识完全掌握,很多复杂的方法就都好理解了,甚至可以自己解决问题。」,我的回复是:「那看来你是把相关的东西基本搞明白了,我每次上初级班的时候会花很多时间讲虚拟变量和交乘项,这构成了双重差分、断点回归、时间中断分析、面板数据模型等一系列模型的重要基础。」
第 6 讲介绍了目前广泛应用的 面板数据模型。由于面板资料的获取越来越方便,目前多数研究中使用的都是面板数据。在讲解这些模型的基本思想和估计方法的过程中,笔者会将重点放在模型含义和应用范围上来。例如,对于同一笔数据而言,何时采用 OLS 进行估计,何时采用 FE 估计?不同的方法之间有何差异和关联?结果背后的经济含义如何解读?掌握这些方法有助于大家合理控制内生性问题,以便得到更为可信的结论。
A1. Stata 简介
A2. 数据处理
A3. Stata 程序
A4. 普通最小二乘法 (OLS)
A5. 模型的设定和解释
A6. 静态面板数据模型
温馨提示:
赠送课程:
A. 我的特斯拉-实证研究设计
B. 动态面板数据模型
C. 我的甲壳虫-论文精讲与重现
赠送方式: 单班报名可在上述课程中选其一,任意两班组合报名可选其二,全程报名全赠。
特别提示:
为保护讲师的知识产权和您的账户安全,系统会自动在您观看的视频中嵌入您的「用户名」信息,每个账号只能锁定一台设备进行观看,以切实保护您的权益。
⏩ 长按/扫描二维码报名:
方式 1:对公转账
方式 2:扫码支付
温馨提示: 扫码支付后,请将「付款记录」截屏发给王老师-18903405450(微信同号)
说明和要求
扫码填写助教申请资料: