IV在哪里?奇思妙想的工具变量

发布时间:2021-05-05 阅读 1366

Stata连享会   主页 || 视频 || 推文 || 知乎

温馨提示: 定期 清理浏览器缓存,可以获得最佳浏览体验。

New! lianxh 命令发布了:
随时搜索推文、Stata 资源。安装命令如下:
. ssc install lianxh
详情参见帮助文件 (有惊喜):
. help lianxh

课程详情 https://gitee.com/lianxh/Course

课程主页 https://gitee.com/lianxh/Course

⛳ Stata 系列推文:

PDF下载 - 推文合集

作者:秦范 (四川大学)
邮箱qf13032861571@163.com


目录


1. 引言

「工具变量」是解决内生性问题的重要方法,但要更好发挥工具变量的作用,关键在于找到好的工具变量。为此,本文将进一步巩固介绍工具变量的基本思路,并在此基础上,通过工具变量的经典案例介绍,以为读者寻找工具变量提供启迪。

2. 工具变量的理论背景

2.1 内生性问题

工具变量是解决内生性问题的重要方法之一,那么什么是内生性问题呢?

  • 简单来看,若一个回归方程中含有内生变量,则称该模型存在内生性问题。
  • 其产生原因主要有遗漏变量、反向因果、选择偏误 (样本选择偏误和自选择偏误)、以及测量误差等。
  • 其后果又可分小样本和大样本两种情况讨论。在小样本下,内生变量和外生变量估计系数都有偏。在大样本下,内生变量估计系数不一致。外生变量如果与内生变量不相关,则估计系数一致;如果与内生变量相关,则估计系数也不一致。
  • 其处理方法包括工具变量法、面板数据模型、Heckman 选择模型、Treatment Effect 模型、双重差分法、倾向得分匹配法、RDD 断点回归、RK 拐点回归、合成控制法、结构方程模型等。

2.2 工具变量的思想

由上文可知,内生性问题本质上是误差项中存在与内生变量相关的因素。既然无法通过增加控制变量的方法将这些因素控制,那我们只能将其从误差项中剔除。如何剔除呢?

假设在模型 y=β1+β2x+μ 中,cov(x,μ)0,即 x 为内生变量,μ 中存在和 x 相关的因素,直接进行 OLS 估计将会到导致偏误。如果我们能找到一个理论上不会直接影响 y、且和 μ 不相关,但和 x 高度相关的变量来替代 x 变量加入回归,则能够剔除原模型误差项和内生变量相关的因素。

以教育回报方程为例,在研究受教育程度对工资水平的影响时,通常会遗漏重要的解释变量 “个人能力”,以致于估计出来的系数包含了个人能力对工资的影响。由于 “住在大学附近” 并不能直接影响工资水平,且和误差项中的 “个人能力” 不相关,但是可能会影响个人是否上大学,因此可以用 “住在大学附近” 作为工具变量替换 “受教育程度”。

2.3 工具变量的定义

现在我们来简单总结一下工具变量的定义。假定有一个变量 z ,同时满足如下两个假定时,则称为工具变量 (IV, instrumental variable)。

  • cov(z,μ)=0:工具变量外生性,或称为排他性约束(exclusion restrictions)。表示 z 不与其它影响 y 的无法观测因素相关,并且 z 只能通过影响 x 而影响 y
  • cov(z,x)0:工具变量相关性。x 与 z 高度相关。这一假定可以通过检验模型 x=π0+π1z+u 中的 π1 是否显著异于 0 来判断。

2.4 工具变量的应用

2.4.1 IV 估计

一个内生变量有一个工具变量:工具变量估计量 (IV estimator)。考虑模型 y=β1+β2x+μ,其中 x 为内生变量,z 为工具变量,β^2 可以通过以下方式得到:

此时,用样本数据估计 (矩估计) 上式得到:

一个内生变量有多个工具变量:两阶段最小二乘估计量 (2SLS estimators)。如果一个内生变量有多个工具变量,则每个工具变量都可单独用于估计,工具变量的线性组合也可用于估计。不过,采用所有外生变量的线性组合作为内生变量的工具变量时,估计结果最有效。比如,原模型中有一个内生变量 x 和一个外生变量 z1

假定还有两个被排斥在上述模型之外的工具变量 z2z3,那么最有效的工具变量是:

可以通过 OLS 估计如下模型,估计出 x

再将估计后的 x^ 代入原方程,用样本数据代替总体矩估计未知参数。

多个内生变量。如果有多个内生变量,则被排斥在模型之外的外生变量数至少要与原方程中的内生变量数一样多,这又被称作方程可识别的阶条件 (order condition)。

2.4.2 IV 相关检验

使用的 IV 真的有效吗?比如 “是否住在大学附近” 作为 “受教育程度” 的工具变量,来解释受教育程度对工资水平的影响。在很大程度上,“住在大学附近” 的样本更可能是家庭经济情况较好、以及父母受教育程度都较高,从而也更注重孩子的教育和培养等,这也可能影响工资水平。因此,试图采用工具变量法解决内生性问题,还需要进一步做相关的工具变量检验,具体包括外生性检验、相关性检验、以及内生性检验。可参考以下相关推文:

3. 寻找工具变量的一般思路

工具变量要满足外生性和相关性两个条件,因此寻找工具变量也一般从满足这两个条件出发。常见的寻找工具变量一般思路如下 (根据陈云松 (2012),计量经济圈推文「我的 “工具变量” 走丢了,寻找工具变量思路手册」整理):

  • 气候、地理等自然因素:降雨等气象因素、地势等地理条件是高度随机的,但也会影响某些经济社会过程,从而能够满足外生性和相关性;
  • 历史因素:过去的历史事件一般与当今的社会经济结果无关;
  • 生理现象:生育双胞胎等现象具有较强的随机性。
  • 类似自然实验的外生性政策冲击:政策试点等具有一定外生性,能构成自然实验。
  • 使用更高层级的变量作为低层级变量的工具变量:比如,研究个体金融知识与创业选择时,创业概率与金融知识存在反向因果关系,因而金融知识是内生变量。为了克服内生性,作者选用同一个社区其它居民的金融知识平均水平作为个体金融知识的工具变量。但从这一角度寻找工具变量,往往不能完全保证外生性;
  • 内生变量的滞后项:可参考推文「IV:可以用内生变量的滞后项做工具变量吗?」

4. 工具变量的经典例子

接下来,我们基于寻找工具变量的一般思路,介绍一些经典的工具变量案例。以下内容主要参考陈云松 (2012) 和 PhDHub 推文「有趣的工具变量」,并由编者补充整理。

4.1 气象因素

4.1.1 降雨量

案例一:识别美国劳动市场上移民的网络效应,即墨西哥移民规模是否影响个体就业选择、以及从事非农工作并获得更高收入。但存在以下内生性问题,如移民网络规模可能受到美国劳动市场中不可观测的冲击的影响,正向冲击会吸引更多移民,使得网络效应高估,反之造成网络效应低估。为此,可能的工具变量为移民来源社区的降雨量,主要基于以下考虑:

  • 外生性:墨西哥某社区的降雨量与美国劳动力市场没有直接联系;
  • 相关性:样本所属的墨西哥社区主要从事依赖降雨的农业生产,降雨量会影响社区农业收入进而影响农业预期收入,并最终影响移民决策。

参考资料:Munshi, K. (2003). Networks in the modern economy: Mexican migrants in the US labor market. The Quarterly Journal of Economics, 118(2), 549-599. -PDF-

案例二:经济增长与国内冲突。但存在以下内生性问题,如政府机构质量可能对经济增长和国内冲突都有影响。为此,可能的工具变量为降雨量,主要基于以下考虑:

  • 外生性:降雨量为自然现象,满足外生性;
  • 相关性:研究样本为撒哈拉以南的非洲国家,位于半干旱热带地区,这些国家没有广泛的灌溉系统,主要依赖降雨从事农业生产。因此 ,降雨量增加有助于提高农业生产,从而增加人均经济增量。

参考资料:Miguel E, Satyanath S, Sergenti E. Economic shocks and civil conflict: An instrumental variables approach[J]. Journal of political Economy, 2004, 112(4): 725-753. -PDF-

案例三:儿童看电视的时长对自闭症的影响。可能存在反向因果问题,如儿童长时间看电视更容易有注意缺陷多动障碍等问题,从而提高患自闭症的概率;但有自闭倾向的儿童一旦看电视可能更难以停止看电视,从而有自闭倾向的儿童更可能长时间看电视。降雨量作为工具变量,主要基于以下考虑:

  • 外生性:降雨量与罹患自闭症无直接关系。已有研究认为基因等生理遗传因素是罹患自闭症的主因,空气污染等是环境触发因素。如,Waldman 等 (2008) 研究发现降雨量对自闭症有正向影响,可能的机制是降雨量通过增加室内活动 (如看电视),减少维他命 D 的摄入 (更少的室外活动和阳光),或者一些室内化学物质因素,或者降雨本身带来的化学物质因素等。
  • 相关性:降雨等天气将导致室外运动不能很好开展,因此降雨越多,儿童会花更多时间在看电视等室内活动上。

参考资料:

  • Waldman, M., Nicholson, S., & Adilov, N. (2006). Does television cause autism? (No. w12632). National Bureau of Economic Research. -PDF-

  • Waldman, M., Nicholson, S., Adilov, N., & Williams, J. (2008). Autism prevalence and precipitation rates in California, Oregon, and Washington counties. Archives of pediatrics & adolescent medicine, 162(11), 1026-1034. -PDF-

  • 知乎文章:老姚专栏 | 工具变量思维

4.1.2 逆温现象

案例一:空气污染对体重和肥胖的影响。可能的内生性问题是,空气污染物是经济活动的副产品,存在某些因素同时影响空气污染程度和肥胖,如收入等。逆温现象作为工具变量,主要基于以下考虑:

  • 外生性:逆温现象的形成一般独立于经济活动,满足外生性;
  • 相关性:当上层气温比下层气温高时,则出现逆温现象,此时地表附近的空气污染物不能很好循环,从而加重空气污染程度,因此逆温现象越严重,空气污染越严重。

参考资料:

案例二:空气污染对婴儿死亡率影响。可能存在内生性问题,更富有的城市空气污染程度相对更低,因此即使空气污染,婴儿死亡率也更低。

参考资料:Arceo E, Hanna R, Oliva P. Does the effect of pollution on infant mortality differ between developing and developed countries? Evidence from Mexico City[J]. The Economic Journal, 2016, 126(591): 257-280. -PDF-+-Replication

案例三:空气污染对学生出勤的影响。可能存在内生性问题,一是测量误差,文章使用周边地区空气污染情况作为每个学校的空气污染程度。广州市 12 个区中有 11 个公共污染监测点,所以污染物水平可能因为较少且零星分布的监测点而存在测量误差。模型中加入固定效应可能加大这种典型的测量误差,使得 OLS 估计量向下偏误。二是遗漏变量,如化工厂爆炸等突发灾难可能会提升空气污染水平,同时增加学校缺勤率。

参考资料:Chen S, Guo C, Huang X. Air pollution, student health, and school absences: Evidence from China[J]. Journal of Environmental Economics and Management, 2018, 92: 465-497. -PDF-

案例四:环境污染对心里健康影响。可能存在的内生性问题,一是遗漏变量,如收入、当地经济条件等因素会同时影响空气污染水平和心理健康。二是反向因果,心理健康影响劳动生产力,进而影响经济活动中污染物的排放。三是测量误差,空气质量是定点监测的,可能存在测量误差或人力操纵,导致估计系数向下偏误。

参考资料:Chen S, Oliva P, Zhang P. Air pollution and mental health: evidence from China[R]. National Bureau of Economic Research, 2018. -PDF-

案例五:环境污染对交通事故影响。可能存在的内生性问题,遗漏结构性 (如地区人口密度,道路遍布程度、类型、限速规定等)、季节性或天气相关的因素,而这些因素可能会同时影响交通事故和空气污染程度。

参考资料:Sager L. Estimating the effect of air pollution on road safety using atmospheric temperature inversions[J]. Journal of Environmental Economics and Management, 2019, 98: 102250. -PDF-

4.1.3 风向

案例一:空气污染与犯罪活动。可能存在内生性问题,如遗漏经济活动等同时影响空气污染和犯罪活动的变量。风向作为工具变量,主要基于以下考虑:

  • 外生性:风向相较于犯罪数量、其它可能同时影响犯罪数和空气污染程度的经济变量是外生的;
  • 相关性:如一条东西贯穿的州际道路,当风自南向北吹时,会加重州际道路北边的空气污染程度,而当风自北向南吹时,会加重州际道路南边的空气污染程度。

参考资料:Herrnstadt E, Muehlegger E. Air pollution and criminal activity: Evidence from Chicago microdata[R]. National Bureau of economic research, 2015. -PDF-

案例二:空气污染与医疗成本。可能存在的内生性问题,一是遗漏变量,例如遗漏同时影响污染水平和消费者支出行为的不可观测因素 (如经济条件),以及应对空气污染的回避行为。二是测量误差,居民污染暴露程度应该根据人口加权计算当地污染暴露度,但监测点零星分散难以根据人口分布加权,从而使用空气质量监测数据作为污染暴露程度的代理变量会造成测量误差,并导致估计系数下偏。利用风的特征计算的 PM2.5 浓度作为工具变量,主要基于以下考虑:

  • 外生性:PM2.5 空间溢出浓度预测值使用的因素基本为天气、风、地理特征,具有外生性。在作者构建一个 150 公里范围内的缓冲区并只考虑来自缓冲区以外城市的空气污染来源,则能避免经济活动的空间相关性,从而进一步保障 IV 的外生性;
  • 相关性:PM2.5 浓度与空气污染高度相关。

参考资料:Barwick P J, Li S, Rao D, et al. The morbidity cost of air pollution: evidence from consumer spending in China[R]. National Bureau of Economic Research, 2018. -PDF-

案例三:空气污染与失眠。可能存在内生性问题,一是测量误差,空气质量指标数据并非个体空气污染暴露度,比如个体还可能通过关窗、使用空气清新器等降低个体污染暴露度,可能导致估计系数下偏。二是遗漏变量。风向作为工具变量,主要基于以下考虑:

  • 相关性:中国城市空气污染可能来自周边城市,从而空气污染程度对风向和风速很敏感。空气污染微粒可随风扩散达上千公里,因而风的模式会影响下风口城市的空气污染水平。

参考资料:Heyes A, Zhu M. Air pollution as a cause of sleeplessness: Social media evidence from a panel of Chinese cities[J]. Journal of Environmental Economics and Management, 2019, 98: 102247. -PDF-

4.1.4 空气流通系数

案例一:城市空气污染程度是否影响流动人口在该城市就业。可能的内生性问题是,遗漏不可观测但同时影响城市空气污染和流动人口迁入的变量。空气流通系数作为工具变量,主要基于以下考虑:

  • 外生性:空气流动系数取决于城市当年风速和行星边界层高度,由气象状况和地理条件决定,在控制城市固定效应后,与本地区的人口流入没有直接关系;
  • 相关性:空气流动系数反映影响空气中污染物分散速度的气象条件,空气流通系数越高,气象条件越有助于污染物分散。

参考资料:

  • 孙伟增, 张晓楠, 郑思齐. 空气污染与劳动力的空间流动——基于流动人口就业选址行为的研究[J]. 经济研究, 2019, 54(11):102-117. -Link-
  • Broner, F., Bustos, P., & Carvalho, V. M. (2012). Sources of comparative advantage in polluting industries (No. w18337). National Bureau of Economic Research. -PDF-
  • Hering, L., & Poncet, S. (2014). Environmental policy and exports: Evidence from Chinese cities. Journal of Environmental Economics and Management, 68(2), 296-318. -PDF-
  • 陈诗一, 陈登科. 雾霾污染、政府治理与经济高质量发展[J]. 经济研究, 2018, 53(02):20-34. -Link-

4.2 地理因素

4.2.1 地理距离

案例一:教育对个人收入的影响。可能存在遗漏变量问题,如个人能力。是否在大学附近成长作为工具变量,主要基于以下考虑:

  • 外生性:家附近有大学对个体收入没有直接关系。作者还检验了家庭与大学距离对受教育程度的影响是否受到不同家庭背景的影响而有偏误,结果发现有更低受教育程度的父母的儿童所获得的教育边际回报相近甚至更高;
  • 相关性:对于相对低收入的家庭来说,家附近有大学可能通过影响大学教育成本 (能选择在家住减少费用) 影响个体接受更高教育程度的决策。

参考资料:

案例二:治疗频率与患急性心肌梗塞的年老病人死亡率。可能存在遗漏变量问题,如其它疾病、患病严重度等可能影响病人是否选择接受治疗的因素。采用病人到心脏病医院的距离作为工具变量,主要基于以下考虑:

  • 外生性:病人到心脏病医院的距离与病人健康状态没有直接关系;
  • 相关性:病人到心脏病医院的距离与病人接受治疗的次数正相关。

参考资料:McClellan, M., McNeil, B. J., & Newhouse, J. P. (1994). Does more intensive treatment of acute myocardial infarction in the elderly reduce mortality?: analysis using instrumental variables. Jama, 272(11), 859-866. -PDF-

案例三:国际贸易参与度对经济增长影响。可能存在反向因果问题,如一国经济水平也会影响该国国际贸易参与度。采用一国与其他国家的地理距离作为工具变量,主要基于以下考虑:

  • 外生性:国家地理特征并不受收入、政府政策或其他影响收入的因素的影响。而且,一国的地理特征除了通过影响一国贸易而影响一国收入水平外,很难想到其他影响途径;
  • 相关性:一国与其他国家的地理距离能反映一国贸易总量,比如新西兰与大部分其他国家相距较远从而减少其贸易量,比利时与世界大多数主要国家临近从而贸易量增加。

参考资料:Frankel, J. A., & Romer, D. H. (1999). Does trade cause growth?. American economic review, 89(3), 379-399. -PDF-

案例四:城市贸易开放度对经济增长影响。可能存在以下内生性问题,一是反向因果问题,如城市经济增长可能提升城市贸易;二是测量误差,如出口贸易量的低报造成测量误差。采用与上海或香港的距离作为工具变量,主要基于以下考虑:

  • 外生性:城市地理条件与城市人均收入无关;
  • 相关性:作者通过数据发现不同开放程度反映了到主要港口的难易程度,同时,少量的港口是主要的货物运输出港口,而香港和上海是目前为止国内最大的国际贸易港口,全国近一半的货物都从这两个港口输出。由此,作者根据城市到上海或香港的最近距离作为该城市贸易开放度的工具变量。

参考资料:Wei, S. J., & Wu, Y. (2001). Globalization and inequality: Evidence from within China (No. w8611). National Bureau of Economic Research. -PDF-

案例五:奴隶贸易密集度对信任的影响。可能存在样本自选择问题,如本身不太信任他人更可能进行奴隶贸易,其种族的后裔也更可能不信任他人。采用奴隶贸易时期种族距海岸线的最近距离作为工具变量,主要基于以下考虑:

  • 外生性:可能先祖居住地离海岸线的距离与当今个体样本距海岸线的距离相关,这可能影响当前个体收入进而影响信任度,所以作者进一步控制了当前个体距海岸线的距离,尽可能保证 IV 的外生性。同时,作者使用未发生过奴隶贸易的国家样本,证伪个体距海岸线的距离与其信任水平的正相关关系的存在性,检验了排除性约束;
  • 相关性:距海岸线越近,种族被贩卖的奴隶数量越多。

参考资料:

案例六:科举制度对当代人力资本水平的影响。可能存在遗漏变量问题,如有更多进士的地级市可能具有自然或基因的不可观测的禀赋因素,进而同时影响历史上的进士密度和当今的人力资本水平。采用各地级市到最近印刷原材料 (松木和竹子) 产地的平均河流距离作为工具变量,主要基于以下考虑:

  • 外生性:松木和竹子原产地的地理分布相对外生。作者还做了一系列排除性检验,发现所构建的 IV 与当今经济繁荣程度、农业适宜度等可能影响当代人力资本水平的变量不相关;
  • 相关性:科举是否成功与权威性的儒家经典注释参考书籍和教材可获性密切相关,相关书籍的可获度与地级市和印刷中心的邻近度相关,而印刷中心选址取决于纸墨原材料即松木和竹子的产地,由于这些原材料主要通过河支流运输,则地级市到最近松木和竹子原产地的河流距离与进士密度相关。

参考资料:

4.2.2 河流数量

案例一:邻里区隔对个体教育、就业等影响。可能存在以下内生性问题,一是反向因果,如区隔可能是糟糕的经济表现的结果而非其原因。二是样本自选择,如选择居住在更加区隔的城市的个体可能是更不成功的。采用河流数量作为工具变量,主要基于以下考虑:

  • 外生性:河流数量属于城市的自然地理特征;
  • 相关性:河流数量越多,则区域内的政治边界越多从而有更多的区隔。

参考资料:Cutler, D. M., & Glaeser, E. L. (1997). Are ghettos good or bad?. The Quarterly Journal of Economics, 112(3), 827-872. -PDF-

案例二:学区可选择度对学校效率的影响。可能存在内生性问题:一是遗漏变量,如民族异质性更大学区需求更多,如果民族异质性不能完全控制,且对学校效率有直接影响,则会造成偏误。二是反向因果,学校效率可能也会影响可观测的学区可选择度。比如一个教育市场中可能有一个学区管理系统效率很高,则其他校区可能会与它合并,从而减少可观测的学区可选择度。采用小河数量作为工具变量,主要基于以下考虑:

  • 外生性:小河数量本身与学校效率没有直接关系;
  • 相关性:小河数量反映学区之间的自然分割。因为早期学区选址最重要的因素之一是学生到学校的时间,而小河等自然障碍会显著增加到学校的时间。因此,给定时间和空间范围,学区数量是自然障碍数量的递增函数,而小河数量是最常见也是容易量化的自然障碍类型。

参考资料:Hoxby C M. Does competition among public schools benefit students and taxpayers?[J]. American Economic Review, 2000, 90(5): 1209-1238. -PDF-

案例三:清末废除科举对革命参与的影响。可能存遗漏变量问题,如在科举废除后,政府仍会任免官员,一些遗漏变量可能既影响任职,又与科举名额正相关。采用小河数量与总长度之比作为工具变量,主要基于以下考虑:

  • 外生性:河流数量可能在影响县的数量的同时,也影响经济发展的其它因素,因此为满足外生性,作者不考虑河流主干,使用小河数量与总长度之比作为工具变量;
  • 相关性:对于人口规模相同的两个地级市 (prefectures),如果县的数量越多则科举名额越多 (因为科举是从县开始逐步配额的)。县城一般沿河而建,而一个县城内有数量众多的河流只会加重税收等管理成本。因此,可以推测给定长度的河流数量与县的数量正相关。

参考资料:Bai Y, Jia R. Social Mobility and Revolution: The Impact of the Abolition of China’s Civil Service Exam System[R]. working paper, 2014. -PDF-

4.2.3 自然灾害

案例一:城镇持高中以上学历且同一出生序列的男性占比对某出生序列的女性是否高中毕业的影响。可能存在内生性问题,一是遗漏变量,如同一班级学生的父母平均受教育水平可能影响班级的学习表现。二是反向因果,如一些同学可能会帮助另一些同学,则减少老师的时间并用于帮助更需要帮助的同学,由此男性高中毕业情况和女性高中毕业情况可能存在联立相关。采用该城镇是否受地震影响并免除男性服兵役义务作为工具变量,主要基于以下考虑:

  • 外生性:由于女性不用服兵役,地震并不直接影响女性升学决策。虽然可能存在以下两点担忧,第一,地震影响当地的经济生活,比如学习临时关闭、房屋损毁、失业等,这种自然灾害或者随后的财政援助都可能对女性上学决策有直接影响。第二,免除服兵役义务可能和其它一些特殊的出生队列冲击一起影响某个年龄范围内的男性和女性。但作者通过选择在地震边缘、受地震影响最小的几十个城镇,并选择其它可比的城镇用于控制特定出生队列的相关冲击影响,能够尽可能保障工具变量的外生性。
  • 相关性:地震影响区域内的几个出生序列的男性可免服兵役,从而影响男性高中毕业率。

参考资料:Cipollone, P., & Rosolia, A. (2007). Social interactions in high school: Lessons from an earthquake. American Economic Review, 97(3), 948-965. -PDF-

案例二:同村打工网对农民工城市打工日均收入影响。可能存在的内生性问题,一是遗漏变量,如作者所用数据没有提供农民工所在城市的信息,打工所在地的特征以及一些没有观测到的村庄特征可能同时影响打工收入和村庄外出打工网的规模。二是反向因果,如工资收入越高,可能导致外出打工人数更多。三是样本自选择,如打工决策由可观测特征 (家庭劳动力数量、性别、年龄等) 和不可观测因素 (性别、能力等)决定,村庄内能力更强的人可能更倾向于外出打工。采用农民工来源村庄的自然灾害强度 (本村农业收入比正常年份减少的比例) 作为工具变量,主要基于以下考虑:

  • 外生性:虽然村庄内的自然灾害看似外生,但村庄自然灾害的强度、频率存在一定地域性和规律性,从而也会影响农民工和村庄的特征,比如灾害多发地区,农业产出没有保障,村民可能会倾向于掌握农业生产之外的技能,而这些技能在其外出打工时,有助于其获得更高收入。为确保工具变量外生性,作者控制农民工来源地省份的 “自然灾害脆弱指数”、省份固定效应。此时,可以认为小范围的村庄内的自然灾害是随机的。
  • 相关性:自然灾害降低村民全年收入预期,增加外出打工的可能性,因此自然灾害强度越大,遭受灾害的村庄外出打工人数就越多。

参考资料:陈云松. 农民工收入与村庄网络——基于多重模型识别策略的因果效应分析[J]. 社会, 2012, 32(04):68-92. -Link-

4.2.4 地形地势

案例一:茶叶价值 (女性收入占比的代理变量) 对县男性人口占比的影响。可能存在内生性问题,一是测量误差,如使用 1997 年农业数据作为早期农业条件的代理变量可能导致估计下偏。二是遗漏变量,如家庭对女孩的偏好可能导致家庭更愿意种植茶叶。采用县平均坡度作为工具变量,主要基于以下考虑:

  • 外生性:地形是不随时间变换的外生因素;
  • 相关性:茶叶主要生长在温暖、半湿润的丘陵地区,多丘陵的地形特征意味着更适宜种植茶叶。

参考资料:

4.3 历史因素

案例一:政府效率对经济增长率的影响。采用语言分解指数 (衡量总人口中任意抽取两个人属于不同语言文化群体的概率) 作为工具变量,主要基于以下考虑:

  • 外生性:语言分解程度相对外生;
  • 相关性:语言分解指数和政府效率显著负相关。语言分解指数越高,民族间分隔程度高,可能导致政治不稳定;同时,官员们更可能支持相同语言群体的成员。

参考资料:Mauro P. Corruption and growth[J]. The quarterly journal of economics, 1995, 110(3): 681-712. -PDF-

案例二:社会基础设施对人均产出影响。采用受西欧影响程度 (各国到赤道的距离、当下本国以西欧语言为母语的占比) 作为工具变量,主要基于以下考虑:

  • 外生性:西欧人并没有更倾向于到人均产出更高的地区,因此受西欧影响程度与人均产出无关;
  • 相关性:西欧重视产权、建立制衡的政府制度,受西欧影响大的国家更可能采用更好的社会基础设施。以英语、法语、德语、葡萄牙语和西班牙语为母语的人口占比能很自然地反映国家受西欧影响的程度。到赤道的距离能反映受西欧影响程度的原因有二,一是在 15 世纪初,西欧人倾向于移居到人口稀疏的地区,比如美国、加拿大、澳大利亚、新西兰和阿根廷等;二是西欧人更倾向于到气候接近西欧的地区,也就是远离赤道的地区。

参考资料:Hall, R. E., & Jones, C. I. (1999). Why do some countries produce so much more output per worker than others?. The quarterly journal of economics, 114(1), 83-116. -PDF-

案例三:制度因素对人均收入的影响。可能存在的内生性问题,一是反向因果,如更富裕的国家倾向于建立更好的制度;二是遗漏变量,如存在共同影响制度和人均收入的因素;三是测量误差,如对机构变量的测量存在误差。采用殖民时期欧洲定居者的死亡率作为制度变量的工具变量,主要基于以下考虑:

  • 外生性:作者通过加入控制变量、过度识别检验尽可能证明外生性;
  • 相关性:如果早期殖民者在某地的死亡率较低,他们就倾向于向该地区移民,从而建立起仿效母国的制度。反之,如果死亡率较高,他们则倾向于在该地区建立掠夺性的殖民政府,尽可能将该地区的资源转移到母国。即使这些殖民地陆续获得了独立的权利,但由于制度的“路径依赖”,独立后的政府在很大程度上会延续原先坏的制度,从而对现今的人均收入产生负面影响。

参考资料:

案例四:各地产权保护制度对经济增长的影响。采用中国 1919 年初级小学注册人数占当地人口比例作为工具变量,主要基于以下考虑:

  • 外生性:作者证明了 IV 与各地到沿海的距离、当时各地交通和经济水平、人力资本等其它可能影响当前经济水平的因素没有相关性;
  • 相关性:学校大部分课程是关于公民、法律和自然科学,有助于培养现代市场经济所需要的公民和法律意识。

参考资料:

案例五:城市营商软环境对城市经济发展影响。采用各城市开埠通商历史作为工具变量,主要基于以下考虑:

  • 外生性:当前经济绩效对各城市开埠通商历史没有相关性,将开埠通商历史和营商软环境同时作为解释变量与当前的经济绩效进行回归,开埠通商历史的回归系数极不显著。作者通过检验 “开埠通商历史  历史经济条件 (1985 年各城市人均 GDP)  当前经济发展水平” 排除了可能的其它渠道,进一步保证开埠通商历史只能通过影响创业营商环境影响当前经济发展水平;

  • 相关性:开埠通商历史越长, 则开埠时间越早, 受西方的影响就越早越深,现代工商业也孕育得更早,从而具有更好的营商软环境。

  • 参考资料:董志强, 魏下海, 汤灿晴. 制度软环境与经济发展——基于 30 个大城市营商环境的经验研究[J].管理世界,2012(04):9-20. -Link-

案例六:方言种类对城市圈市场分割程度。采用当地戏曲种类作为工具变量,主要基于以下考虑:

  • 外生性:地方戏曲种类数与市场分割程度并不存在明显的相关性。将 IV 加入基准模型,估计系数不显著,作者进一步检验并排除其他可能的经济、文化渠道尽可能满足排他性约束;
  • 相关性:地方戏曲主要使用当地方言演唱、面对当地居民,则地方戏曲种类与方言多样性正相关。

参考资料:丁从明, 吉振霖, 雷雨, 梁甄桥. 方言多样性与市场一体化:基于城市圈的视角[J]. 经济研究, 2018, 53(11):148-164. -Link-

4.4 生理现象

案例一:教育对工资的影响。采用出生季度作为工具变量,主要基于以下考虑:

  • 外生性:出生季度在教育回报方程中外生;
  • 相关性:个体出生季度受到学龄政策、义务教育法的影响,对受教育水平有影响。具体而言,相比于下半年出生的孩子,上半年出生的孩子开始上学较晚,同时退学可能性也更大,因为美国《义务教育法》规定不满 16 周岁不得退学,则下半年出生,平均受教育时间更长。

参考资料:Angrist J D, Krueger A B. Does compulsory school attendance affect schooling and earnings? [J]. The Quarterly Journal of Economics, 1991, 106(4): 979-1014.-PDF-

案例二:非婚生育对经济 (劳动供给、贫困、福利水平) 的影响。采用非婚生育双胞胎作为工具变量,主要基于以下考虑,即相比于非婚生育一胎,非婚生育双胞胎是随机决定,且直接影响了非婚生育情况。从而可以通过对比非婚生育一胎和非婚生育双胞胎的样本,得出生育一个未计划的非婚孩子对母亲的经济结果的因果效应。

参考资料:Bronars S G, Grogger J. The economic consequences of unwed motherhood: Using twin births as a natural experiment[J]. The American Economic Review, 1994: 1141-1156. -PDF-

案例三:家庭中的孩子数量对劳动供给影响。可能存在同时影响生育能力和劳动供给的遗漏变量。采用头两胎的性别组合作为工具变量,主要基于以下考虑,即出于人类生育行为中 “儿女双全” 偏好,头两胎如果是双子或双女,则生育第三胎的可能性很大,进而增加子女数。

参考资料:Angrist, J. D., & Evans, W. N. (1996). Children and their parents' labor supply: Evidence from exogenous variation in family size (No. w5778). National bureau of economic research. -PDF-

案例四:邻里其他母亲就业对单个母亲就业的影响。采用邻里其他母亲头两个子女的性别组合作为工具变量,主要基于以下考虑,即头两个孩子性别不同的母亲相比于性别相同的母亲,参与劳动力市场的可能性更高。可能的原因在于,头两个孩子性别相同,则抚养成本降低,使就业显得不那么紧迫;此外,头两个孩子的性别还会通过影响最终生育的孩子数量影响母亲就业情况,如果性别相同,母亲更可能增加生育的孩子数量。因此,邻里其他母亲头两个子女的性别组合会影响邻里母亲的平均就业情况。

参考资料:Maurin, E., & Moschion, J. (2009). The social multiplier and labor market participation of mothers. American Economic Journal: Applied Economics, 1(1), 251-72. -PDF-+-Replication-

4.5 实验因素

案例一:是否服兵役对收入的影响。采用入伍抽签号码作为工具变量,主要基于以下考虑:一是外生性,即抽签号的产生完全随机。越南战争期间,美国青年服兵役采取基于生日的抽签形式,决定抽签号码小于一定 “阈值” 则参加体检服兵役,大于阈值则免于兵役;二是相关性,即抽签号直接影响是否服兵役,甚至进而影响后期教育水平。

参考资料:

  • Angrist, J. D. (1990). Lifetime earnings and the Vietnam era draft lottery: evidence from social security administrative records. The American Economic Review, 313-336. -PDF-
  • Angrist J D. The effect of veterans benefits on education and earnings[J]. Industrial and Labor Relations Review, 1993, 46(4): 637-652. -PDF-

案例二:班级规模对学生成绩的影响,采用迈蒙尼德 (Maimonides) 规则下的本地招生人数作为工具变量,主要基于以下考虑,即根据迈蒙尼德规则,凡是班级人数超过 40 的就会被分裂为两个小班,因此,招生人数和班级规模之间就存在一个紧密的非线性关系。

参考资料:Angrist J D, Lavy V. Using Maimonides' rule to estimate the effect of class size on scholastic achievement[J]. The Quarterly journal of economics, 1999, 114(2): 533-575. -PDF-

案例三:班级平均成绩对个体学业成绩的影响。采用班级中曾经参与过 “小班实验” 的人数比例作为工具变量,主要原因是 STAR 项目 (小班实验) 旨在缩减班级规模,是随机进行的,学校之前从各个班级随机抽人去组成小班,因此外生性可以保证。而小班教学提高了这部分学生的成绩,故而对班级整体表现也必然有影响。

参考资料:Boozer, M., & Cacciola, S. E. (2001). Inside the'Black Box'of Project STAR: Estimation of peer effects using experimental data. Available at SSRN 277009. -PDF-

案例四:受教育年数对工资的影响。采用 1974 年的年龄与区域内项目密度的交乘项 (大规模小学建造项目的时空差异,项目密度为每 1000 个孩子新建小学数) 作为工具变量,主要基于以下考虑,一是外生性,大规模建造小学的项目对工资水平没有直接影响。同时,作者控制了可能影响项目实施的学生注册率、生活用水和环境卫生项目等变量,尽可能保证项目的实施免受随时间变化的地区特殊性的遗漏变量的影响。二是相关性,大规模建造小学的项目影响教育水平。

参考资料:Duflo E. Schooling and labor market consequences of school construction in Indonesia: Evidence from an unusual policy experiment[J]. American economic review, 2001, 91(4): 795-813. -PDF-

案例五:对照组平均入学率对孩子是否入学影响。采用学校参与 PROGRESA 项目的学生比例作为工具变量,主要基于以下考虑,一是外生性,PROGRESA 项目由墨西哥政府 1997 年发起,所选样本完全随机;二是相关性,该项目给边远地区的边缘家庭生活补助以支撑孩子上学,有助于提高入学率。

参考资料:Bobonis, G. J., & Finan, F. (2009). Neighborhood peer effects in secondary school enrollment decisions. The Review of Economics and Statistics, 91(4), 695-716. -PDF-

4.6 其他因素

案例一:孕妇吸烟对婴儿出生体重的影响。可能存在样本自选择问题,如吸烟的女性更可能有不好的习惯,从而影响她们的长期健康水平。采用州香烟税率作为工具变量,主要基于以下考虑,即州香烟税率提升香烟价格,从而减少孕妇吸烟。

参考资料:Evans, W. N., & Ringel, J. S. (1999). Can higher cigarette taxes improve birth outcomes?. Journal of public Economics, 72(1), 135-154. -PDF-

案例二:高速公路网对地区经济发展的影响。可能存在内生性问题是,高速公路网的铺设并不随机。“高速公路网” 计划制定过程、描述性统计指标都显示被纳入高速公路网的城市往往政治地位重要或经济繁荣。采用边缘城市是否处于最小生成树上作为工具变量,主要基于以下考虑:

  • 外生性:最小生成树完全由算法结果客观决定,不受其他人为因素的影响。同时,作者也做了排除性约束检验;
  • 相关性:最小生成树显示最低成本的公路铺设网,作为一个理性的决策者,在其他条件不变的情况下,肯定倾向于用这种方案。因此如果一个边缘城市的地理位置恰巧处于上述的 “最小生成树” 上,那么它最终被纳入实际的高速公路网的概率就比其他边缘城市更高。

参考资料:Faber, B. (2014). Trade integration, market size, and industrialization: evidence from China's National Trunk Highway System. Review of Economic Studies, 81(3), 1046-1070. -PDF-

5. 相关推文

Note:产生如下推文列表的 Stata 命令为:
lianxh 工具变量 IV
安装最新版 lianxh 命令:
ssc install lianxh, replace

相关课程

免费公开课

最新课程-直播课

专题 嘉宾 直播/回看视频
最新专题 文本分析、机器学习、效率专题、生存分析等
研究设计 连玉君 我的特斯拉-实证研究设计-幻灯片-
面板模型 连玉君 动态面板模型-幻灯片-
面板模型 连玉君 直击面板数据模型 [免费公开课,2小时]
  • Note: 部分课程的资料,PPT 等可以前往 连享会-直播课 主页查看,下载。

课程主页

课程主页

关于我们

  • Stata连享会 由中山大学连玉君老师团队创办,定期分享实证分析经验。
  • 连享会-主页知乎专栏,400+ 推文,实证分析不再抓狂。直播间 有很多视频课程,可以随时观看。
  • 公众号关键词搜索/回复 功能已经上线。大家可以在公众号左下角点击键盘图标,输入简要关键词,以便快速呈现历史推文,获取工具软件和数据下载。常见关键词:课程, 直播, 视频, 客服, 模型设定, 研究设计, stata, plus, 绘图, 编程, 面板, 论文重现, 可视化, RDD, DID, PSM, 合成控制法

连享会小程序:扫一扫,看推文,看视频……

扫码加入连享会微信群,提问交流更方便

✏ 连享会-常见问题解答:
https://gitee.com/lianxh/Course/wikis

New! lianxh 命令发布了:
随时搜索连享会推文、Stata 资源,安装命令如下:
. ssc install lianxh
使用详情参见帮助文件 (有惊喜):
. help lianxh