美国社会-人口数据平台-Opportunity-Insights:由Chetty发起

发布时间:2022-04-21 阅读 1187

Stata连享会   主页 || 视频 || 推文 || 知乎 || Bilibili 站

温馨提示: 定期 清理浏览器缓存,可以获得最佳浏览体验。

New! lianxh 命令发布了:
随时搜索推文、Stata 资源。安装:
. ssc install lianxh
详情参见帮助文件 (有惊喜):
. help lianxh
连享会新命令:cnssc, ihelp, rdbalance, gitee, installpkg

课程详情 https://gitee.com/lianxh/Course

课程主页 https://gitee.com/lianxh/Course

⛳ Stata 系列推文:

PDF下载 - 推文合集

作者: 桑倩倩 (中央财经大学)
邮箱: sqq6763@163.com

Source: https://opportunityinsights.org/data/


目录

[TOC]


1. 数据库简介

Opportunity Insights 是一家位于哈佛大学的无党派、非营利组织,旨在通过跨学科方法利用 “大数据” 的力量,将严谨科学的研究见解转化为政策变革。这一平台由哈佛大学经济学系教授 Raj Chetty 发起成立,团队成员包括来自哈佛大学、麻省理工学院、斯坦福大学、哥伦比亚大学的众多著名学者和美国人口普查局的经济学家。Opportunity Insights 平台提供了美国经济社会发展和部分人口普查数据,数据库涵盖的主题包括性别、种族、健康、教育、创新、收入、社会流动和地理流动等。接下来,本文将对数据库进行详细介绍。

https://opportunityinsights.org/data/

2. 数据详情

Opportunity Insights 数据库既可以按照按照地理层级也可以按照研究主题分为不同的子库。本文按照地理层级介绍不同子库的数据,地理层级包括:联邦(国家)、州、县、通勤区(城市)、人口普查区、学院(大学)。

Note:

 • 美国行政区划分为联邦、州、县。县由州设立,通常反映的是政治边界而不是经济范围。市通常比县范围更小,但与县没有行政隶属关系。
 • 通勤区基本是市,是地理分析单位,旨在更密切地反映人们生活和工作的当地经济。
 • 通勤区从 1980 年开始一直持续到 2000 年,与人口普查局的工作数据一起使用进行层次聚类分析。1980 年美国划定了 768 个通勤区,1990 年为 741 个,2000 年 709 个。2010 年之后使用人口普查区。

2.1 联邦数据

 • 按孩子出生队列划分的父母收入分布。
 • 按种族和性别划分的全国儿童和父母收入。
 • 按父母收入百分比、性别和种族划分的国家统计数据。
 • 针对母亲在美国出生儿童按种族和性别划分的全国儿童和父母收入。
 • 按百分位数划分的国家边际收入分布。
 • 2014 年按收入百分比和儿童出生队列划分的儿童和父母收入水平。
 • 按儿童出生队列、父母收入百分比和性别划分的绝对收入流动性。
 • 按父母百分比和性别划分的全国就业率、收入和其他结果。
 • 按父母收入、原籍国和性别划分的第二代移民儿童收入排名的参数估计。
 • 按父母收入、原籍国和性别划分的第二代移民儿童收入排名的非参数估计。
 • 按出生队列对绝对收入流动性的替代估计。
 • 按儿童出生队列和父母收入百分位超过父母所需的儿童收入分配排名。
 • 按种族、性别和父母收入百分比划分的国家层面的所有结果。
 • 1980-1982 年按出生队列划分的父母和子女收入的百分比联合分布。
 • 种族和经济机会:父母和子女收入百分位数和美元价值之间的匹配。
 • 按父母收入百分比的反事实收入流动性。
 • 按年龄和年龄划分的发明人收入分布。
 • 按年龄分列的高被引发明人收入分布。
 • 收入/工资百分位数与 2015 年美元之间的匹配。
 • 按种族和性别划分的受教育程度的代际流动矩阵。
 • 按国家和性别划分的 40 岁国际平均预期寿命。
 • 按年份、性别和收入百分比计算的预期寿命。
 • 按性别、年龄和年份分类的税收数据和 NCHS 数据中的全国人口和死亡人数。
 • 按性别、年龄、年份和收入百分比划分的全国死亡率。

2.2 州数据

 • 按州和出生队列划分的父母收入分布。
 • 按儿童出生队列和国家划分的绝对收入流动性。
 • 发明家的起源:按童年状态、性别和父母收入划分的创新率。
 • 发明家的职业:按现状、性别、出生年份和年龄划分的创新率。
 • 按性别和收入百分比划分的州预期寿命估计值。
 • 按性别和收入四分位数对州预期寿命的估计。
 • 按年份、性别和收入四分位数的州预期寿命估计。
 • 来自 IPEDS 数据库和大学记分卡的大学水平特征。

2.3 县数据

 • 县特征变量。
 • 县社区特征。
 • 流动性趋势:按出生队列估算的县代际流动性。
 • 按性别和父母收入五分位数和其他协变量划分的县就业率。
 • 按县、种族和性别划分的低收入家庭儿童的家庭收入和监禁。
 • 按县、种族、性别和父母收入百分比划分的所有结果。
 • 来自 IPEDS 数据库和大学记分卡的大学水平特征。
 • 按性别和收入四分位数估算的县预期寿命。

2.4 通勤区数据

 • 通勤区特征。
 • 按通勤区划分的社区特征。
 • 通勤区收入分布。
 • 按通勤区和出生队列划分的父母收入分布。
 • 按种族和父母收入百分比划分的通勤区收入排名统计。
 • 按通勤区、种族、性别和父母收入百分比划分的所有结果。
 • 流动性趋势:按出生队列估算的通勤区代际流动性。
 • 童年和性别差距:按性别和父母收入五分位数和其他协变量划分的通勤区就业率。
 • 美国的发明家:按儿童通勤区、性别和父母收入划分的通勤区创新率。
 • 发明家的职业:按当前通勤区、性别、出生年份和年龄划分的创新率。
 • 按通勤地区、种族和性别划分的低收入家庭儿童的家庭收入和监禁。
 • 来自 IPEDS 数据库和大学记分卡的大学水平特征。
 • 按性别和收入四分位数估算的通勤区预期寿命。
 • 人口最多的 100 个地区的预期寿命排名。
 • 通勤区边界(1990 年定义)收入和预期寿命。

2.5 人口普查区数据

 • 人口普查区域的社区特征。
 • 2010 年至 2020 年美国人口普查区的匹配。
 • 按人口普查区、种族和性别划分的低收入家庭儿童的家庭收入和监禁。
 • 按人口普查范围、种族、性别和父母收入百分比划分的所有结果。

2.6 学院数据

 • 按州和出生队列划分的父母收入分布。
 • 按出生队列划分的 2015 年父母和子女收入的百分位值.
 • 儿童收入分布的纵向统计(按大学级别、家长收入和时间划分)。
 • 各大学的创新率。
 • 来自 IPEDS 数据库和大学记分卡的大学水平特征。
 • 自 2019 年 9 月起关闭学校的超级 OPEID。
 • 教育部 OPEID 与用于收入隔离和美国大学间代际流动的超级 OPEID 的匹配。

3. 相关研究

Opportunity Insights 团队成员使用这些数据发表了许多优秀论文。本文在此着重介绍有关种族收入差异和社会流动的两篇文章。

Chetty, R., Hendren, N., Jones, M. R., & Porter, S. R. Race and Economic Opportunity in the United States: An Intergenerational Perspective[J]. The Quarterly Journal of Economics,2020,135(2):711–783.-PDF- 被引用次数:743

 • 摘要:本文使用纵向匿名数据研究种族收入差异的来源,该数据几乎涵盖了 1989 年至 2015 年全部的美国人口。结果发现:首先,与白人相比,美国黑人和印第安人的向上流动率要低得多,而向下流动率则高得多,这导致代际差异持续存在。以父母收入为参照,黑人男性和白人男性的收入差距完全是由工资和就业率的巨大差异造成的;黑人女性和白人女性之间没有这种差异。拉美裔美国人的代际流动率与白人更为相似,促进拉美裔与白人收入差距代际缩小。其次,父母婚姻状况、教育和财富的差异并不能解释以父母收入为参照的黑人和白人收入差距。再次,即使在同一人口普查区长大的男孩中,黑人和白人的差距仍然存在。控制父母收入的情况下,在 99% 的人口普查区域中,黑人男孩成年后的收入低于白人男孩。少数黑人与白人差距较小的地区往往是贫困程度低的社区,在童年早期搬到这样社区的黑人男性收入更高。然而,只有不到 5% 的黑人儿童在这些社区长大。本文的研究结果表明,缩小黑人与白人的收入差距需要做出努力,其影响跨越社区和阶级的界限,能够增加黑人男性的向上流动性。

 • 数据情况:本文使用了 2000 年和 2010 年人口普查的数据,1989 年、1994 年、1995 年和 1998-2015 年联邦所得税申报表数据,2000 年人口普查长表和 2005-2015 年美国社区调查数据。

Bergman P, Chetty R, DeLuca S, et al. Creating moves to opportunity: Experimental evidence on barriers to neighborhood choice[R]. National Bureau of Economic Research, 2019. -PDF- 被引用次数:145

 • 摘要:美国的低收入家庭通常居住在向上流动机会低的社区。可能的解释有两个,一个解释是低收入家庭出于多种原因更喜欢这样的社区,例如通勤时间短、靠近家庭与社区、更大的种族和民族多样性;另一个解释是存在障碍因素,阻止他们搬到高流动性社区,例如缺乏信息、房东不愿意向他们租房或者缺乏信贷。本文使用西雅图和金县的随机对照实验来检验这两种解释。实验通过定制搜索帮助、房东参与和短期财务援助减少向高流动性社区迁移的障碍。干预措施将搬到高流动性社区的家庭比例从对照组的 15% 增加到实验组的 53%。因干预而迁移到机会更高社区的家庭不会在社区质量的其他方面做出牺牲,当租约到期续签时,他们倾向于留在新社区,在搬家后社区满意度更高。这些发现表明,大多数低收入家庭并没有强烈的意愿留在机会少的地区;相反,按收入划分的住宅隔离是寻找住房过程中的主要障碍因素。对家庭的访谈表明,以特定方式满足每个家庭需求的能力——从情感支持到与房东的中介关系再到定制的经济援助——对于该项目的成功至关重要。准实验分析和与其它研究的比较,本文发现更标准化的政策——在高机会社区提高凭单支付标准或信息干预——产生的影响要小得多。本文得出的结论是,重新设计经济适用房政策,为寻找住房方面提供定制化帮助,可以减少住宅隔离并大幅增加向上流动性。

 • 数据情况:本文的数据来自西雅图和金县住房管理局的行政记录、基线调查、服务提供流程管理系统、住宅单元和地块特征数据、人口普查区域特征数据,以及对家庭搬迁后的后续调查和访谈。

 • Opportunity Insights 平台提供了团队成员使用数据更多的论文,部分论文还附上 Replication Code ,非常友好,具体链接- Link

4. 参考资料

 • Opportunity Insights 提供的大数据课程。 -Link
 • Opportunity Insights 的所有论文。 -Link
 • 美国农业部:通勤区和劳动力市场两个地理单位的介绍。- Link
 • 知乎:美国的县(county)与市(city)有什么区别,级别怎样?- Link

5. 相关推文

Note:产生如下推文列表的 Stata 命令为:
lianxh 数据库
安装最新版 lianxh 命令:
ssc install lianxh, replace

相关课程

免费公开课

最新课程-直播课

专题 嘉宾 直播/回看视频
最新专题 文本分析、机器学习、效率专题、生存分析等
研究设计 连玉君 我的特斯拉-实证研究设计-幻灯片-
面板模型 连玉君 动态面板模型-幻灯片-
面板模型 连玉君 直击面板数据模型 [免费公开课,2小时]
 • Note: 部分课程的资料,PPT 等可以前往 连享会-直播课 主页查看,下载。

课程主页

课程主页

关于我们

 • Stata连享会 由中山大学连玉君老师团队创办,定期分享实证分析经验。
 • 连享会-主页知乎专栏,700+ 推文,实证分析不再抓狂。直播间 有很多视频课程,可以随时观看。
 • 公众号关键词搜索/回复 功能已经上线。大家可以在公众号左下角点击键盘图标,输入简要关键词,以便快速呈现历史推文,获取工具软件和数据下载。常见关键词:课程, 直播, 视频, 客服, 模型设定, 研究设计, stata, plus, 绘图, 编程, 面板, 论文重现, 可视化, RDD, DID, PSM, 合成控制法

连享会小程序:扫一扫,看推文,看视频……

扫码加入连享会微信群,提问交流更方便

✏ 连享会-常见问题解答:
https://gitee.com/lianxh/Course/wikis

New! lianxh 命令发布了:
随时搜索连享会推文、Stata 资源,安装命令如下:
. ssc install lianxh
使用详情参见帮助文件 (有惊喜):
. help lianxh