温馨提示: 定期 清理浏览器缓存,可以获得最佳浏览体验。
New!
lianxh
命令发布了:
随时搜索推文、Stata 资源。安装命令如下:
. ssc install lianxh
详情参见帮助文件 (有惊喜):
. help lianxh
⛳ Stata 系列推文:
作者:倪克金 (东南大学)
邮箱:nikejin624@outlook.com
编者按:本文主要摘译自以下文章,特此致谢!
Source:Correlation does not imply causation -Link-
目录
因果关系的存在,必然会伴随着相关性。但是,从因到果还需时间上的先后顺序、以及合理的机制等。因此,相关性只是因果关系的必要不充分条件。在现代科学中,相关关系经常会被误认为因果关系。例如:
早期的流行病学研究表明,女性在接受联合激素替代疗法 (HRT) 后,其冠状动脉疾病发生率会显著低于平均水平。据此,医生认为 HRT 是预防冠心病的一种有效措施。但在之后的随机对照试验中,却发现使用激素替代疗法会导致冠心病的风险小幅增加,并在统计学上显著。
进一步深入分析表明,接受 HRT 的妇女更有可能来自社会经济地位较高的群体 (ABC1),这意味着她们的饮食和运动方案优于平均水平。由此,我们可以看出,社会经济地位同时影响着 HRT 疗法和冠状动脉疾病发生率,而并非简单的因果关系。
即便如此,大量的观察性病例数据依旧显示出 HRT 可以降低女性的冠状动脉疾病。不过,随着科学的发展,医学界也给出了更为准确严谨的解释,即健康妇女在绝经后不久开始接受雌激素治疗对降低冠心病风险有显著效果。
因果分析是实验设计和统计研究等领域试图建立事件因果关系常用的方法。对于任何两个相关的事件 A 和 B,它们可能的关系包括:
分类 | 关系 |
---|---|
A 导致 B | 直接原因 |
B 导致 A | 反向因果关系 |
A 和 B 都是由 C 导致的 | 共因关系 |
A 导致 B 并且 B 导致 A | 双向或循环因果关系 |
A 和 B 之间没有关联 | 巧合 |
由上表可知,仅从 A 与 B 相关来看,我们是无法得出 A 与 B 间的因果关系。为此,我们需要进一步的分析来验证因果关系。
假设一个学生在考试中表现不佳,我们猜测可能的原因是他昨晚熬夜打游戏了。为了证明这一点,我们会想到一个反事实的例子,即同一个学生在同样的情况下参加同样的测试,但却在前一天晚上按时睡觉。如果时空可以穿越,通过改变这个学生考试前夜状态,我们就可以观察到因果关系。但事实是我们并不能改变历史,故因果关系只能被推断出来,并不能被确切地知道。上述现象也是因果推理的基本问题——直接观察因果效应是不可行的。
科学实验和统计推断的一个主要目标就是尽可能接近真实世界的反事实状态。例如,研究者可以对同卵双胞胎进行一项实验,以检验考前辅导是否有用。首先,要保持双胞胎的其他外在因素相同;其次,将一个送去学习 6 小时,另一个送去游乐场玩 6 小时;最后,比较双胞胎的测试成绩。若有显著差别,则可以认为考前辅导会对成绩产生显著影响。当然,很多时候平衡个体间的相似性是困难的。一个可行的办法是,以群体相似性取代个体相似性。
当实验无法进行时,我们可以通过回归分析来控制可能的混淆变量。再或者,我们还可以通过为内生变量寻找工具变量来克服反向因果问题。尽管如此,因果关系推论仍是不可靠的。
反向因果,即原因和结果是相反的,原因被错误的认为是结果。
例子 1:风与风车
例子 2:看电视与暴力倾向
例子 3 :毒品与精神疾病
例子 4:中世纪的虱子与健康
共因是对 A 和 B 都产生影响的因素,但在分析 A 和 B 的关系时,我们一般会简单认为是 A 导致了 B,或 B 导致了 A。
例子 1:穿鞋睡觉与头痛
例子 2:开灯睡觉与儿童近视
例子 3:冰激凌销量与溺水死亡率
例子 4:肥胖与温室气体
因果关系不一定是单向的。例如在捕食者与被捕食者的关系中,捕食者的数量影响被捕食者的数量,但是被捕食者的数量,即食物的供给,也影响捕食者的数量;
另一个众所周知的例子是,骑自行车的人比不骑自行车的人体重指数更低。这通常可以解释为骑车行为增加了身体活动水平,因此降低了体重指数。但是,一项关于骑自行车人群的前瞻性研究结果显示,骑自行车对人体重指数的影响较小。那么我们可以认为,体重指数较低的人,更有可能骑自行车。
现实世界中可能存在两个变量完全没有关系,仅仅是因为人们对两个事件的讨论比较越多,就主观臆造出两者之间存在某种关系,即自我说服、自我洗脑。
米歇尔定律:将德国社会民主党在民众投票中的份额与德国西部粗钢产量的大小联系起来;
俄罗斯领导人交替秃头规律:在近 200 年的历史中,俄罗斯每一个秃头的国家领导人之后,都会接替一个不秃头的领导人,反之亦然。
在社会研究中,人们总是不经意地将相关关系误认为因果关系。当然,人们也会犯另一种错误,即完全忽视相关性。实际上,在医学、心理学和社会学等领域中,相关性是一种有价值的科学证据。但是,相关性本身不能用来证明治疗与疗效、风险因素与疾病、或社会经济因素与各种结果之间的因果关系。
Note:产生如下推文列表的 Stata 命令为:
lianxh 因果 内生性, m
安装最新版lianxh
命令:
ssc install lianxh, replace
免费公开课
最新课程-直播课
专题 | 嘉宾 | 直播/回看视频 |
---|---|---|
⭐ 最新专题 | 文本分析、机器学习、效率专题、生存分析等 | |
研究设计 | 连玉君 | 我的特斯拉-实证研究设计,-幻灯片- |
面板模型 | 连玉君 | 动态面板模型,-幻灯片- |
面板模型 | 连玉君 | 直击面板数据模型 [免费公开课,2小时] |
⛳ 课程主页
⛳ 课程主页
关于我们
课程, 直播, 视频, 客服, 模型设定, 研究设计, stata, plus, 绘图, 编程, 面板, 论文重现, 可视化, RDD, DID, PSM, 合成控制法
等
连享会小程序:扫一扫,看推文,看视频……
扫码加入连享会微信群,提问交流更方便
✏ 连享会-常见问题解答:
✨ https://gitee.com/lianxh/Course/wikis
New!
lianxh
命令发布了:
随时搜索连享会推文、Stata 资源,安装命令如下:
. ssc install lianxh
使用详情参见帮助文件 (有惊喜):
. help lianxh