你真的懂假设检验吗?

发布时间:2023-05-02 阅读 700

Stata连享会   主页 || 视频 || 推文 || 知乎 || Bilibili 站

温馨提示: 定期 清理浏览器缓存,可以获得最佳浏览体验。

New! lianxh 命令发布了:
随时搜索推文、Stata 资源。安装:
. ssc install lianxh
详情参见帮助文件 (有惊喜):
. help lianxh
连享会新命令:cnssc, ihelp, rdbalance, gitee, installpkg

课程详情 https://gitee.com/lianxh/Course

课程主页 https://gitee.com/lianxh/Course

⛳ Stata 系列推文:

PDF下载 - 推文合集

作者: 黄晨晨(厦门大学)
邮箱: chens_huang@163.com

Source: Ameer Maaveya,2023,5 Steps of Hypothesis Testing with Examples – A Beginner’s Guide. -Link-


目录


1. 简介

假设检验是一种统计方法,用于确定关于总体参数的假设是否得到数据的支持。简单地说,这是一种检验你对一个群体或一种情况的说法是否可能属实的方法。通过使用假设检验,你可以根据收集的数据开展评估并做出决策。它可以帮助你识别关系,预测结果,并做出明智的决定。

例如,金融分析师可能想检验某一特定投资组合优于基准指数的假设。他们将收集一段时间内投资组合和指数的回报数据,并使用假设检验来确定回报差异是否具有统计学意义。如果检验结果表明该投资组合确实跑赢了指数,那么分析师可以更有信心向投资者推荐该投资组合。

简而言之,假设检验很重要,因为它可以让我们根据证据做出明智的决定。如果没有假设检验,我们将只剩下猜测和直觉,这往往会导致代价高昂的错误。

2. 假设检验的5个关键步骤

假设检验通常包括五个关键步骤,用于评估假设是否得到证据支持。以下是五个关键步骤的简单概述:

陈述原假设和备择假设。假设检验的第一步是陈述原假设 (H0) 和备择假设 (H1) 。原假设是总体参数与样本之间没有显著差异的假设,备择假设是存在显著差异的假设。

设置显著性水平。下一步是确定将在假设检验中使用的显著性水平 (α) 。显著性水平是指当原假设为真时,拒绝该假设的概率。最常用的显著性水平为0.05。大多数情况下,研究人员使用三个显著性水平:0.01、0.05和0.1。

收集数据。第三步是收集将用于检验假设的数据。数据可以通过实验、调查或其他研究方法收集。

计算检验统计量。第四步是计算检验统计量。检验统计量是衡量样本统计量与假设的总体参数之间的差异,用于确定 p 值。

做出决定。最后一步是根据 p 值做出决定。如果 p 值小于显著性水平,则否定原假设并接受备择假设。如果 p 值大于显著性水平,则无法否定原假设。

3. 原假设和备择假设

在假设检验中,我们通常比较两个假设:原假设和备择假设。了解这两个假设之间的差异对于正确进行假设检验至关重要。

3.1 原假设

原假设 (H0) 是指总体参数和样本之间没有显著差异的假设。换句话说,原假设表明,在样本和总体参数之间观察到的任何差异都是由于偶然性造成的。假设投资者正在考虑投资投资组合 A 或投资组合 B ,并想确定哪一个收益率更高。原假设是,两个投资组合在收益方面没有显著差异,任何观察到的差异都是由于偶然性造成的。

3.2 备择假设

备择假设 (H1) 是指总体参数和样本之间存在显著差异的假设。备择假设认为,样本和总体参数之间观察到的任何差异都不是偶然的。在上面的投资组合例子中,备择假设可能是两个投资组合之间存在显著差异。

3.3 例子

为了说明原假设和备择假设之间的区别,让我们考虑一个检验新投资策略有效性的简单例子。原假设是,与现有策略相比,新投资策略对收益没有显著影响,而备择假设是,新投资策略对收益有显著的积极影响。

如果我们应用新的投资策略一段时间,发现收益与现有策略没有显著差异,我们可能无法拒绝原假设,并得出新策略无效的结论。然而,如果我们发现新策略的收益显著更高,我们可能会拒绝原假设,并得出新策略在产生更高收益方面是有效的结论。

4. 单尾与双尾检验

在进行假设检验时,选择正确的检验类型是很重要的。两种常见的检验类型是单尾检验和双尾检验。了解这两种类型的检验之间的差异对于确保准确的假设检验非常重要。

4.1 单尾检验

在单尾检验中,备择假设指定了效应的方向,我们想确定观察到的效应在该特定方向上是否显著。在金融领域,单尾检验的一个常见例子是检验一种新的投资策略是否比现有策略产生更高的收益。在这种情况下,备择假设是有方向性的,即新策略产生的收益高于现有策略。我们将使用单尾检验来确定观察到的影响是否在预期方向上显著。

4.2 双尾检验

在双尾检验中,备择假设没有指定效应的方向。双尾检验的一个常见例子是检验股票投资组合的平均收益率是否不同于某个值 (例如,0) 。原假设是平均收益率等于指定值,而备择假设是平均收益率不等于指定值。由于备择假设没有指定特定的方向,我们将使用双尾检验来确定观察到的效应在任何一个方向上是否显著(即,平均回报是否显著大于或显著小于指定值)。

4.3 如何选择合适的检验

那么,我们如何选择正确的检验类型呢?选择取决于研究问题和正在检验的具体假设。如果我们对备择假设有一个特定的方向,我们会使用单尾检验。如果我们没有一个特定的方向,我们会使用双尾检验。通过选择正确的检验类型,我们可以确保准确的假设检验,并根据检验结果得出准确的结论。

5. p 值的计算及含义

在进行假设检验时,我们经常计算一个 p 值。它告诉我们,在假设原假设正确时,出现当前证据或者更强证据的概率。 p 值越小,反对原假设的证据就越有力。

要计算p值,我们首先需要计算检验统计量。检验统计量是一个检验样本和原假设之间差异的值。检验统计量的选择取决于所进行的假设检验的类型。例如,如果我们正在检验一个总体的平均值,我们可以使用t检验作为我们的检验统计量。

一旦我们计算了检验统计量,我们就可以使用 p 值表或统计软件来找到 p 值 ( Stata 软件会在统计分析中自动为我们计算这个值) 。 例如,如果我们观察到自由度为10, t 检验统计量为2.0,并且我们的备择假设是双尾的,我们可能会发现 p 值为0.06。这意味着,如果原假设成立,那么有6%的机会观察到像我们观察到的那样极端的检验统计数据。

请务必记住,p 值不是原假设成立的概率。相反,它是在假设原假设成立的情况下,出现当前证据或者更强证据的概率。 p 值越小,反对原假设的证据就越有力。统计显著性的常用阈值是0.05的 p 值 ,这意味着假设原假设成立,有5%的机会获得当前证据或者更强证据。

6. 需要注意的常见假设检验错误

在进行假设检验时,了解可能发生的常见错误非常重要。以下是一些需要注意的错误示例:

第一类错误和第二类错误。第一类错误 ( Ⅰ 型错误) 指原假设是真的却被拒绝,造成“弃真”错误。犯第一类错误的概率用希腊字母 α 表示,通常设置为0.05。第二类错误 ( Ⅱ 型错误) 指原假设是假的却被接受,造成“存伪”错误。犯第二类错误的概率用希腊字母 β 表示。

当样本量不变时,降低其中一类错误,则必然会使另一类错误增大,所以在实验中一般会优先控制犯第一类错误的概率。同时减少两类错误的犯错概率的唯一方法是增加样本量,因为样本量增大会降低标准误的大小,因而可使犯第一类错误和第二类错误的概率减少。

样本量不足。样本量过小可能导致不准确的结论。例如,小样本量可能导致 Ⅱ 型错误,即,即使原假设是错误的,我们也无法拒绝它。

有偏抽样。如果样本不能代表总体,假设检验的结果可能不准确。

对结果的误解。正确地解释假设检验的结果是很重要的。一个常见的错误是将一个不显著的结果解释为原假设为真的证据,而实际上它只是意味着没有足够的证据来拒绝原假设。

7. 现实场景中假设检验的例子

假设检验是一种强大的工具,可用于在各种现实场景中做出决策并得出结论。以下是一些在实践中如何使用假设检验的例子:

医学研究

假设检验通常用于医学研究,以检验新疗法或干预措施的有效性。例如,研究人员可能会检验一种新药在治疗某种疾病方面比现有药物更有效的假设。通过统计分析比较两种治疗的结果,研究人员可以确定新药是否明显比现有药物更有效。

质量控制

假设检验也用于质量控制,以确保产品或过程符合某些规格。例如,一家制造公司可能会检验其产品的平均重量等于某个目标重量的假设。通过对产品取样,并使用统计分析对假设进行检验,公司可以确定产品是否符合要求的规格。

金融

假设检验在金融中用于检验各种投资策略。例如,金融分析师可能会根据某些标准检验特定股票可能优于市场的假设。通过分析历史数据和检验假设,分析师可以确定股票是否是一个好的投资。

环境

假设检验也用于环境研究,以检验与环境问题有关的假设。例如,研究人员可能会检验某种化学物质对特定生态系统造成危害的假设。通过分析数据和检验假设,研究人员可以确定化学物质是否对生态系统产生重大影响。

8. 设计有效假设检验实验的技巧

设计有效的实验是假设检验的关键部分。以下是设计有效假设检验实验的一些建议:

明确研究问题。在设计实验之前明确研究问题是很重要的。研究问题应该是具体的,可衡量的,并专注于一个明确的目标。

选择一个合适的假设检验。一旦研究问题被定义,选择一个合适的假设检验提供最相关的信息是很重要的。不同的假设检验用于不同类型的数据和研究问题,因此针对具体情况选择正确的检验是很重要的。

确定样本量。样本量应足够大,以确保实验结果准确并能代表总体。小样本量可能导致不准确的结论,而大样本量可能是不必要的和耗时的。

随机抽样。为了确保样本能够代表总体,随机选择受试者是很重要的。这有助于减少偏差,并确保样本尽可能具有代表性。

混淆变量的控制。混淆变量是可能影响实验结果的因素,但不是研究问题的重点。为了确保结果尽可能准确,控制这些变量是很重要的。

分析数据。一旦进行了实验并收集了数据,使用适当的统计方法分析数据是很重要的。这有助于得出有效的结论,避免解释错误。

9. 结论

总之,假设检验是研究中的一个基本工具,它使我们能够做出数据驱动的决策,并根据样本得出关于总体的结论。通过遵循假设检验的五个关键步骤,理解原假设和备择假设之间的差异,选择正确的检验类型,正确解释 p 值,研究人员可以从他们的数据中做出有意义的推论和结论。

然而,重要的是要意识到与假设检验相关的常见陷阱和错误,并设计出产生可靠结果的有效实验。通过继续练习和学习假设检验,你可以提高你的技能,提高你进行合理研究的能力。最终,假设检验可以帮助我们获得洞察力,做出更好的决策,并为各自领域 (如金融) 的知识进步做出贡献。

10. 参考资料

11. 相关推文

Note:产生如下推文列表的 Stata 命令为:
lianxh 检验
安装最新版 lianxh 命令:
ssc install lianxh, replace

相关课程

免费公开课

最新课程-直播课

专题 嘉宾 直播/回看视频
最新专题 文本分析、机器学习、效率专题、生存分析等
研究设计 连玉君 我的特斯拉-实证研究设计-幻灯片-
面板模型 连玉君 动态面板模型-幻灯片-
面板模型 连玉君 直击面板数据模型 [免费公开课,2小时]
  • Note: 部分课程的资料,PPT 等可以前往 连享会-直播课 主页查看,下载。

课程主页

课程主页

关于我们

  • Stata连享会 由中山大学连玉君老师团队创办,定期分享实证分析经验。
  • 连享会-主页知乎专栏,700+ 推文,实证分析不再抓狂。直播间 有很多视频课程,可以随时观看。
  • 公众号关键词搜索/回复 功能已经上线。大家可以在公众号左下角点击键盘图标,输入简要关键词,以便快速呈现历史推文,获取工具软件和数据下载。常见关键词:课程, 直播, 视频, 客服, 模型设定, 研究设计, stata, plus, 绘图, 编程, 面板, 论文重现, 可视化, RDD, DID, PSM, 合成控制法

连享会小程序:扫一扫,看推文,看视频……

扫码加入连享会微信群,提问交流更方便

✏ 连享会-常见问题解答:
https://gitee.com/lianxh/Course/wikis

New! lianxh 命令发布了:
随时搜索连享会推文、Stata 资源,安装命令如下:
. ssc install lianxh
使用详情参见帮助文件 (有惊喜):
. help lianxh