Stata绘图:精美的散点图和线性拟合图-scatterfit-slopefit

发布时间:2023-07-16 阅读 2951

Stata连享会   主页 || 视频 || 推文 || 知乎 || Bilibili 站

温馨提示: 定期 清理浏览器缓存,可以获得最佳浏览体验。

New! lianxh 命令发布了:
随时搜索推文、Stata 资源。安装:
. ssc install lianxh
详情参见帮助文件 (有惊喜):
. help lianxh
连享会新命令:cnssc, ihelp, rdbalance, gitee, installpkg

课程详情 https://gitee.com/lianxh/Course

课程主页 https://gitee.com/lianxh/Course

⛳ Stata 系列推文:

PDF下载 - 推文合集

作者:刘东 (中国农业大学)
E-mailld01@cau.edu.cn

Sourcehttps://github.com/leojahrens/scatterfit


目录


1.简介

scatterfit 可生成多种散点图并在其上叠加拟合线。它包含两个命令:scatterfit 用于可视化两个变量 x 和 y 之间的关系,slopefit 用于可视化在另一个连续变量 z 条件下 x 和 y 之间的关系。

2.安装命令

. ssc install scatterfit, replace 
. help scatterfit
. help slopefit

要求: Stata version 13.1 及以上版本,并且需要安装 gtools, ftools, palettes, colrspace, blindschemes, labutil 命令。

. ssc install gtools
. ssc install ftools
. ssc install palettes
. ssc install colrspace
. ssc install blindschemes
. ssc install labutil

3. scatterfit 实例

调入数据

. sysuse "auto.dta", clear

画出表示 weight 和 length 之间的散点图

. scatterfit weight length

在散点图的拟合线上添加置信区间

. scatterfit weight length, fit(lfitci)

局部多项式拟合

. scatterfit weight length, fit(polyci) bw(10)

bwidth(num)表示用于控制局部多项式或 LOWESS 平滑拟合线平滑程度的带宽参数。

按照不同的分类 ( 是否为 foreign)展示 weight 和 length 之间的散点图和拟合线

. scatterfit weight length, by(foreign)

将 X 轴变量基于分位点切分成大小相等的区间,并在这些区间内绘制 Y 变量和 X 变量的均值

. scatterfit weight length, binned nq(20)

nq(num) 表示选择等大小的分组 / 分位数的数量。参数 num 用于指定要将变量分成多少个等大小的组 / 分位数。具体来说,该命令将变量的值分为 num 个等大小的分组 / 分位数,以进行后续的分析或可视化。

scatterfit 可以对数据进行预处理,以便在考虑控制变量后,仅显示 x 和 y 变量之间的残差协变关系。这是通过首先在控制变量上回归 x 和 y 变量,然后使用残差进行绘图来实现的

. scatterfit weight length, controls(trunk) ///
             fcontrols(foreign)             ///
             regparameters(coef sig pval)

4.slopefit 实例

Slopefit 可以在一个连续变量 z 的条件下,可视化 x 和 y 之间的关系。它也可以创建带有拟合线的散点图。散点图和拟合线都显示了在不同的 z 值下 x 的斜率(即效应)。拟合线是从一个简单的交互模型中得出的,该模型假设 x 的效应随 z 线性变化。相比之下,散点图显示了在用户定义的 z 分组中(例如,z 的第一十分位数等)x 的效应。这些单独的斜率是从一个交互回归模型中得出的,该模型使用 z 的分解版本来获取不同子集的 z 的分别斜率系数。

有几种方法可以创建 z 的分段。与 scatterfit 一样,标准设置是根据分位数截断点将 z 分类为等大小的分段。

. slopefit weight length turn, ///
    indslopes(quantiles) nquantiles(20)

此时,拟合线显示了连续交互模型的结果,最底部的散点标记显示的是在 z 分布的最低 5% 范围内 x 的效应。

scatterfit 类似, 也可以通过将 z 排序为等间距的分段来创建这些分段。 the bins can also be created by sorting z into equally spaced bins.

. slopefit weight length turn,  ///
    indslopes(unibin) nunibin(20)

或者将 z 本身视为离散变量, 并使用 z 的每个不同的值来创建分段。这意味着将 z 的每个不同取值单独作为一个分段,并在每个分段中计算 x 的效应。

. slopefit weight length turn,  ///
    indslopes(discrete)

也可以附加 indslopesci 选项,以绘制个别斜率的置信区间,对于每个不同的左右自我定位值,都可以进行绘制。indslopesci 的作用是计算和绘制个别斜率的置信区间。该选项通常用于多元回归分析中,用于检验每个自变量的效应是否显著。

. slopefit weight length turn,  ///
    indslopes(discrete) ci indslopesci

相关课程

免费公开课

最新课程-直播课

专题 嘉宾 直播/回看视频
最新专题 文本分析、机器学习、效率专题、生存分析等
研究设计 连玉君 我的特斯拉-实证研究设计-幻灯片-
面板模型 连玉君 动态面板模型-幻灯片-
面板模型 连玉君 直击面板数据模型 [免费公开课,2小时]
  • Note: 部分课程的资料,PPT 等可以前往 连享会-直播课 主页查看,下载。

课程主页

课程主页

关于我们

  • Stata连享会 由中山大学连玉君老师团队创办,定期分享实证分析经验。
  • 连享会-主页知乎专栏,700+ 推文,实证分析不再抓狂。直播间 有很多视频课程,可以随时观看。
  • 公众号关键词搜索/回复 功能已经上线。大家可以在公众号左下角点击键盘图标,输入简要关键词,以便快速呈现历史推文,获取工具软件和数据下载。常见关键词:课程, 直播, 视频, 客服, 模型设定, 研究设计, stata, plus, 绘图, 编程, 面板, 论文重现, 可视化, RDD, DID, PSM, 合成控制法

连享会小程序:扫一扫,看推文,看视频……

扫码加入连享会微信群,提问交流更方便

✏ 连享会-常见问题解答:
https://gitee.com/lianxh/Course/wikis

New! lianxh 命令发布了:
随时搜索连享会推文、Stata 资源,安装命令如下:
. ssc install lianxh
使用详情参见帮助文件 (有惊喜):
. help lianxh