Stata:缺失值填充的又一利器!

发布时间:2022-09-02 阅读 459

Stata连享会   主页 || 视频 || 推文 || 知乎 || Bilibili 站

温馨提示: 定期 清理浏览器缓存,可以获得最佳浏览体验。

New! lianxh 命令发布了:
随时搜索推文、Stata 资源。安装:
. ssc install lianxh
详情参见帮助文件 (有惊喜):
. help lianxh
连享会新命令:cnssc, ihelp, rdbalance, gitee, installpkg

课程详情 https://gitee.com/lianxh/Course

课程主页 https://gitee.com/lianxh/Course

⛳ Stata 系列推文:

PDF下载 - 推文合集

作者:初虹 (山东财经大学)
邮箱ch2099058972@163.com


目录


1. Stata 中的缺失值

Stata 中的缺失值 (missing value) 是一个大于任何自然数的数,并以 . 呈现。其基础知识大致分为三部分:标记、查找/删除和补充。本文主要介绍 Stata 中功能较为全面的用以补充缺失值的第三方命令:fillmissing。关于其他内容,可以移步下面的简要指引:

缺失值的标记:help mvdecode

缺失值的查找与删除

补充缺失值

2. fillmissing 命令介绍

2.1 fillmissing 命令安装

ssc install fillmissing, replace

安装完成之后,可以 which fillmissing 查看 fillmissing 的安装位置和版本号等信息,具体使用方法可通过 help fillmissing 查看。

2.2 fillmissing 命令语法

[bysort varlist]: fillmissing varname [if] [in], [with(with_options)]
  • with(any):最好用来填充常量变量 (constant variable),因为会任意从非缺失值中填充缺失值。如果未指定 with_options,则作为默认值;
  • with(previous):使用前面的值填充当前的缺失值。如果前面的值也缺失,则当前值保持缺失状态。另外,该选项并不对数据进行排序操作,因此无论当前数据的排序如何,填充都将使用当前的排序状态来标识当前缺失值和前面的观测值;
  • with(next):与 with(previous) 类似,使用后面的值填充当前的缺失值。如果后面的值也缺失,则当前值保持缺失状态。另外,该选项并不对数据进行排序操作,因此无论当前数据的排序如何,填充都将使用当前的排序状态来标识当前缺失值和后面的观测值;
  • with(first):使用当前排序状态下的第一个值替换所有的缺失值。或者搭配 bysort,将使用每个组的第一个值;
  • with(last):使用当前排序状态下的最后一个值替换所有的缺失值。或者搭配 bysort,将使用每个组的最后一个值;
  • with(mean):使用非缺失值的平均值替换缺失值。变量类型只能为数值型 (numeric variable);
  • with(median):使用非缺失值的中位数替换缺失值。变量类型只能为数值型 (numeric variable);
  • with(min):使用非缺失值的最小值替换缺失值。变量类型只能为数值型 (numeric variable);
  • with(max):使用非缺失值的最大值替换缺失值。变量类型只能为数值型 (numeric variable)。

3. fillmissing 命令示例

首先生模拟数据。其中,数据分为两组,以 id 标识。变量 k 为数值型变量 (numeric variable)。

. clear all
. input id k
      id   k
  1.   1   3
  2.   1   5
  3.   1   .
  4.   1   .
  5.   1   7
  6.   2   .
  7.   2   .
  8.   2   4
  9.   2   8
 10.   2   .
 11. end

下面的命令分别对应着 with_option 的几个选项,随后图片给出了每行命令的运行结果。

. bys id: fillmissing k, with(any)
. bys id: fillmissing k, with(previous)
. bys id: fillmissing k, with(next)
. bys id: fillmissing k, with(first)
. bys id: fillmissing k, with(last)
. bys id: fillmissing k, with(mean)
. bys id: fillmissing k, with(median)
. bys id: fillmissing k, with(min)
. bys id: fillmissing k, with(max)

通过图片可以很容易理解每个 with_option 选项的含义,此不再赘述。

4. 相关推文

Note:产生如下推文列表的 Stata 命令为:
lianxh 缺失值, m
安装最新版 lianxh 命令:
ssc install lianxh, replace

相关课程

免费公开课

最新课程-直播课

专题 嘉宾 直播/回看视频
最新专题 文本分析、机器学习、效率专题、生存分析等
研究设计 连玉君 我的特斯拉-实证研究设计-幻灯片-
面板模型 连玉君 动态面板模型-幻灯片-
面板模型 连玉君 直击面板数据模型 [免费公开课,2小时]
  • Note: 部分课程的资料,PPT 等可以前往 连享会-直播课 主页查看,下载。

课程主页

课程主页

关于我们

  • Stata连享会 由中山大学连玉君老师团队创办,定期分享实证分析经验。
  • 连享会-主页知乎专栏,700+ 推文,实证分析不再抓狂。直播间 有很多视频课程,可以随时观看。
  • 公众号关键词搜索/回复 功能已经上线。大家可以在公众号左下角点击键盘图标,输入简要关键词,以便快速呈现历史推文,获取工具软件和数据下载。常见关键词:课程, 直播, 视频, 客服, 模型设定, 研究设计, stata, plus, 绘图, 编程, 面板, 论文重现, 可视化, RDD, DID, PSM, 合成控制法

连享会小程序:扫一扫,看推文,看视频……

扫码加入连享会微信群,提问交流更方便

✏ 连享会-常见问题解答:
https://gitee.com/lianxh/Course/wikis

New! lianxhsongbl 命令发布了:
随时搜索连享会推文、Stata 资源,安装命令如下:
. ssc install lianxh
使用详情参见帮助文件 (有惊喜):
. help lianxh