Stata连享会 主页 || 视频 || 推文 || 知乎 || Bilibili 站
温馨提示: 定期 清理浏览器缓存,可以获得最佳浏览体验。
New!
lianxh
命令发布了:
随时搜索推文、Stata 资源。安装:
. ssc install lianxh
详情参见帮助文件 (有惊喜):
. help lianxh
连享会新命令:cnssc
,ihelp
,rdbalance
,gitee
,installpkg
⛳ Stata 系列推文:
作者: 申维冰 (新加坡国立大学)
邮箱: e0431418@u.nus.edu
目录
本文实操代码,视频讲解可以在 码云仓库 中获取:
Tushare 大数据开放社区是一个免费提供各类金融数据,助力智能投资与创新型投资的平台。Tushare 旧版本已经运行三年多,数据在广度和深度都得到了提升。最近推出的 Tushare Pro 版本则是在此基础上做了更大的改进。其涵盖的数据包括八大类,分别是:
pip install tushare
,如果安装网络超时,可尝试国内 pip 源,如:pip install tushare -i https://pypi.tuna.tsinghua.edu.cn/simple
import tushare as ts # 导入 Tushare
ts.set_token('your token here') # 只需要在第一次或者 token 失效后调用
pro = ts.pro_api() # 初始化 pro 接口
为了方便大家理解,我们用一个具体实例来展示 Tushare 获取金融数据的方法。具体地,以获取沪深股票的基础信息为例,通过 pro 的接口调取股票代码、名称、上市日期、退市日期等信息。
名称 | 类型 | 必选 | 描述 |
---|---|---|---|
is_hs | str | N | 是否沪深港通标的,N否 H沪股通 S深股通 |
list_status | str | N | 上市状态 L上市 D退市 P暂停上市,默认是L |
exchange | str | N | 交易所 SSE上交所 SZSE深交所 |
ts_code | str | N | TS股票代码 |
market | str | N | 市场类别 |
limit | int | N | |
offset | int | N | |
name | str | N | 名称 |
名称 | 类型 | 默认显示 | 描述 |
---|---|---|---|
ts_code | str | Y | TS代码 |
symbol | str | Y | 股票代码 |
name | str | Y | 股票名称 |
area | str | Y | 地域 |
industry | str | Y | 所属行业 |
fullname | str | N | 股票全称 |
enname | str | N | 英文全称 |
cnspell | str | N | 拼音缩写 |
market | str | Y | 市场类型 (主板/创业板/科创板/CDR) |
exchange | str | N | 交易所代码 |
curr_type | str | N | 交易货币 |
list_status | str | N | 上市状态 L上市 D退市 P暂停上市 |
list_date | str | Y | 上市日期 |
delist_date | str | N | 退市日期 |
is_hs | str | N | 是否沪深港通标的,N否 H沪股通 S深股通 |
上表中展示的是在获取沪深股票基本信息时,每个参数所代表的含义。类型列中,“str” 代表这是一个字符串类型,“int” 代表这是一个整数类型。必选列中若显示 “Y” 则表示这一参数为必选项,若为 “N” 则表示这一参数非必选。我们以具体代码为例进行解释:
# 查询当前所有正常上市交易的股票列表
data = pro.stock_basic(exchange = '', list_status = 'L', \
fields = 'ts_code, symbol, name,area, industry, list_date')
exchange = ''
表示不指定交易所类别;list_status = 'L'
表示上市状态为 “L”,即上市;fields = 'ts_code, symbol, name, area, industry, list_date'
表示输出股票的 TS 代码 (ts_code),股票代码 (symbol),股票名称 (name),地域 (area),所属行业 (industry) 和上市日期 (list_date)。上述代码采用的是 Tushare Pro 接口下的 pro.stock_basic
成员函数。当然,我们也可以使用 Tushare Pro 接口下的 pro.query
成员函数,并在第一个参数的位置指定为 stock_basic
。
#查询当前所有正常上市交易的股票列表
data = pro.query('stock_basic', exchange = '', list_status = 'L', \
fields = 'ts_code, symbol,name, area, industry, list_date')
以上两种方式均可得到相同的结果,下图为结果样例:
Tushare 不仅可以抓取股票数据,它还可以实现期货行情数据的抓取和清洗。接下来就为大家介绍一下 Tushare 如何获取期货数据,以及如何实现数据标准化。
交易所名称 | 交易所代码 | 合约后缀 |
---|---|---|
郑州商品交易所 | CZCE | .ZCE |
上海期货交易所 | SHFE | .SHF |
大连商品交易所 | DCE | .DCE |
中国金融期货交易所 | CFFEX | .CFX |
上海国际能源交易所 | INE | .INE |
合约类型 | 定义 | Tushare 代码举例 |
---|---|---|
交易合约 | 具有特定交易日期的、可以交易的期货合约 | ZC1812.ZCE, IF1812.CFX |
主力合约 | 持仓量、成交量最大的合约 | ZC.ZCE, CU.SHF |
连续合约 | 当前交割月的合约 | ZCL.ZCE, CUL.SHF |
在连续合约中,中金所的连续合约代码规则为:
合约代码 | 连续类型 |
---|---|
IFL.CFX | 当月连续 |
IFL1.CFX | 次月连续 |
IFL2.CFX | 当季连续 |
IFL3.CFX | 下季连续 |
在 Tushare 期货数据里,如果提取跟行情相关的数据,例如日线行情、每日结算参数等,都需要带交易所后缀的,比如 CU1811.SHF;如果是提取跟品种相关数据,例如持仓排名,仓单数据等,只需要输入品种代码,比如 CU: 沪深 300 期货。
df = pro.fut_daily(ts_code = 'IFL.CFX', \
start_date = '20180101', end_date = '20210701')
df = pro.fut_holding(trade_date = '20210701', \
symbol = 'C', exchange = 'DCE')
df = pro.fut_wsr(trade_date = '20210701', symbol = 'ZN')
df = pro.fut_settle(trade_date = '20210701', exchange = 'SHFE')
某些特定数据可能需要用户的积分达到一定数量才可以获取,这时我们就可以前往「Tushare 官网社区交流中心」,加入 Tushare 高校和机构用户群,通过以下步骤免费获取积分:
当然,我们只简单介绍了 Tushar 若干功能中的一小部分。这个免费的大数据平台还有更多公开的金融数据,有数据需求的小伙伴可以访问「Tushare 官网」 来获得详细信息。还在等什么,赶紧开启你的金融数据挖掘之旅吧!
Note:产生如下推文列表的 Stata 命令为:
lianxh API 公开 开放, m
安装最新版lianxh
命令:
ssc install lianxh, replace
免费公开课
最新课程-直播课
专题 | 嘉宾 | 直播/回看视频 |
---|---|---|
⭐ 最新专题 | 文本分析、机器学习、效率专题、生存分析等 | |
研究设计 | 连玉君 | 我的特斯拉-实证研究设计,-幻灯片- |
面板模型 | 连玉君 | 动态面板模型,-幻灯片- |
面板模型 | 连玉君 | 直击面板数据模型 [免费公开课,2小时] |
⛳ 课程主页
⛳ 课程主页
关于我们
课程, 直播, 视频, 客服, 模型设定, 研究设计, stata, plus, 绘图, 编程, 面板, 论文重现, 可视化, RDD, DID, PSM, 合成控制法
等
连享会小程序:扫一扫,看推文,看视频……
扫码加入连享会微信群,提问交流更方便
✏ 连享会-常见问题解答:
✨ https://gitee.com/lianxh/Course/wikis
New!
lianxh
命令发布了:
随时搜索连享会推文、Stata 资源,安装命令如下:
. ssc install lianxh
使用详情参见帮助文件 (有惊喜):
. help lianxh