作者:连玉君 (中山大学)
E-Mail: arlionn@163.com
使用 cntrade
命令下载个股和指数日资料,合并后估计 CAPM 模型,以便得到个股的贝塔(beta)系数,进而对个股的 贝塔(beta)系数 进行统计分析。
1. 下载个股交易资料
1.1 下载方法
特别说明: - 后文使用外部命令 cntrade
下载某只股票的日交易资料。请确保使用最新版的 cntrade
- 版本 1:ssc: 使用
ssc install cntrade, replace
命令下载最新版命令。 - 版本 2:github:
- 使用
ssc install github, replace
命令 (若已安装,请忽略此步骤); - 使用
github install Stata-club/cntrade, replace
- 使用
只需输入如下命令即可下载 贵州茅台 自上市起至昨日的日交易数据,下载后的数据自动存储于当前工作路径下,名称为 “600519.dta”:
cntrade 600519
. use "600519.dta", clear
. describe
Contains data from d:\cnstock\beta\data/600519.dta
obs: 3,956
vars: 13 12 Apr 2018 09:17
size: 395,600
variable name type variable label
stkcd long Stock Code
date double Trading Date
stknme str12 Stock Name
clsprc double Closing Price
hiprc double Highest Price
lowprc double Lowest Price
opnprc double Opening Price
rit double Daily Return
turnover double Turnover rate
volume long Trading Volume
transaction double Trading Amount in RMB
tcap double Total Market Capitalization
mcap double Circulation Market Capitalization
Sorted by: date
1.2 Stata 范例
global id="600519" //600519 贵州茅台
cntrade $id
global nn = stknme[1] //股票简称
use "$id.dta", clear
tsset date //设定为时间序列变量
tsline clsprc , xlabel(,angle(60)) subtitle("$nn $id")
graph export "$out\price_$id.png", replace
2. 下载指数数据
2.1 基本下载方法
只需在 cntrade
命令后附加 index
- 000001 The Shanghai Composite Index (上证综合指数).
- 000300 CSI 300 Index (沪深 300).
- 399001 Shenzhen Component Index (深成指).
. cntrade 399001, index
File tempcsvfile.csv (text file)
file 399001.dta has been saved
. use "399001.dta", clear
. describe
Contains data from 399001.dta
obs: 6,587
vars: 10 12 Apr 2018 09:26
size: 526,960
variable name type variable label
indexcd long Index Code
date double Trading Date
indexnme str12 Index Name
clsprc double Closing Price
hiprc double Highest Price
lowprc double Lowest Price
opnprc double Opening Price
rmt double Daily Return
volume double Trading Volume
transaction double Trading Amount in RMB
Sorted by: date
2.2 批量下载多个指数并做进一步处理
foreach i in "399001" "000001" "000300" {
cntrade `i', index
rename rmt retmkt_`i' //更该指数收益名称,便于与个股合并
save index_`i'.dta, replace
erase `i'.dta
2.3 Stata 范例:沪深 300 时序图
* 调用其中一个指数数据:
use index_000300.dta, clear // 沪深300指数
tsset date
tsline clsprc , xlabel(,angle(60)) subtitle("沪深300指数")
3. 合并个股和指数数据
use "index_399001.dta", clear
merge 1:1 date using "$id.dta", nogen
gen year = year(date)
order date year index* stk* ret*
save "merge_$id.dta", replace
4. 估计 CAPM 模型
4.1 基本模型
use "merge_$id.dta", clear
*winsor2 rit, replace // winsor 处理
reg rit retmkt
. reg rit retmkt
Source | SS df MS Number of obs = 3,956
-------------+---------------------------------- F(1, 3954) = 1246.43
Model | .415684439 1 .415684439 Prob > F = 0.0000
Residual | 1.31865845 3,954 .0003335 R-squared = 0.2397
-------------+---------------------------------- Adj R-squared = 0.2395
Total | 1.73434289 3,955 .000438519 Root MSE = .01826
rit | Coef. Std. Err. t P>|t| [95% Conf. Interval]
retmkt_399001 | 0.565 0.016 35.30 0.000 0.533 0.596
_cons | 0.001 0.000 4.42 0.000 0.001 0.002
4.2 散点图和拟合情况
#delimit ;
(scatter rit retmkt if year<2008&abs(retmkt)<0.4,
xline(0,lp(dash) lc(red))
yline(0,lp(dash) lc(red)) msize(*0.2))
(lfit rit retmkt);
graph export "$out\scatter_$id.png", replace ;
#d cr
4.3 分时段估计
global yr = 2008
reg rit retmkt if year<$yr //&abs(retmkt)<0.4 // OLS
aaplot rit retmkt if e(sample), xline(0,lp(dash) lc(red)) ///
yline(0,lp(dash) lc(red)) msize(*0.6) ///
title("$nn ($id) 的 Beta 系数, 1998-2007") ///
graph export "$out\aaplot_$id_b$yr.png", replace
*-下载 regfit 命令
. github install arlionn/regfit // 若已经有该命令,可以忽略本行命令
regfit, f(%4.2f) tvalue //呈现拟合方程

. regfit, f(%4.2f) tvalue //呈现拟合方程
rit = 0.00 + 0.61*retmkt_399001
(3.90) (20.44)
N = 1466, R2 = 0.22, adj-R2 = 0.22
Note: t-value in parentheses
reg rit retmkt if year>=$yr //&abs(retmkt)<0.4 // OLS
aaplot rit retmkt if e(sample), xline(0,lp(dash) lc(red)) ///
yline(0,lp(dash) lc(red)) msize(*0.6) ///
title("$nn ($id) 的 Beta 系数, 2008-2017") ///
graph export "$out\aaplot_$id_a$yr.png", replace
regfit, f(%4.2f) tvalue //呈现拟合方程

. regfit, f(%4.2f) tvalue //呈现拟合方程
rit = 0.00 + 0.54*retmkt_399001
(2.44) (28.93)
N = 2490, R2 = 0.25, adj-R2 = 0.25
Note: t-value in parentheses
5. 分析个股 Beta 系数变化特征
5.1 逐年回归
. bysort year: reg rit retmkt, noheader
-> year = 1998
no observations
-> year = 1999
no observations
-> year = 2000
no observations
-> year = 2001
rit | Coef. Std. Err. t P>|t| [95% Conf. Interval]
retmkt_399001 | 0.598 0.117 5.09 0.000 0.364 0.831
_cons | 0.004 0.002 1.65 0.102 -0.001 0.008
-> year = 2017
rit | Coef. Std. Err. t P>|t| [95% Conf. Interval]
retmkt_399001 | 0.624 0.118 5.28 0.000 0.392 0.857
_cons | 0.003 0.001 2.90 0.004 0.001 0.005
-> year = 2018
rit | Coef. Std. Err. t P>|t| [95% Conf. Interval]
retmkt_399001 | 0.731 0.158 4.64 0.000 0.416 1.047
_cons | 0.001 0.002 0.30 0.764 -0.004 0.005
5.2 逐年回归: 更为简洁的处理方法
statsby _b[retmkt], by(year) saving("beta_data.dta", replace): ///
reg rit retmkt
use "beta_data.dta", clear
keep if _stat!=.
qui sum year
local byr = r(min)
local eyr = r(max)
#d ;
twoway connect _stat year,
yline(1, lpattern(dash) lcolor(red*0.3))
ylabel(,angle(0) format(%2.1f))
subtitle("$nn ($id) 的Beta系数")
ytitle("beta") xtitle("");
#d cr
graph export "$out\beta $nn $id.png", replace

