基于已实现跳跃GARCH模型的波动率预测研究
- 格式:docx
- 大小:46.16 KB
- 文档页数:14
基于已实现跳跃GARCH模型的波动率预测研究
侯信盟; 吴鑫育
【期刊名称】《《郑州航空工业管理学院学报》》
【年(卷),期】2019(037)005
【总页数】10页(P86-95)
【关键词】波动率; 已实现GARCH模型; 跳跃因子; 高频数据
【作者】侯信盟; 吴鑫育
【作者单位】安徽财经大学金融学院安徽蚌埠233000
【正文语种】中文
【中图分类】F832.6
一、引言
对金融资产收益和风险管理的相关研究一直是金融学界的核心问题之一,现有的资产定价模型多以欧美等发达国家成熟的金融市场为模型的理论基础搭建而成[1]。
波动率作为影响资产定价的核心因子之一,成为现代金融学研究热点。
波动率是衡量市场中金融资产风险和收益的指标,已成为市场管理者和参与者进行相关操作参考的重要依据,被广泛应用于金融投资与风险管理当中[2][3]。
经典的线性计量模型一般假定时间序列的方差恒定不变。
在现实的金融市场中,随着时间的推移,时间序列的方差是不断波动的,为克服原有局限性,
Engle(1982)[4]创新性地提出了以方差为时间变量对收益率建模的自回归条件异方
差(ARCH)模型,为金融时间序列波动性的研究开辟了新的思路。
但由于ARCH模型存在滞后项冗余,待估参数精确度低等问题,Bollerslev(1986)[5]将原有模型进行改进,提出了广义自回归条件异方差(GARCH)模型,实证结果表明模型预测有一定改进。
张曼等(2016)[6]将中位数GARCH模型运用于人民币兑美元汇率的实证研究,表明该模型可减少预测误差。
单从日收益率中提取的信息含量过低,条件方差的缓慢调整使得标准GARCH模型需要很长时间才能适应新的波动率变化,越来越不适应市场参与者追求更加精密信息集的要求。
随着现代信息技术的发展,高频数据变得越来越容易获取,大量学者也在尝试将高频数据加入模型中,结果显示高频数据的采用的确可以提高波动率预测。
Shephard等(2010)[7]构建了高频波动率模型(high frequency based volatility),实证表明该模型可识别波动率的动量和均值回复效应。
Hansen 和Huang(2012)[8]提出了包含已实现波动率的已实现 GARCH模型,实证结果优于传统GARCH模型[9]。
龚玉婷等(2014)[10]基于自回归混频抽样模型研究了金融市场一阶矩收益和二阶矩波动的日度信息对CPI短期预测的影响,结果表明高频的收益率和波动率均有助于CPI短期预测,且混频抽样模型可以实现实时预测。
于孝建和王秀花(2017)[11]将包含日内高频收益率、日收益率和已实现波动率的混频数据加入已实现GARCH模型中对2013~2016年沪深300指数波动率进行预测,发现混频已实现GARCH模型比标准已实现GARCH模型在预测能力方面有一定提高。
有不少学者将跳变系数加入模型中,细化波动率分解。
吴恒煜等(2015)[12]对已实现波动率异质自回归模型(HAR-RV)进行了拓展,发现区分跳跃波动方向和考虑波动结构转换特征可以显著提升样本预测能力。
宋亚琼、王新军(2016)[13]以上证综指为研究对象,通过构建包含跳跃强度的HAR-TCI和HAR-TCJI模型,考察了跳变测度在波动率建模中的作用。
瞿慧、周惠(2016)[14]将跳跃强度与联跳强度加入
向量异质自回归模型后对沪深300股指期货构造动态套期保值策略,结果发现,
改进的模型所提供的保值策略明显优于常用二元GARCH模型。
王明涛等(2017)[15]利用沪深300指数期货数据,分离已实现波动率中的连续波动和跳跃
幅度与次数的时间序列,发现国内期货市场具有连续且显著的波动,跳跃次数具有显著的日效应。
可见部分学者通过研究国内金融市场,也发现了不同市场结构中的跳跃效应。
国外学者Barunik等(2016)[16]将跳变方差加入方差方程,提出了Realized jump GARCH模型,也就是已实现的跳跃GARCH模型。
该模型在原有已实现GARCH 模型的基础上,加入跳跃因子,同时考虑了已实现的方差和已实现双幂次变差因素。
国内运用此模型对股票市场波动率进行预测的研究较为少见,本文通过运用改进后的模型与现有的波动率预测模型进行实证对比,论证构建模型的合理性。
二、模型介绍
(一)GARCH模型
Bollerslev(1986)[5]将原有ARCH模型进行改进,提出了广义自回归条件异方差(GARCH)模型,GARCH(p,q)模型形式表述如下:
rt=ut+at
(1)
(2)
(3)
(1)式被称为均值方程,式中的rt是金融资产收益率。
(2)式中zt假定服从均值为0,方差为1的独立同分布。
(3)式称为条件方差方程,式中ht是条件方差,αi ht-1
是ARCH项,p是ARCH项阶数,是GARCH项,q为GARCH项的阶数。
为确
保GARCH(p, q)模型过程的平稳性,一般设定参数参数之和越接近于1,表明测
度的方差波动性衰减速度越慢,所具有的波动率持续性就越强。
(二)已实现GARCH模型
Hansen和Huang(2012)[8]在GARCH模型的基础上,提出了已实现GARCH模型(Realized GARCH model)。
与标准的GARCH模型相比,新模型加入了高频数据、杠杆函数等更多的信息。
模型不仅具有更为丰富的内容,其计算方法也相对简单。
已实现GARCH(p,q)模型表述如下:
(4)
(5)
logxt=ξ+φloght+τ(zt)+ut
(6)
(7)
(5)、(6)式都进行了对数线性处理,式(5)中的变量可以写成ARMA模型的表现形式,其结构形式更加稳定。
对数线性处理的另一个优势是确保了条件方差的正向性,零值不会进入已实现GARCH方程,收益为零的值就不会引起任何规范性问题。
度量方程(6)式中引入了更易于捕捉收益率和波动率关系的二次型杠杆函数τ(zt),区分了正负冲击对市场行为的不同影响。
加权新息被进一步细化为已实现测度的过去值、二次杠杆函数、变量的累加之和。
(三)已实现跳跃GARCH模型
Merton(1976)[17]在研究股市时指出,股票价格不是连续的,在短时间内会存在
大幅度的涨跌,也就是跳跃。
按照有效市场假说的理解,跳跃就是新息在股价中的
反映。
在金融建模中,是股票在t时刻的对数价格,服从如下的跳跃扩散过程:dpt=ut+δtdWt+ktdqt
(8)
ut是漂移函数,δt为右连续且存在左极限的严格为正的随机波动过程,Wt是标
准布朗运动,kt是对数价格跳跃规模的正态分布过程,qt代表了时变强度的泊松
计数过程。
Barndorff和Nielsen(2006)[18]提出构造统计量将波动过程分解为积分方差和跳
跃方差,整个方差分为连续样本路径和跳跃两部分,可导出:
(9)
假定不考虑由买卖价差、闭市效应、非同步交易等因素产生的微观结构噪声的影响,如果没有发生跳跃,按照Andersen和Bollerslev(1998)[19]对已实现波动率的计量,已实现的波动率RV是计算期第t日观测到的收益率的平方和,每日交易被分割为M段,当M趋向于无穷大时:
(10)
公式(10)表明已实现的方差的准确度是受抽样频率大小影响的,在没有观测误差并且价格保持连续的前提下,两者之间呈现随抽样频率提高而增强的正相关。
股市的交易不是一直连续的,但如果抽样时间足够小,△t→0,M→∞时,按照Barndorff-Nielsen和Shephard(2004)[20]双幂次变差(BV)的理论,已实现双幂次变差可以
度量积分方差:
(11)
由式(10)~(11)便可得到跳跃方差。
第t日双幂次跳跃方差可表示为:
(12)
BV是已实现双幂次变差,RV是已实现方差,如果RVt-BVt<0,则定义等(2016)[14]提出的已实现跳跃GARCH(1,1)模型可表述如下:
(13)
(14)
log(xt)=ξ+ φlog(ht)+τ(zt)+ut
(15)
(16)
其中,是已实现跳跃方差的测度,zt、ut分别假定服从于均值为0、方差为1和均值为0、方差为δu2 的连续独立同分布。
(四)模型极大似然估计
模型相关参数可以通过极大似然方法估计得出,模型对数似然函数如下:
(17)
变量Θ是模型中的参数向量,已实现的跳跃GARCH中的参数可以通过最大化(16)式求得。
(18)
三、实证研究
(一)数据来源与说明
样本的容量和抽样频率对实证结果有着较大影响。
单纯抽取日度收益数据将不能很好地提取当天的波动信息,但如果抽样频率过高又会加大微观结构噪声的影响。
本文通过对比研究,选取上证综指自2000年1月4日到2018年11月23日4
562个交易日的日收盘价以及五分钟高频交易价格作为样本数据进行研究。
本文
采用的数据均取自Wind资讯。
本文将总体样本划分为两个部分:2000年1月4日到2014年12月31日共计3 613个样本数据作为估计样本,用于样本内参数
估计;自2015年1月5日到2018年11月23日949个交易日数据作为预测评
价样本,用于样本外预测能力评价。
在数据处理方面,对所有的交易价格进行对数处理。
第t个交易日的指数对数收盘价记为pt,当日的指数收益率定义为:rt=pt-pt-1。
在实证分析中,已实现的波动
率测度为已实现的方差(RV),定义第t个交易日的其中rt,i是第t交易日的第i个
日内五分钟高频收益率。
跳跃方差的计算公式为:
表1 上证综指描述性统计指标均值最大值最小值标准差偏度峰度Jarque-
Berart0.00000.0951-0.09210.0158-0.34827.80624482
(0.0010)RV0.00020.00430.00000.00035.872257.2121584860(0.0010)BV0.00 020.00500.00000.00036.765977.95861102800(0.0010)xjt0.00000.00090.000
00.00018.9406121.97912751600(0.0010)
(二)描述性统计
图1 已实现的方差测度RV、已实现双幂次变差BV、双幂度跳跃方差时间序列图、收益率曲线QQ图
表1给出了上证综指对数指数收益率rt、已实现的方差RV、已实现双幂次方差BV、跳跃方差的描述性统计。
图1给出了时间序列图以及收益率曲线的QQ图。
从表1中可以看出,指数收益率曲线的均值接近于0,偏度小于0,呈现出左偏的趋势,峰度值大于3,呈现出厚尾分布的特征,Jarque-Bera统计量显著,拒绝正
态性假设;已实现的方差测度RV、已实现双幂次方差BV、双幂度跳跃方差的均
值均大于等于0,偏度也都大于0,集体表现出右偏的特征,峰度均大于3,同样
表现出厚尾的分布特征。
各自的Jarque-Bera统计量都拒绝其正态分布的假定。
图1时间序列图也证实上证综指对数收益率具有明显的波动率时变性和聚集性,QQ图表明收益率的分布并不服从正态分布。
(三)参数估计
使用极大似然估计方法对GARCH、已实现 GARCH 、已实现跳跃GARCH模型进行参数估计,可以得到各参数的估计结果及其标准误差、对数似然值(Log-lik)、赤池信息准则(AIC)和贝叶斯信息准则(BIC)。
为便于比较,表2给出了各项相应的值。
表2 参数估计结果参数GARCH已实现的GARCH已实现的跳跃GARCH方差方
程α0/ω0.0000(0.0000)0.0010(0.0026)-
0.4345(0.0025)αi/β0.0758(0.0050)0.5448(0.0019)0.5272(0.0021)βj/γ0.9132(0 .0056)0.4203(0.0018)0.3910(0.0020)γj0.2640(0.0039)度量方程ξ-
0.5357(0.0079)0.3689(0.0108)φ1.021(0.0016)1.1231(0.0019)d1-
0.0590(0.0045)-0.0606(0.0042)d20.1136(0.0028)0.1122(0.0027)Log-
lik10277.92779711.89729726.7510AIC-20549.8554-19407.7945-
19435.5021BIC-20531.2794-19356.3921-19377.6744
注:Log-lik是对数似然值,AIC是赤池信息准则,BIC是贝叶斯信息准则,()中是极大似然估计的渐近标准误差.
从表2的结果中可以看出,已实现GARCH 和已实现跳跃GARCH模型方差方程
中方差持续性系数(β+γ)的估计值都非常接近于1,这说明上证综合指数具有很高
的波动率持续性特征。
度量方程中杠杆系数符号相反,且统计量显著,这说明模型很好地捕捉到了上证综合指数的“杠杆效应”。
说明我国上海证券股票市场作为新兴市场之一,在信息分布、信息加工和信息传递等功能方面正不断完善,市场参与
者对非理性行为和大量交易噪声的应对更加从容,人为造成的价格波动不断降低,市场制度向更加成熟的方向发展。
判断模型拟合效果的依据是对数似然函数值、赤池信息准则(AIC)和贝叶斯信息准则(BIC),对数似然函数值越大,赤池信息准则(AIC)和贝叶斯信息准则(BIC)越小,说明模型拟合效果越好。
通过表2的指标,可以看出带跳跃的模型对数似然函数值要大于标准的已实现GARCH模型,同时AIC、BIC的值也小于已实现的GARCH模型,综上所述,已实现的跳跃GARCH模型拟合效果要比标准已实现GARCH有一定的改进。
图2、图3给出了已实现的GARCH、已实现的跳跃GARCH模型下的收益率rt、已实现的方差RVt、条件方差ht时间序列图。
从图2、图3右侧两图中可明显看到,2007年和2015年两次股灾时,两指标大幅度震荡。
股灾的发生不仅给股民
造成沉重的财产损失,也充分说明了进行风险管理的重要性和必要性。
图2 已实现的 GARCH模型下收益率rt、已实现的方差RVt、条件方差ht时间序列图
图3 已实现的跳跃GARCH模型下收益率rt、已实现的方差RVt、条件方差ht时间序列图
(四)样本外预测
本文中将样本分为样本内(数据日期自2000年1月4日到2014年12月31日3 613个交易日的日收盘价和5分钟高频交易价格)和样本外(数据日期自2015年1
月5日到2018年11月23日949个交易日的日收盘价和5分钟高频交易价格)两个评估阶段,采用滚动时间窗方法对模型进行估计。
具体方法是先将第一个样本外观测值(2015年1月5号)的数据添加到样本内,同时删除最新样本内数据的第一
个样本,也就是日期最早的那一个,如此不断重复,直到将样本外最后一个日期所对应的数据添加到样本内构建新模型为止。
以日度数据为拆分单位进行计量,理论上能较好地检验模型预测能力。
但我国股市在2007年和2015年经历了两次剧烈
波动,在一定程度上抑制了二级市场的投资情绪,给投资者带来了经济损失,也暴露了很多金融市场的问题。
这一方面说明了我国股票市场还存在着这样那样的问题,值得市场管理者进一步发掘和完善;另一方面,对于市场参与者而言,准确预测风险,进行合理的资源配置、降低投资风险的重要性不言而喻。
通常选用的损失函数指标有均方根误差(RMSE)、平均绝对误差(MAE)和平均绝对
百分比误差(MAPE):
(22)
(23)
(24)
其中L为上证综合指数的样本外数据长度(个数),m为估计波动率所采用的模型(已实现的GARCH模型和已实现的跳跃GARCH模型两种)。
图4、图5给出了已实现方差和模型预测方差的时间序列图。
表3给出了两种模型的评价指标数值。
评判标准是各损失函数对应的结果,其数值越小,模型的改进效果越好。
总体而言,植入跳跃因子的模型预测效果要比标准已实现GARCH模型表现要好。
表3 波动率预测结果
模型SSECRMSEMAEMAPE已实现GARCH2.0229e-071.7874e-040.8598已实现的跳跃GARCH1.8209e-071.6265e-040.8660
图4 上证综合指数已实现GARCH模型下的条件方差预测结果
图5 上证综合指数已实现的跳跃GARCH模型下的条件方差预测结果
四、总结与建议
本文以上证综合指数为研究对象,通过对比已实现GARCH模型和已实现的跳跃
GARCH模型,实证发现:
第一,上证综合指数具有明显的波动率聚集特征,一个较大的市场波动后会跟随着一个与之相比较小的波动,也就是说之前的市场波动会对后来的市场波动性产生一定正向、逐步衰减的影响,如此重复下去,形成波动率聚集现象。
这在一定程度上可以反映出市场参与者“追涨杀跌”的心理状态,说明市场中存在着大量的投机者。
投机者的存在虽然可以增加证券市场中交易的灵活性和流动性,但从侧面来说,也同时增加证券市场的风险与不稳定性。
“追涨杀跌”的另一个表现形式就是“杠杆效应”,利空消息的影响程度要大于同等条件下的利好信息所造成的影响,文中的模型也很好地捕捉到了上证综合指数的杠杆效应。
市场中不同风险偏好的参与者选择的投资策略并不相同,因为金融市场知识、宏观经济政策认知、毫无主见式的跟风等投资情绪影响会加大市场的杠杆效应。
第二,根据样本数据的描述性统计分析可知,上证综合指数的收益率呈现出尖峰厚尾的分布特征,说明市场中非理性的投资者在市场走势不明朗的情况下无法把控投资方向,消极投资;在行情明朗的情况下跟风冒进,这在一定程度上增加了收益率波动的风险,使得收益率未呈现出正态性波动。
第三,改进后的模型引入了跳跃变量,能从现有的价格信息集中筛选出更多有用的新息,通过改变对数化的方差方程的表现形式,将更多的新息加入方差方程中。
这符合计量模型数据混频处理的发展趋势。
实证表明,将更多的新息加入模型,可以改进模型的拟合能力,提高模型的预测水平。
作为新兴的股票市场,中国的股市具有波动幅度大、方向不明朗、破坏性强等特点,因此,加强市场监管,完善上市公司披露制度和股票交易信息,严惩虚假交易对净化国内证券市场、保证市场交易安全性、维护投资者权利有重要意义。
首先,政府部门要完善资本市场监管体系。
构建资本市场的风险预警指标体系是规避市场风险的基础与前提,通过对各部分风险指标的数字分解,利用量化分析的方
法,设置指标临界值,将风险因素稳定在一定的安全区域内。
在市场准入方面,要制定上市公司重大资产重组等或有事项的披露程序,确保披露信息的时效性和充分性,这不仅要求公司自身在制作财务报表时需要提供更多有价值的披露信息,更要求监管部门不断改进相关规章制度,明确市场参与者的权利义务。
在立法、执法方面,需要重视投资者、公司主题的信息反馈,确保法律执行有效果。
其次,加强投资者教育。
要明确投资者教育的内容、目标以及意义。
利用大数据、云计算等先进计算机技术,细化投资者分类,按照其投资规模、投资偏好、投资经验以及相关知识等构建适合各层次的专业教育队伍。
这一方面要求投资者明确自身的投资现状以及面临的基本问题,做到查缺补漏式的高效率培训,另一方面也要求政府增加响应经费投入,建立专业投资队伍,开展线上、线下等多种形式的培训方式。
最后,重塑投资者对国内证券市场的信心,提升自身市场竞争力。
中国在国际的影响力不断提升,但与发达国家的成熟金融市场相比,我国的市场在各方面还有着较大的差距,特别是2007年、2015年两次股票市场危机之后,国内证券市场也被蒙上了一层阴影,严重影响了投资者的投资热情。
各级政府、行政部门有必要也有责任净化投资风气,严惩不当投机,重新建立投资者对国内金融市场的认可度。
文章引用带跳跃的模型,度量了上证综合指数的波动率,通过实证研究,我们也发现了一些需要改进的地方,比如能否将跳跃因子引入更多的模型中,能否重新构造跳跃因子的表现形式使之更适合中国的股票市场等。
这些问题可能会成为以后研究和探索的方向之一,为构造新的波动率模型提供借鉴和思路。
参考文献:
【相关文献】
[1]陈逢文,金启航,胡宗斌.中国股市价格跳跃行为的验证及应用[J].财贸经济,2018,39(9):74-88.
[2]杨科,田凤平,林洪.金融波动率的高频估计及其预测模型评价和比较[J].首都经济贸易大学学报,2012,(5):114-121.
[3]熊正德,张洁.“已实现”波动率理论研究与评价[J]. 湖南大学学报(社会科学版),
2007,21(4):62-65.
[4]EngleR F.Autoregressive conditional heteroscedasticity with estimates of the variance
of united kingdom inflation[J].Econometrica,1982,50(4):987-1007.
[5]Bollerslev T.Generalized autoregressive conditional heteroscedasticity[J].Journal of Econometrics,1986,31(3):307-327.
[6]张曼,赵学靖,田人合.基于中位数GARCH模型的汇率波动率预测[J].统计与决策,
2017,(11):73-75.
[7]ShephardN,ShephardK. Realising the future: forecasting with high-frequency-based volatility (HEAVY)models [J].Journal of Applied Econometrics,2010,25(2):197-231.
[8]HansenP R,Huang Z,ShekH H.Realized GARCH:A joint model for returns and realized measures of volatility [J].Journal of Applied Econometrics,2012,27(6):877-906.
[9]陈国进,刘晓群,谢沛霖,赵向琴.已实现跳跃波动对中国股市风险溢价研究——基于股票组合
视角[J].管理科学学报,2016,(6):98-113.
[10]龚玉婷,陈强,郑旭.基于混频模型的CPI短期预测研究[J].统计研究,2014,31(12):25-31.
[11]于孝建,王秀花.基于混频已实现GARCH模型的波动率预测与VAR度量[J].统计研究
2018,35(1):104-116.
[12]吴恒煜,夏泽安,聂富强.引入跳跃和结构转换的中国股市已实现波动率预测研究:基于拓展的HAR-RV模型[J].数理统计与管理,2015,11(6):1111-1128.
[13]宋亚琼,王新军.跳跃强度对股市波动率建模与预测的影响研究[J].金融经济学研究,
2016,31(1):85-95.
[14]瞿惠,周惠.引入跳跃与联跳强度的沪深300股指期货套期保值研究[J].中国管理科学,2016,24(11):454-460.
[15]王明涛,孙西明,陈云.中国股指期货市场连续性及跳跃性波动行为研究[J].上海金融,2017,(4):57-65.
[16]Barunik J,Tomas K,Lukas V.Modeling and forecasting exchange rate volatility in time-frequency domain[J].European Journal of Operational Research,2016,251(1):329-340. [17]Metro R.Option pricing when the underlying stock returns are discontinuous[J].Journal of Financial Economics,1976,4:125-144.
[18]BarndorffNielsen E,Shephard N.Econometrics of testing for jumps in financial economics using biopower variation[J].Journal of Financial Econometrics,2006,4(4): 1-30.
[19]Andersen T,Bollerslev T.Answering the skeptics:Yes,standard volatility models do provide accurate forecasts[J].Inter-national Economic Review,1998,(39):885-905.
[20]Barndorff,Nielsen E,Shephard N.Power and biopower variation with stochastic volatility and jumps[J].Journal of Financial Econometrics,2004,2(1):1-37.。