1. 首页 > 知识问答

实现波动率的定义是什么(教你如何将投资风险降到最低)

我们已经知道,如果要在期权交易中寻找机会,就需要先对未来的已实现波动率进行估计,然后再和期权的隐含波动率对比进行相应的交易。在预测未来的波动率之前,我们需要先对过去的波动率水平进行度量。在本章中,我们会研究度量历史波动率的各种方法,包括收盘价–收盘价波动率、Parkinson波动率、Rogers-Satchell波动率、Garman-Klass波动率和Yang-Zhang波动率。我们将会讨论每种方法的效率(估计值能以多快的速度逼近真实值)和偏差(该方法的估计值是否会系统性地高于或低于真实值),以及如何受到真实市场不同特征的干扰。这些特征包括收益率的厚尾现象、趋势和微观结构噪声等,同时我们也会研究度量不同的频率。当我们理解何为历史波动率后,就能着手研究它的属性。我们将侧重论述均值回复、波动率聚集以及季节性效应。

波动率的定义及度量

在交易的时候,我们不仅仅需要未来波动率的一个点估计,还需要对波动率可能所处的区间进行估计。为了得到这个估计,我们要研究波动率锥(volatility cones)的构建和抽样的属性。如何度量波动率以及预测其分布是期权交易成功的关键。但遗憾的是,它们并非(期权交易成功的)充分条件。仅仅因为波动率便宜就买入,或者因为它贵就卖出,这往往不会是一个好主意。通常,东西便宜自然有其便宜的道理。我们所做的任何预测都需要相应的基本面分析作为补充(例如,究竟什么因素会导致波动率上升?当持有空头头寸时,我们不希望发生什么情况?)。市场相当复杂,并且相互关联,所有度量和预测的结果都必须置于当前的交易环境中进行考量。

度量波动率不同于估计价格。瞬时波动率是无法被观测到的,它需要时间来验证自己。度量波动率更像是一门艺术,因为我们要从众多的统计量中做出选择。事实上,Poon(2005)就列举了100篇以上关于波动率预测的参考文献,这在一定程度上反映了该问题的难度。这里,我们的目的并不是要给出一个明确的答案,而只是给出一些估计波动率的方法,并研究它们各自的优势和劣势,以及在什么情况下该使用什么方法。

波动率的定义

波动率的标准定义是方差的平方根。方差的定义为:

其中,xi为对数收益率,x为样本的平均收益率,N为样本数量。为了将方差以年化的形式表示,我们需要将原方差乘以年化因子N,也就是一年的交易周期。例如,当我们使用日频数据时,N就是252,因为这是一年中的交易日数量(至少在美国是如此)。

如果该历史价格序列包括了股息支付(或者拆股),那么就有必要对价格序列进行调整。由于除息的影响,即使股价没有发生波动,看起来也会有一定的波动。如果不进行调整,那么对波动率的度量就可能会出现若干个百分点的误差。例如,如果由于除息导致股价跌了3%,那么年化后看上去就变动了48%(即)。这样一来,波动就被显著放大了。

有多种进行调整的方法。第一种方法是在除息日简单地把股息从除息前的股价中减掉。这种方法能够使股价在除息前后日变化的绝对值保持不变。但该方法的缺点是:如果支付股息的次数足够多,量足够大,那么在调整后很有可能会得到负的股价。

另一种更好的方法是将股价乘上一个不受百分比变化影响的调整因子。这个因子是:

对除息日前的股价都乘上这个因子,称为向后调整。相应地,也可以进行向前调整。如果进行向前调整,那当前的股价将不同于调整后的股价。

式(2-1a)并没有对分布做任何假设,仅仅是一个加总。所有有限数量的样本都可以计算方差。然而,为了在期权定价中使用波动率,我们需要假设其收益率的生成过程。正如前文所提及的,BSM模型假设收益率服从正态分布。在这样的情况下,方差就完全刻画了该分布的形状。我们知道这个假设是不正确的,但我们仍希望方差(以及波动率)是刻画收益率分布宽度方面的一个重要参数,甚至是决定性参数。

在金融领域,将收益率均值(漂移项)和方差区分开是很难的(这在许多关于交易策略和交易结果的讨论中都是核心问题),并且收益率均值的估计也是出了名的不准,特别是在小样本的情况下。因此我们通常把式(2-1a)中的平均收益率项设为0。通过去掉一个噪声源,这会增加度量的准确性:

为了从样本方差得到总体方差的估计,我们需要做一下转换(Kenny和Keeping,1951)即

然而,有些专家选择回避这一步,而是直接将样本方差定义为:

这样定义的方差实际上是总体方差的无偏估计。由于在应用中不同的方差定义容易造成混淆,因此有必要先弄清楚方差是如何定义的。记得查看下其计算公式的分母上有无N-1项。Excel软件中VAR函数就是根据第二种定义来计算的。

式(2-2)和式(2-3)给出了方差的无偏估计,但直接在方差上开平方所得到的波动率估计却是偏低的。这是由詹森不等式造成的。詹森不等式表明,平方根的均值总是比均值的平方根小,即

因此,我们需要对这个偏差进行校正。

如果假设收益率服从正态分布,那么就可以将样本标准差的分布函数看成样本容量的函数,那么该函数便可写成:

其中,s是样本标准差,σ是总体标准差,Γ(x)是伽马函数,定义为Γ(n)=(n-1)!,该函数的图形如图2-1所示。

图2-1 样本标准差的分布

通过观察图2-1可以发现,随着样本容量N的增大,分布的峰值在向右侧移动——趋向于总体标准差。因此样本容量越大,总体标准差与样本标准差之间的偏差就越小。偏差的程度可以通过下式进行精确量化:

其中:

s/b就是总体标准差的无偏估计。

表2-1列出了不同的样本容量时所对应的b值。

表2-1 校正因子与样本容量的关系

使用s/b便纠正了这一偏差,也就是说这一估计量不会系统性地高估或者低估真实波动率。但是,该估计量向真实波动率收敛的速度较为缓慢,因此在技术上将其称为非有效估计量。该估计量的方差为:

方差(样本方差的方差)与样本容量的关系如图2-2所示。

图2-2 样本方差的方差会收敛至真实总体方差,它是样本容量N的函数

如果直接心算gamma函数会非常难,因此如果能找到一个更为简单的近似公式,那么在实际中将大有裨益。首先我们注意到:

将式(2-8)代入式(2-6),整理后只取到N的一阶项(近似),可得:

因此,再结合式(2-6)和式(2-7)可以得到:

这样我们便得到了一个更为简单的有关波动率估计量置信区间的表达式。置信区间与样本容量N之间的变动关系可以参见表2-2。从该表可以看出,与式(2-7)得到的精确结果相比,近似结果的误差相当小。

表2-2 置信区间与样本容量N的关系

因此,使用更多的数据可以带给我们更为准确的结果。这在静态过程中对波动率进行估计没有问题,但在真实的金融市场中,这种估计方法就存在很多问题。由于抽样误差的存在,所以如果数据量过少,那么度量出的波动率便会因为噪声(即误差)的存在而偏离真实波动率。但反过来,如果数据量过多,那么这些样本中就有可能掺杂与当前市场状态无关的数据。因此选取适当的样本容量就显得非常有艺术性,最合适的数据量将与当前的市场环境有关。然而,常见的使用最近30个收盘价数据来估计波动率的方法显然会出现大得离谱的抽样误差。2倍标准差下95%的置信区间意味着,我们偏离真实值的幅度高达25%!

抽样误差和度量误差完全是两回事。在物理实验中,由于测量设备或实验装置的限制,我们可能只能在一个有限的精确度内测量出某一确定量的值。但如果我们忽略买卖价差,那么股票价格便是一个精确的数字,从而其历史波动率也是一个精确的数字。度量的整个过程不存在任何不确定性。不过度量出的数字是否真实地反映了合约标的的情况,这是不确定的。这就好比在棒球比赛中,当一位击球手五击五中的时候,毫无争议,他的命中率确实达到100%,但却没有人能说他是一位100%命中的击球手。这是因为我们极有可能只是碰巧看到了他职业生涯的巅峰,而在其他某些时间可能一个球都击不中。类似地,就像命中能力一样,波动率也是一个不可观测的量,我们只能去估计它。我们对波动率进行的度量只是真实波动率的片面反映,这就好比夺冠次数只是棒球运动员真实能力的侧面反映一样。

在着手解决上述问题前,我们再来看一个能说明该收盘价–收盘价估计量具有实用性的理由,即该估计量可以改写为另外一种形式,这种形式可以简单地将股价的平均变动与波动率联系起来,而这种形式对交易员来说也是相当有帮助的。

其实标准差就是各平方项均值的开方形式。但是对于这些量的变化,我们通常很难直观地进行解释。因此,我们可以观察一个基于股价变动的估计量作为替代,即

这是因为绝对收益率的均值为:

这意味着:

上述公式把日收益率和年化波动率联系了起来。交易员通常认为,16%的年化波动率就对应着1%的日收益率。这是因为他们将收益率的平方求均值后开方所得到的值和日收益率混淆了。为了对应日收益率和年化波动率的数值,我们需要将波动率除以20。

将日收益率乘以20,就得到了一个“快捷但欠准确”的年化波动率的估计值。

一般有两个基本方法可以解决抽样误差的问题:一是使用更高频率的数据来估计收盘价–收盘价估计量,二是使用包括收盘价在内的所有数据的估计量,但这两个方法都存在一定的局限性。我们将先尝试开发一些更好的估计量。这个过程同样具有广泛的适用性。如果我们能找到更好的估计量,那我们就可以将它应用到更高频率的数据上。

其他波动率估计量

第一个是Parkinson(1980)估计量。该估计量的表达式为:

其中,hi是交易时的最高价,li是最低价。

和前文一样,若要得到年化值,也需要将这个估计量乘上每年交易周期数的平方根。这种由极差构造波动率估计量的方法是有意义的,也是交易员通常所理解的形式。另外,该估计量似乎能以更快的速度收敛于真实波动率。因为它在每个交易时段都使用了两个价格,而不像收盘价–收盘价估计量那样只用了一个。事实也确实如此,当用人工生成的几何布朗运动来进行检验时,Parkinson估计量的效率要比收盘价–收盘价估计量高出5倍(此处的效率是指收盘价–收盘价估计量的方差与基于极差的估计量的方差的比值)。

如果价格是连续的,那么Parkinson估计量便是方差的无偏估计(但要记住,当把方差估计转化成波动率估计时,由詹森不等式导致的偏差仍然会存在)。然而价格样本是离散的,这是因为市场只能以离散的交易单位进行交易;更为重要的是,市场只是在一天中的部分时间开放。这就意味着那些没有被观察到的真实价格便不会成为我们估计时所使用的最高价或最低价。因此,基于能观察到的极差来构造的估计量,就会系统性地低估波动率。

Garman和Klass(1980)模拟了因离散取样所导致的波动率被低估的现象,低估的程度与样本容量的关系参见表2-3。

表2-3 Parkinson方差的抽样误差

Parkinson波动率估计量会低估波动率这一事实会令不少人感到吃惊。普遍的错误观点认为,由于交易事实上很少以最高价或者最低价这样的极端价格执行,因此Parkinson估计量会高估波动率。这个论述的前半句是对的,但是这和波动率被高估或者低估无关。Parkinson并没有对交易能否以极端价格执行做出任何说明,他只是认为极差和波动率是相关的。它只是波动率的一个估计而已,并不是对交易的估计。

估计量的偏差显然是个严重的问题。在使用过程中,就像我们在收盘价–收盘价估计量的例子中那样,我们可以通过将估计量除以调整因子来纠正存在的偏差,以便得到方差的无偏估计,但是这个方法仍然无法解决价格序列中存在开盘跳空的情形。

某一证券的波动率与其价格极差有关这一直觉是清晰的,这个想法可以扩展到其他与最高价和最低价不同的“极差”。

另一个知名的波动率估计量是由Garman和Klass提出的,其表达式为:

其中,ci为交易期内的收盘价。

这个估计量的收敛效率可以高达收盘价–收盘价估计量的8倍(精确的效率提升幅度取决于样本容量)。但是同样由于离散取样的原因,该方法也会低估实际的波动率,并且它的偏差实际上比Parkinson估计量的还要大,如表2-4所示。

表2-4 Garman-Klass方差的抽样误差

资料来源:Garman和Klass,1980。

一旦我们知道偏差在哪里,就总会有办法去调整它。但更严重的问题是,有研究表明,这些估计量之所以能提高估计效率,是因为它们依赖于一些并不适用于真实市场的假设,尤其价格服从不带漂移项的几何布朗运动以及连续交易的假设。Rogers、Satchell和Yoon(Rogers和Satchell,1991;Rogers、Satchell和Yoon,1994)在一定程度上放宽了这些限制条件,引入带有漂移项的更优的估计量,其表达式为:

其中,oi为交易期内的收盘价。

随后,Yang和Zhang(2000)推导出了适用于开盘价格跳空的估计量。它本质上是Rogers-Satchell-Yoon估计量、收盘价–收盘价估计量和开盘价–收盘价估计量的加权平均。在一些模拟测试中,它的收敛效率可以达到收盘价–收盘价估计量的14倍,但却与由开盘跳空所导致的波动率占整个波动率的比例高度相关。如果价格跳空占据主导,那么这个估计量并不会比收盘价–收盘价估计量好多少。该估计量的表达式为:

其中:

Brandt和Kinlay(2005)证明了上面两个估计量也都存在着向下偏差。这一点并不奇怪,因为它们都依赖于价格极值并且还假设交易连续。

迄今为止,我们已经讨论了5种波动率估计量,每种估计量都是为了克服上一种估计量的不足而构造出来的。因此每次的更迭都应该比上一次更优。那该使用何种估计量是否已经很明显了呢?其实不然。Brandt和Kinlay在更逼真的模拟数据(包括离散取样、带有价格漂移项和价格跳空)上进行测试,结果表明,不同估计量的差别并不显著。在这样的市场环境中,Garman-Klass和Yang-Zhang估计值会略微偏高,并且所有这些非经典的估计量都具有类似的效率。另外,当用实际市场数据进行测试时,这些估计量之间的相关性比用仿真数据的要高得多(相关性结果见表2-5)。

表2-5a 使用模拟数据时不同波动率估计值之间的相关性

注:数据为25天的5分钟抽样数据。随机波动率均值为14%,漂移项为8%。

资料来源:Brandt和Kinlay,2005。

表2-5b 使用标准普尔500市场数据时不同波动率估计值之间的相关性

注:数据为1988年1月4日至2003年12月31日的5分钟抽样数据。

资料来源:Brandt和Kinlay,2005。

我们之前讨论的估计量都是将时间分割成一系列区间,然后观察区间内的特殊价格(开盘价、最高价、最低价和收盘价等)。在某种意义上,这些估计量都是基于以下问题:价格会移动多远?我们当然可以换个问题,不是问“价格会移动多远”而是问“价格会移动多快”。Cho和Frees(1988)最先提出了这个不同的观点。

通过构造一个双边障碍来定义一个对数价格区间,即初始标的价格上涨Δ或下跌Δ。当障碍被触及时,我们会记录一个退出时间τ1,然后根据当前价格重置双边障碍。这样就可以生成一个退出时间序列(τ1,τ2,…,τn),并用来估计波动率。

此处所选择的Δ,与收盘价–收盘价方法中的固定时间间隔选择类似,不过此时我们的序列是一个当价格移动固定金额时由时间构成的随机序列。如图2-3所示,该图同样说明了为什么可以将这个初次退出时间的方法视为“收盘价–收盘价方法的变化”。

假设对数价格过程服从布朗运动,同时假设对于典型的τ,漂移率可以忽略,我们就可以推导出下面的简洁结果:

(推导的具体细节参见Borodin和Salminen,2002。)

图2-3 SPY的对数收益率,当其变化0.05时抽样。在此例中,我们可以得到变化时间的序列(用交易日数量来表示):13、14、17、24、39、32、65、27、23

经过转化,我们可以得到该证券波动率的估计值为:

其中,E(τ)为n个观测值后触发时间的样本均值。

然而,除非n非常大,否则该估计值会有很大的偏差。我们并不知道E(τ)的真实值,我们只能基于观测数据来估计它。因此τ的样本分布就非常重要。由于詹森不等式的缘故,其真实值会比式(2-19)的初始估计值略低。也就是说:

不过我们可以利用一个二次修正项来调节τ的方差(同样参见Borodin和Salminen,2002):

如果??为n个初次退出时间样本的均值,根据中心极限定理:

我们的目标是推导出总体方差的一个无偏估计量。为了实现这一目的,我们定义了一个新的随机变量δτ:

这个随机变量的均值为0,方差为Var(τ)/n。接下来定义一个函数?:

我们可以扩展我们的有偏样本波动率E[f(τ)]至二阶项,以获得方差项,从而求解出真实总体波动率:

这样,一个单独的观察值,我们需要通过乘以4/5来修正我们的观测波动率。这样的修正幅度很大,但随着n的增加,偏差会迅速降低,其收敛特征如表2-6所示。

表2-6 样本波动率的偏差修正因子与观测值数量的关系

进行障碍估计量与收盘价–收盘价估计量持续性的收敛效率的比较是非常困难的。障碍估计量所使用的是一种不同的信息。实际上,这是一种在线实时估计的自然拟合方法,可被视为具有几乎无限大的信息集。不过,现在大多数交易员都是坐在电脑前看着这些数据流从眼前划过。那为什么不使用全部数据呢?

为了直观地比较这两种方法的相对收敛速度,Merrill(2011)模拟了100000次波动率为0.30的股票在20天内的路径,其中观测障碍被设为0.01。障碍方法的波动率估计值的离散程度如图2-4所示,这些估计值的标准差为0.028。

图2-4 采用障碍方法时波动率估计值的分布

他根据式(2-18)计算得到τ的估计值为0.28天。接下来他又进行了一次模拟,按照0.28天的频率对该股票进行抽样。这意味着此时估计收盘价–收盘价波动率所使用的数据在平均意义上与障碍法相同。收盘价–收盘价方法的波动率估计值的离散程度如图2-5所示。这些估计值的标准差为0.048。因此障碍方法的效率看上去比收盘价–收盘价方法高1.7倍。

退出时间方法估计波动率是实时波动率估计自然适应。若需要将股票的买卖价差和离散交易特征考虑进去,该方法调整起来也比较容易。它朝真实波动率收敛的速度也比传统的收盘价–收盘价估计量更快。

图2-5 采用收盘价–收盘价方法时波动率估计值的分布

收盘价–收盘价估计量

优点:

·抽样特性很容易被理解。

·偏差容易纠正。

·可以简单地转换为“典型的每日波幅”的公式形式。

缺点:

·没有充分利用已有数据信息,并且收敛速度很慢。

Parkinson估计量

优点:

·使用日内极差来估计波动率很合理,并且相对于基于时间的抽样方法(如收盘价),其提供了更全面的独立信息。

缺点:

·只适用于几何布朗运动过程的波动率估计,不能处理趋势和跳空。

·会系统性地低估波动率。

Garman-Klass估计量

优点:

·效率要比收盘价–收盘价估计量高8倍。

·充分利用常见的可获取的价格信息。

缺点:

·偏差甚至比Parkinson估计量还大。

Rogers-Satchell估计量

优点:

·允许趋势的存在。

缺点:

·同样无法处理价格跳空。

Yang-Zhang估计量

优点:

·具有最小估计误差。

·能够处理漂移项和价格跳空。

·在可用数据的使用上最为有效。

缺点:

·如果价格过程由跳空主导,其性能会降低到和收盘价–收盘价估计量差不多。

初次退出时间估计量

优点:

·使用了与传统时间序列方法本质上完全不同的信息。

·是实时使用的自然估计量。

·收敛相对更快。

缺点:

·需要使用高频数据。

最后,我们得出的整体结论是:没有迹象表明存在最好的估计量。所有度量方法都包含了信息。我们不能根据纯粹的数学推导就决定使用哪个估计量,而应该考虑不同估计量的实际含义,并以此来决定选择谁。例如,如果Parkinson波动率为40%,而收盘价–收盘价波动率为20%,我们则可以合理地认为,真实波动主要来自日内大幅波动,而收盘价低估了真实波动过程。这个认识在我们决定如何更好地进行对冲时非常有用[实际上,它的确会非常有用,但究竟有多有用则是另一个问题了。一些股票类型如美国存托凭证(ADR),其Parkinson估计量与收盘价估计量之比在一定程度上是可预测的,因为当这些股票不在交易时段时,会有许多新信息产生]。

使用更高频的数据

在波动率估计量的选择上,我们已经进行了大量的讨论,现在再看一下如何通过使用更多的样本数据(高频数据)来提高估计的精度。这样做的优点显而易见,在选择抽样区间时,使用极值或者收盘价会错过一些信息。这在图2-6中可以反映出来。

图2-6 两条具有相同开盘价、最高价、最低价和收盘价的价格路径

很明显,其中一条路径的波动会比另外一条更为剧烈,但如果估计量用的是开盘价、最高价、最低价和收盘价,那么就会得到相同的结果。因此,使用更高频的数据可以在一定程度上避免这个问题。

当以更高的频率抽样时,由于在同样的测量时间段内有了更多的数据点,因此往往能够改善估计质量。不过一旦使用了非常高频数据(具体多高频取决于具体的产品,但是通常指时间间隔在一分钟以内的),我们便会无法知晓真实的价格。例如,考虑这么一个例子,某只股票的真实波动率是30%,如果使用15分钟价格数据来估计波动率,0.1%的买卖价差便可能导致波动率估计量出现2%的偏差,这是由于我们使用了合约标的真实价格的有噪声的估计值来作为输入值。因为真实的价格可能与我们实际的观察值相差0.1%,所以随着抽样频率的提高,这个问题将会越来越突出。Ait-Sahalia、Mykland和Zhang(2005)研究了在存在微观结构噪声的情况下,如何找到最优的抽样频率,但是他们的方法对计量经济学技术和数据存储空间都有很高的要求,从而使这个方法在短期内无法被大多数期权交易员使用。

为了尽量避免这些问题的发生,我们往往选择相对交易时间而言较长的抽样区间。虽然不同产品之间会有区别,但大体上15~30分钟会是不错的切入点。

在分析每日收益率时,周期性因素不会造成大的问题。有证据表明,股票波动率一般在周五时较低,而在周一时较高,不过两者之间的差别很小。然而,在使用高频数据时,有两个重要的周期性效应需要我们留意。

早期使用高频收益率来估计波动率的研究,所针对的是外汇市场。这些市场的交易是连续的。不管是精心设计的还仅仅是因为运气,这样做会避免一个主要问题:如何体现隔夜收益率。对于其他市场而言,我们需要考虑这个问题。在美国,股票在交易所里有6.5个小时的交易时间。所以从量级来说,隔夜收益率会与其他日内收益率显著不同。隔夜收益率在特性上也存在不同。大部分与股票价格相关的新闻都是在交易日内发生的,事实上很多都是在公共交易时段内发生的,同时波动率的很大一部分都是由交易量驱动的。

有多个方法来处理这个问题。第一种就是在估计波动率时,简单忽略掉隔夜收益率,而仅使用日内收益率。这种做法与在上市公司公布业绩时忽略价格跳空的做法类似。但这种做法有明显的缺陷,因为隔夜收益率是真实存在并且显著的,其数值常常可以与日内收益率相提并论。

另一种方法是在高频序列中,将隔夜收益率与其他收益率同样对待。然而,将一个17.5小时的收益率等价于诸如15分钟的收益率的做法看上去总有些别扭。

我所喜欢的方法是去计算总方差中有多大比例是由隔夜收益率所造成的。首先,我们不考虑隔夜收益率,将当日的第一个收益率定义为:

而不是:

所有其他的收益率都用通常的方式来计算。接着我们像以前一样估计波动率并且通过合适的系数将其年化[例如,每个交易日有13.5个小时区间,如果我们使用的是30分钟收益率,那我们就要把结果乘上13和252(美国每年的交易天数)乘积的平方根]。

接下来,我们需要确定该交易日的总方差值。这可以通过用日频数据来计算收盘价–收盘价波动率,然后将它与用日频开盘价–收盘价计算的波动率相比较。对于在美国上市的大多数股票来说,总波动率中大约85%的部分是在交易时段发生的。指数的更高,估计有90%。美国存托凭证则低一些,大概在60%~70%。如果将原始波动率的估计值除以这个因子,我们就得到了经过开盘跳空调整后的高频波动率估计量。通过这种方式来使用更多数据的好处就在于,由于在给定时间段内包含了更多的数据点,这样能使抽样误差变小。虽然使用最近250个交易日数据来估计当前波动率显得不那么合适,但250个30分钟频数据也才仅仅跨越了20个交易日而已。假设真实过程在这样短的周期内是平稳的,就比较符合实际了。

另一个需要牢记的关于周期性的特征是:真实波动率在一天内的变化可能会很大,而且这一变化是可以预测的。图2-7~图2-9展现了从2007年4月23日到2007年6月4日这段时间日内波动率的变化情况(用30分钟收益率数据计算的Parkinson波动率的平均值来作为日内波动率的估计值)。这里我们列出了微软(MSFT)、花旗集团(C)和基因科技(DNA)的日内波动率形态。它们的形态都比较类似,刚开盘时的波动率最高,然后慢慢走低,最后收盘时出现一波小幅的回升。相似的形态在外汇、债券和指数市场上也能见到(Lequex,1999)。

图2-7 微软的日内波动率

图2-8 花旗集团的日内波动率

图2-9 基金科技的日内波动率

这个特征挺有意思。但对于期权交易而言,我们其实是对较长期的平均波动率更感兴趣[在计量经济学文献中,也被称为整合波动率(integrated volatility)]。在比几天更长的时间尺度上,这些快速的日内周期性都会被平均掉。而在较短的时间尺度上,路径依赖效应是波动率预测误差的主要来源。

使用高频数据的效果显而易见。通过使用更高频率的数据,可以让我们能够使用更多的近期数据。这会让估计值向真正的、不可观测的波动率收敛,从而避免使用太久远而与当前市场无关的数据。不过,高频数据的使用也有一些需要注意的地方。

首先,执着于使用超高频数据的交易员,需要认真地对待市场微观结构的问题。例如,买卖价跳跃是影响价格的重要特征,但却对长期波动率没有什么影响。对这些微观结构效应进行讨论,已经超出了本书的范围。感兴趣的读者可以翻阅Gencay(2001)或者Lequex(1999)。

其次,抽样的频率与估计波动率的目的相关。例如,如果我们希望预测市场影响(见第6章的Gatheral模型),那使用高频收益率就可能是合理的。但很多证据(Corsi,2009;Lynch和Zumbach,2003)表明,低频波动率是高频波动率的更好估计量,反之却不是。因此,使用高频数据来作为长期估计的工具,可能是一个错误的方法。

本章小结

与价格不同,波动率没法立刻被测量。它是一个平均值,需要时间来估计。在真实市场中,波动率的定义可能不能直接推导出实际估计它的最好方法。有许多测量波动率的方法,即使选择好了估计量的统计方法,我们还需要进一步选择参数。了解这些方法非常重要。最后,波动率度量在某种程度上是一种艺术。

·使用多种方法来估计波动率,并时刻谨记每个方法的优点和缺点。

·在样本长度选择中,须在包括与当前市场不再相关的数据和使用过少数据而导致较大抽样误差之间进行权衡。

版权声明:本文内容由互联网用户贡献,该文观点仅代表作者本人。本站不拥有所有权,不承担相关法律责任。如发现有侵权/违规的内容, 联系QQ15101117,本站将立刻清除。

联系我们

在线咨询:点击这里给我发消息

微信号:666666