对时间序列而言,时域分析和频域分析是常用的两种分析方法。当假设模型服从高斯分布时,运用精确的时域极大似然方法可以得到的未知参数极大似然估计,这个估计具有非常好的统计性质,这是众所周知的。然而在计算极大似然函数时,当分布维数较高时计算分布的方差矩阵的逆要花费很大精力。为了避免计算方差矩阵的逆,文献[1]从频域角度出发,通过傅里叶变换建立了Whittle 似然,该似然函数近似等价于精确的极大似然从而对未知参数做统计推断更容易。自此,Whittle 似然在时间序列的统计推断中得到广泛应用。然而,这种估计方法与最大似然估计相比较,其弊端在于它的估计偏差比较大,因而各种纠偏方法应用而生。比如:文献[2]通过用周期图的期望替代Whittle 似然函数中谱密度函数构造新的伪似然以减小Whittle 估计的偏差。另外常用的纠偏方法如刀切法,通过一种重抽样方法来实现减小估计的偏差。也就是,在给定n个样本的情形下,通过每次选择m 个子样本去估计未知参数,文献[3]通过刀切法减小二阶平稳模型中Whittle 估计的偏差。长记忆模型是自从水文学家Hurst 第一次发现900 个数据的自相关性表现出一种缓慢衰减的特性开始得到广泛关注的。越来越多的研究者注意到观测到的数据表现出这样一种趋势,那么识别在或空间上相距甚远的观测之间的这种相关性在许多不同的领域和学科中越来越被广泛关注。通过自相关函数呈现出的以双曲速率衰减的特性表现其长记忆性,关于长记忆过程的特征可参考专著[4-5]。从Whittle 估计出发,分别运用刀切法和文献[2]所给出的方法以及把两种方法结合起来,减小平稳的ARFIMA 模型中的参数的估计的偏差,通过蒙特卡洛模拟实验验证所给出的方法的有效性。
对于平稳的ARFIMA 模型下的参数估计的纠偏方法,我们从Whittle估计出发引入主要方法。
随机过程{X t} 被称为平稳的ARFIMA(p,d,q)模型,若满足
其中,{ε t} 为均值为0 方差为σ2 的白噪音,φ(B)=1+分别是后切算子B(BiXk= Xk- i)的p阶和q阶多项式并且满足:其对应的方程没有公共根且所有根都落在单位圆外。其自协方差函数以多项式阶衰减,这里d 称为记忆参数,d >0 保证过程的平稳性,当d <1/2 时,{X t} 是长记忆过程。
这个模型中的未知参数向量β=(φ1,…,φp,d,θ1,…,θq,σ2)∈Ξm,其中m= p + q+2 是未知参数的维数,Ξm 是m 维欧氏空间的一个紧子集。那么对β 的离散对数Whittle似然定义为
其中,ωj=2jπ/T,j=1,…,N=[(T -1)/2]([·]定义取整函数),周期图{I(ωj)}表达式如下:
f(ω; β)是ARFIMA模型的谱函数,其表达式为
最大化Whittle似然函数求得β的Whittle估计
而实际中σ2由于其不影响模型的主要特征,例如谱函数,所以通常视σ2为冗余参数,所以事实上的参数是
将导出几种纠偏方法,首先从文献[2]给出的纠偏方法出发,通过替换Whittle 似然中的谱函数为周期图的期望,定义一种新的伪似然为
而β 隐含在自协方差τk,k=0,1,…,N -1 中,i 是虚单位,Re(·)表示实部函数。这就是Debiased Whittle 似然,简称为DW似然。在DW似然下,β的估计为
所以Whittle估计和DW 估计
可看成在原始数据集Ω={ωi,i=1,2,…,N} 通过公式(2)和(4)计算所得。而刀切法是将原始数据集的某个样本剔除后然后估计未知参数,这样可以估计N 次,基于这N 个估计定义刀切估计。具体如下:
在子集={ωi,i=1,2,…,l -1,l+1,…,N},l=1,2,…,N上,如果记
且
那么刀切估计分别为
在ARFIM(0,d,0)模型下,运用所给出的方法实现减小参数估计的偏差。设定时间序列的长度T=200,500,1000,分别假设噪声扰动为N(0,1)、t(5)、χ2(5)、Exp(1),每种情形重复10000 次模拟计算估计的偏差、标准差、均方误差以及R 软件的计算时间。表1列出了在各种情形下的四种估计的各指标。
从表1 可见,对于ARFIMA 模型,刀切法在减小偏差的同时损失了计算效率,且在样本量相对较小时,刀切估计不稳健;在样本量较大刀切法确实是减小了估计的偏差且与Whittle 估计相比较,均方误差几乎保持不变;DW 虽然保持了Whittle估计的计算效率,但估计的偏差减小不明显。
表1 ARFIMA(0,d,0)取序列长度d=0.1的估计
注:表格中的偏差、标准差、均方误差均放大100倍,W,DW,JW,JDW 分别表示Whittle 估计、DW 估计、刀切Whittle 估计和刀切DW估计。
考虑在ARFIM(p,d,q)模型下减小参数的Whittle估计的偏差,通过刀切法和Sykulski 等给出的方法,实现了减少参数估计偏差的目的。但我们发现刀切法在减小估计偏差的同时使得计算效率变差,而Sykulski等所给出的方法对减小ARFIMA模型的参数的Whittle 估计的偏差效果不明显,因而寻找更优质的方法减小估计的方法仍是一项迫在眉睫的工作。Sykulski 等强调Whittle 估计的偏差是由周期图是谱函数的有偏估计所致,所以这给出我们一种启示,从Whittle 似然出发构造新的伪似然,从而减小Whittle估计的偏差是最根本的、最有效的途径。
[1]WHITTLE P.Estimation and Information in Stationary Time Series[J].Arkiv for Matematik,1953(2):423-434.
[2]SYKULSKI A M,OLHEDE S C,GUILLAUMIN A P,et al.The Debiased Whittle Likelihood[J].Biometrika,2019,106(2):251-26.
[3]TANIGUCHI M,TAMAKI K,DICICCIO T J,ea tl.Jackknifed Whittle Estimators[J].Statistica Sinica,2012(22):1287-1304.
[4]何书元.时间序列分析[M].北京:北京大学出版社,2003.
[5]BERAN J.Statistics for Long-Memory Processes[M].New York:Chapman&Hall,1994.
Correcting Bias of Whittle Estimates of Parameters in ARFIMA Model