《时间序列分析的基本概念.docx》由会员分享,可在线阅读,更多相关《时间序列分析的基本概念.docx(20页珍藏版)》请在课桌文档上搜索。
1、第二章时间序列分析的根本概念本章将介绍时间序列分析的一些根本概念,其中关于平稳性、自协方差函数和样本自协方差函数的概念尤为重要。由于时间序列是随机过程的特例,所以我们首先介绍随机过程的一些根底概念和根本理论,最后介绍一些差分方程理论和动态数据的预处理方法。2.1随机过程在对某些随机现象的变化过程进行研究时,需要考虑无穷多个随机变量,必须用一簇随机变量才能刻画这种随机现象的全部统计特征,这样的随机变量族通常称为随机过程。下面为几个常见的随机过程的例子:例2.1(随机游动)设X,X2,是一列独立同分布的随机变量序列,令sn=s0+x1+x2+x,那么称随机变量序列S;=OJ为随机游动。其中SO是与
2、X,X2,相互独立(但是不同分布)的随机变量,一般地,我们总是假定SO=0。如果P(Xzj=I)=P(Xw=-I)=1/2s就是一般概率论与数理统计教材中提到的简单随机游动。例2.2(布朗运动)英国植物学家布朗注意到漂浮在液面上的微小粒子不断进行无规那么的运动,它是分子大量随机碰撞的结果。这种运动后来称为布朗运动。假设记(XQ),YQ)为粒子在平面坐标上的位置,那么它是平面上的布朗运动。例2.3在通信工程中,交换台在时间段0,H内接到的呼唤次数是与t有关的随机变量X(Z),对于固定的r,X(f)是一个取非负整数的随机变量,那么XQ),r0,oo)是随机过程。下面介绍随机过程的定义。随机试验所有
3、可能结果组成的集合称为这个试验的样本空间,记为C,其中的元素。称为样本点或根本领件,。的子集A称为事件,样本空间C称为必然事件,空集中称为不可能事件,尸是的某些子集组成的集合组,P是(,可上的概率。定义2.1随机过程是概率空间(Q,F,尸)上的一族随机变量XQ),fT,其中I是参数,它属于某个指标集T,T称为参数集。随机过程可以这样理解:对于固定的样本点为wX,g)就是定义在T上的一个函数,称之为X。)的一条样本路径或一个样本函数;而对于固定的时刻r,X=X(AG)是概率空间上的一个随机变量,其取值随着试验的结果而变化,变化的规律成为概率分布。随机过程的取值称为过程所处的状态,状态的全体称为状
4、态空间,记为S。根据T及S的不同,过程可以分成不同的类:依照状态空间可分为连续状态和离散状态;依照参数集可分为离散参数和连续参数过程。对于一维随机变量,掌握了它的分布函数就能完全了解该随机变量。对于多维随机变量,掌握了它们的联合分布函数就能确定它们的所有统计特性。对于由i族或多个随机变量形成的随机过程,要采用有限维分布函数族来刻画其统计特性。定义2.2随机过程的一维分布,二维分布,n维分布,等等,其全体称为过程X的有限维分布族一个随机过程的有限维分布族具有如下两个性质:对称性:对(1,2,的任一排列(U,JJ,有.r(x,1,X;)=4,J(X,天)(2.1),*zfJJnflr1(2)相容性
5、:对机,有耳也(和,/,8,,8)=.%(卡,/)(2.2)对于满足对称性和相容性条件的分布函数族F,是否一定存在一个以F作为有限维分布函数族的随机过程呢?柯尔莫哥洛夫定理给出了确定的结论。定理2.1(柯尔莫哥洛夫定理)设分布函数族”.跖(玉,当,f,rl满足上述的对称性和相容性,那么必存在一个随机过程XQ)7,使】Fa,怎),4,eT1恰好是Xa)的有限维分布族。柯尔莫哥洛夫定理说明,随机过程的有限维分布函数族是随机过程概率特征的完整描述。在实际问题中,要掌握随机过程的全部有限维分布函数族是不可能的,一般是利用随机过程的某些统计特征,如下是一些常用的统计特征:定义2.3设X()JWn是一个随
6、机过程,如果对任意,T,X。)存在,那么称函数x(t)=EX(t),t三T(2.3)为X”)T的均值函数称rx(5,0=E(X(三)-x(三)(X一xQ),s,teT(2.4)为X)jer的协方差函数C称Dx(0=rx(r)=EX(t)-x(t)s,ieT(2.5)为X()feT的方差函数二均值函数是随机过程x()f在时刻t的平均值,方差函数是随机过程在时刻t对均值Xa)的偏离程度,而协方差函数和相关函数那么反映了随机过程在时刻S和I时的线性相关程度。2.2平稳过程的特征及遍历性有一类重要的过程,它处于某种平稳状态,其主要性质与变量之间的时间间隔有关,与所考察的起始点无关,这样的过程称为平稳过
7、程。定义2.4如果随机过程X()f7对任意的小,tr和任意的力(使得ti+?T,z=1,2,),有:(乂(4+),*2+4)-,乂9+初与(乂(4),乂2)、乂(乙)具有相同的联合分布,记为(X(r1+),X(r2+),X(r+)(X(1),X(r2),X(r)(2.6)那么称X(,fT为严平稳的。对于严平稳过程而言,有限维分布关于时间是平移不变的,条件很强,不容易验证。所以引入另一种所谓的宽平稳过程或二阶平稳过程。定义2.5设XT是一个随机过程,假设X(f)T的所有二阶矩都存在,并且对任意,T,EX()=4为常数,对任意sT,r(s)只与时间差Z-S有关,那么称X()fT为宽平稳过程,简称平
8、稳过程,假设T是离散集,那么称平稳过程X(f),feT为平稳序列例2.4随机过程定义为X=f“+),0,V8,其中/是具有周期丁的函数,是区间(0,7)上均匀分布的随机变量。问Xa)是否宽平稳过程?给出理由。解:/是具有周期T的函数,因而是有界函数,E是区间(0,T)上均匀分布的随机变量,因而E(XQ)=C/+)=f(r+e)d(e+f)=0,为常数,B,s)=E(X(t)-E(X(O).(XGv)-E(XCv)=E(Xa)X(三)=Jof(f+)/+(ST),下公_(Var(X(t)9t-s=nT0,t-snT因而X的二阶矩都存在,均值函数为常数,协方差函数NS)只与,一S有关,因而是宽平稳
9、过程。对于平稳过程而言,由于“5/)=0/-5),所以可以记为厂。一5)。对所有的1有r()=r(r),即为偶函数。所以Nf)的图形关于坐标轴对称,其在0点的值就是X。)的方差,并且,Q)0)此外,宽平稳过程的协方差函数具有非负定性,即对任意时刻乙,实数%,=1,2,N,有anamr(tn-tm)平稳随机过程的统计特征完全由其二阶矩函数确定。对固定时刻t,均值函数和协方差函数是随机变量XQ)的取值在样本空间上的概率平均,是由XQ)的分布函数确定的,通常很难求得。在实际中,如果一个较长时间的样本记录,是否可按照时间取平均代替统计平均呢?这是平稳过程的遍历性所要讨论的问题。由大数定律,设独立同分布
10、的随机变量序列X,=L2,具有EX“=,DXll=2t那么这里,假设将随机序列X.,=1,2,看作是具有离散参数的随机过程,那么为随机过NA=I程的样本函数按不同时刻所取的平均值,该函数随样本不同而变化,是随机变量。而EX是随机过程的均值,即任意时刻的过程取值的统计平均。大数定律说明,随时间n的无限增长,随机过程的样本函数按时间平均以越来越大的概率近似于过程的统计平均。那么,只要观测的时间足够长,那么随机过程的每个样本函数都能够遍历各种可能状态。这种特性称为遍历性或各态历经性。定义2.6设乂(。,一00,+8为均方连续的平稳过程,那么分别称=IimrX(t)dt(2.7)=IimrX(r)X(
11、t-)dt(2.8)为该过程的时间均值和时间相关函数。定义2.7设X(f),-8Vt+00为均方连续的平稳过程,假设1(2.9)(2.10)n-Xtdt=x那么称该平稳过程的均值具有各态历经性,假设1TIimrX(t)X(t-)dt=rx()那么称该平稳过程的协方差函数具有各态历经性。定义2.8如果均方连续的平稳过程的均值和相关函数都具有各态历经性,那么称该平稳过程具有各态历经性或遍历性。定理2.21均值遍历性定理(1)设*=乂“,=0,1,2是平稳序列,其协方差函数为r(f),那么X具有遍历性的充分必要条件是1N-IIim一r(t)=0(2.11)NT8N/=0(2)设X=X,-88是平稳过
12、程,那么X具有遍历性的充分必要条件是蹲手(1一务7)八=。(2J2)证明:由于证明的思路相同,这里只证明连续时间的均值遍历性定理。首先计算的均值和方差。Xr=X(t)dt那么有X=EllimXr=IimE(X7)=Iim进而Var(X)=E(X-EX)2=E期号X(XS-MM2=配素反。(XQ)-M4=期奈匕匕E(X(t)-M(X(三)-Mds1=yiir(t-s)dtds(2.13)在上述积分中,作变换=t-s=/+5那么变换的Jacobi行列式值为因而积分区域变换为顶点分别在r轴和U轴上的菱形区域:-2Ttn2T由于/)是偶函数,故(2.13)式等于配素i-2-如=一:力QTTW)”=图J
13、Jr,(2T-)d二蚓,八T)(Iw)八(2.14)故关于均值的遍历性定理就化为上式极限是否趋于零的问题。于是由均方收敛的定义知这确实是等价的,定理结论得证。推论2假设忆卜()力V8,那么均值遍历性定理成立。证明:当0r27时,(1T2T)卜Q)I(2.15)力卜询若用M力0(2.16)对于平稳过程的协方差函数的遍历性定理,可以考虑随机过程Z=(),-oovr8,其中Za)=(X。+,)一)(X(0)那么工=切。由定理的证明过程可见,均值具有遍历性等价于Var(N)=0。因此可以类推协方差函数具有遍历性等价于var(“)=0.于是有以下定理:定理2.L31协方差函数遍历性定理)设X=X,too
14、o是平稳过程,其均值函数为零,那么协方差函数有遍历性的充分必要条件是Iim1(1-)(B(r1)-r2(0)7r1=O(2.17)*T2T其中B(1)=EX(r+r1)X(r+r1)X(z+r)X(r)(2.18)在实际问题中,要严格验证平稳过程是否满足遍历性的条件是比拟困难的。遍历性定理的重要意义在于从理论上给出如下结论:一个实平稳过程,如果它是遍历的,那么可用任意一个样本函数的时间平均代替平稳过程的统计平均。在时间序列分析中,还会经常遇到白噪声过程,定义如下:定义2.9如果随机过程X。)。=1,2,)是由一个不相关的随机变量序列构成,即对于所有sf,随机变量X,和XS的协方差均为零,即随机
15、变量X,和X,互不相关,那么称其为纯随机过程.,对于一个纯随机过程来说,假设其期望和方差都为常数,那么称其为白噪声过程。白噪声过程的样本实现称为白噪声序列(Whitenoise)O特别地,对于白噪声序列弓,如果对于任意的s,l,/O*StEt=,CoV(与,$)=(2.19)0st那么称是一个白噪声序列,记为与WN,2)0当与独立时,称与是-个独立的白噪声序列C对于一个独立的白噪声序列,当,服从正态分布时,称与是一个正态白噪声序列下面是随机产生的IoOo个服从标准正态分布的白噪声序列绘制的序列图,见图2.1。图2.1标准正态白噪声序列 2 3线性差分方程2.3.1 一阶差分方程假定当前时期t期
16、的y(输出变量)和另一个变量外(输入变量)、及前一期的y之间存在如下动态方程:H=yt-x+CO(2.20)那么此方程称为一阶线性差分方程,这里假定G为一个确定性的数值序列。差分方程就是关于一个变量与它的前期值之间关系的表达式。(1)用递归替代法解差分方程根据方程(2.20),如果我们知道,=-1期的初始值上|和。的各期值,那么可以通过动态系统得到任何一个时期的值,即%=几+豌+”例+例(2.21)这个过程称为差分方程的递归解法。(2)动态乘子:对于方程(2.21),如果g随y_|变动,而明,叫,叱都与y_i无关,那么g对H的影响为:包或生生=,(2.22)fit方程(2.22)称为动态系统的
17、乘子,或脉冲响应函数即暂时性影响)。动态乘子依赖于小即输入?的扰动和输出yt+j的观察值之间的时间间隔。对于方程(2.20),当时,动态乘子按几何方式衰减到零;当-10,动态乘子指数增加;-,动态乘子发散性振荡。因此,+g+助+,即输出变量的增量是所有输入口的历史值之和。如果。产生持久性变化,即例,例X,,4+/都增加一个单位,此时持久性影响为:+=+.+l(2.23)啊啊.1l+j当Id1/tp-Fj =Gl 22Gp OaO 0产严t2p JPI tp2 tPP,0 0 0jpPl 2fpp因此尸的第(1,1)个元素为:(2.34)工丫)=。国+。2/+%(2.35)其中J=乙/。因为fq
18、=2=rr=l0将(2.35)代入(2.29),得到阶差分方程的动态乘Z=Ii=l子:-ll=工丫)=G%+。2田+,Cp%(236)l定理2.5如果矩阵F特征值是相异的,那么11(,-k)k=ki因此求出F的特征值4,就可以求出相应的G,由此就可以根据(2.36)计算得到动态乘子。如果所有的特征值都是实根,且存在一个特征根的绝对值大于1,那么系统是发散的。根据(2.36),动态乘子最终由绝对值最大的特征根的指数函数决定。2.4动态数据预处理具有动态随机变化特征的数据序列通常称为动态随机数据。动态数据的统计特性可以用概率分布密度来描述,但由于动态数据的随机过程往往具有很复杂的多维概率分布特性,
19、实际上难以分析和应用。时间序列分析作为另外一种描述动态数据统计特性的理论和方法,具有方便和实用的突出特点。在建立时间序列模型之前,必须先对动态数据进行必要的预处理,以便剔除那些不符合统计规律的异常样本,并对这些样本数据的根本统计特性进行检验,以确保建立时间序列模型的可靠性和置信度,并满足一定的精度要求。2.4.1平稳性检验时间序列的平稳性是时间序列建模的重要前提。在检验时间序列的平稳性时,必须考虑两点:序列的均值和方差是否为常数;序列的自相关函数是否仅与时间间隔有关,而与时间间隔端点的位置无关。下面介绍平稳性检验的几种常用方法。1.平稳性的参数检验法设样本序列当,2,,如足够长,即N相当大。把
20、样本序列分成k个子序列,即取N=%W,M是一个较大的正整数,k也是一个正整数。分段后的样本序列为马,i=l,2,K=1,2,对于k个子序列,可以分别计算它们的样本均值、样本方差和样本自相关函数。它们的定义分别为:1M=-rrij(2.38)Mj=,1WSj=-(Xij-Xj)(2.39)M-IRi()=-(Xij-)(x1,y+r-xi)(Z=l,2,=l,2,n,m2ormiO样本方差的方差区=D(s;)=-l+2(l-)p2.(2.42)M7=1Mj样本自相关函数的方差封=D(R;)-/-lp;+2(1-p2i+PPh)(2.43)M-j=M-采用统计检验方法,取显著水平a=0.05和2b
21、原那么,置信度0.95,当-XyI1.962l(2.44)sj-1.9621.9623(r)(2.46)(J工)J=1,2,次;T=1,2,团)成立时,可拒绝须为平稳序列的假设,即该序列不具有平稳性。但一般并不知道玉的理论方差与自相关函数,因此无法得出=,和b;(r),只能以它们的样本估计值代之。因此,这个方法还不够理想,还须结合背景判断在过程运行中周围条件及相关参数是否维持不变来确定是否是平稳的。2 .平稳性的非参数检验法平稳性的非参数检验中常使用游程检验法,由于该方法只涉及组实测数据,不需要假设数据的分布规律,所以实际中应用最多。在保持随机序列原有顺序的情况下,游程定义为具有相同符号的序列
22、,这种符号将观测值分成两个相互排斥的类。假设观测序列的值是j,i=l,2,N,其均值为元,用符号“+”表示x,M,而“表示七无。按符号“+”和出现的顺序将原序列写成如下形式观察可知,“+”和“”共14个,分为7个游程。游程过多或过少都被认为是存在非平稳性趋势。游程检验的原假设为:样本数据出现的顺序没有明显的趋势,就是平稳的。样本统计量有:Nl表示一种符号出现的次数;N2表示另一种符号出现的次数;表示游程的总数。其中r作为检验统计量。对于显著水平=0.05的双边检验,由附表给出概率分布左右两侧为3=0.025时的上限力和下限。如果厂在界限以内,那么接受原假设;否那么拒绝原假设。当M或N2超过15
23、时,可用正态分布来近似,利用附表来确定检验的接受域和否认域。此时用的统计量为(2.47)式中:r=lN2NiN2(2NiN2-N) 1/2N2(N-I)(2.48)(2.49)(2.50)N=N+N2对于二=0.05的显著性水平,如果Z1.96(按2b原那么),那么可接受原假设,否那么就拒绝。下面两种方法是图检验方法,利用时序图和自相关图显示的特征来作出判断检验时间序列的。图检验方法用于判断检验时间序列平稳性操作简便、运用广泛,但也有主观性较强的缺点。3 .时序图检验法根据平稳时间序列均值、方差为常数的性质,平稳时间序列的时序图应该显示出该序列始终在一个常数值附近随机波动,而且波动的范围有界的
24、特点。如果观察序列的时序图显示出该序列有明显的趋势性或者周期性,那么时间序列通常不是平稳时间序列。据此我们可以判断一些时间序列的平稳性。例2.5例2.619751980年夏威夷岛莫那罗亚火山(MaunaLoa)每月释放的二氧化碳的数据(单位:PPm)。342由时序图显示。我们可以看到这些数据中存在着某种季节趋势和明显的增长趋势,因此可以初步判定这一时间序列是非平稳的。2.4.2正态性检验通常,时间序列模型建立在具有正态分布特性的白噪声根底上,所以需要检验采集的数据序列是否具有正态特性。正态分布的概率密度函数为(AlAX)=砺K式中和分别为样本总体的均值和方差。概率分布为1_(入一V/式中称为概
25、率积分。检验随机数据正态性的有效方法是“?拟合优度检验:该方法是利用Z2统计量作为观察到的概率密度函数和理论密度函数之间的偏差的度量,两者是否相同可通过分析/?的样本分布来检验。如果数据是正态的,那么应落入第j组区间中的数据个数为约=N(4.Fj=M中(53)_(四0二幺)(2,51)%=Ml-(纪勺式中a和b是两个端点值,C=S,k是数据分组数。Fj和观察到的频数NZ之间的偏差为k由于+l+lZNj=EFi=N(2.52)=oj=O因此总偏差为零。根据PearSOn定理,样本的力?统计量为1M(Ni-Fi)2Z2=-c,-d-(2-53)j=oFj假定这个样本/统计量近似为/分布,并将该统计
26、量和理论/分布作比拟。此时,自由度=R+2减去一些线性约束的数目,其中一个约束是当前Z+1个组区间的频数时,由于总频数为N,最后一个组区间的频数也知道了。另外两个约束是由于同理论正态概率密度函数拟合观察数据的频数直方图而引起的,统计量方:是利用样本均值和样本方差计算5,而不是用真正的均值和方差。因此,如果利用全部Nj,那么自由度为:=伏+2)-3=左一1实际值可能比这还要小些,因为尸%t那么在显著水平上拒绝上述假设。经验说明,总体样本量和分组数目应满足的最优关系式为2&=1.87(N7户此外,需要注意的是采用/2检验方法必须保证每个区间中的期望频数至少为2。由于范围两端的期望频数最少,所以上述
27、要求可以用来确定a和b,而参数a应满足如下关系式_112=N(2万)2Xexp(-x2Xv据此求得a,又利用二2/,得参数b为b=2+a而分组区间数目为攵=-2,其中7为最小区间数。以上三个参数确定之后就可以计算样本概率密度。2.4.3 独立性检验在时间序列分析和建模过程中,除了要求检验样本数据的平稳性和正态性之外,还要求检验其独立性。本节介绍的独立性方法是基于正态随机变量自相关函数的统计性质。设随机变量XN(0,2),其自相关函数pw=,X(2.55)当l时,p(r)=Oo实际中我们只能得到样本自相关系数的估计值Q(r),一般不等于0,从自相关系数的估计值判断是否满足独立性条件,需要借助Ba
28、rtlett公式。BarUett公式:假设夕(力在TM时趋于零,那么在N足够大的情况下其方差为Dp(r)pni)(rM)(2.56)NF-M并且,当用时,。(力近似于正态分布。假设Q)是白噪声的自相关系数,那么M=ODp(r)-(r0)(2.57)N根据统计检验的2b准那么,当p(r)1.96121(2.58)或p(2(2.59)时,便可认为。(r)为零的可能性是95%,从而接受。(r)=0(r0)这一估计,即数据是独立的。如果有个别0(r)(rO)超出式(2.57)所约束的范围,可以采用另一种检验该随机变量是否独立的整体检验方法。考虑到rl时,白噪声序列的样本自相关分布渐近于正态分布,或是说
29、当N较大时,瓜河1),50(2),50(k)这k个量近似为相互独立的正态随机变量N(OJ),因而它们的平方和符合力2分布。构造统计量为Q=Np2(r)(2.60)r=l那么检验玉,“2,,/是否为白噪声样本值的问题可转化为检验统计量Q是否是自由度为k的/2分布问题。具体算法是:以“为为白噪声”做原假设,以Q为显著水平,那么根据和自由度k由2分布表查出相应的Jd(Q值,并与计算出的Q值比拟。如果(2.61)Q(Q那么肯定原假设,即在(1-。)的置信水平上接受xj为独立的假定。如果Q(Q(2.62)那么否认原假设。2.4.4 离群点的检验与处理离群点是指一个时间序列中,远离序列一般水平的极端大值和
30、极端小值,也成为奇异值或野值。形成离群点的原因是多种多样的,例如由于数据传输过程、采样及记录过程中发生信号失真或丧失等而产生,又如研究现象本身由于受各种偶然非正常的因素影响而形成离群点等等。不管何种原因引起离群点,通常都会在之后的时间序列分析中带来误差,影响建立时序模型的精度。在得到时间序列以后,首先要检查是否存在离群点,下面介绍一种线性外推的方法来寻找和剔出离群点。该方法是将时间序列值与平滑值进行比拟,认为正常的数据是“平滑的”,而离群点是“突变的”。用V:表示先对序列进行平滑、再平方得到的数值,不表示先对序列取平方、再做平滑而得到的数值,用表示方差,有S”不一无2,如果区+1-XjkSj(
31、2.63)那么认为XH是正常的,否那么认为X源是一个离群点。K是常数,一般取3-9的整数。如果Xm是离群点,那么可用父用来代替,即X+=2Xj-XiT(2.64)为防止出现无休止的外推计算,建议事先规定连续外推的次数,因为接连检测到一些离群点后,最终的外推结果可能偏离很远,以致会排出本来是很正常的数据点。习题二2.1EVIEWS软件介绍(11)借助EVieWS5.1,我们可以很方便的判断一个时间序列是否平稳以及是否为纯随即性序列。作出判断的步躲如下:一、绘制时间序列图时序图可以大致看出序列的平稳性,平稳序列的时序图应该显示出序列始终围绕一个常数值波动,且波动的范围不大。如果观察序列的时序图显示
32、出该序列有明显的趋势或周期,那它通常不是平稳序列,现以例子来说明。例1、1964-1999年中国纱年产量序列(单位:万吨)。按照第一章的方法建立工作文件和导入外部EXCeI文件,创立新序列SHA,如图2.2。点击主菜单QUiCk/Graph就可作图,见图23,分别是折线图(Linegraph)、条形图(Bargraph)、散点图(Scatter)等,也可双击序列名,出现显示电子表格的序列观测值,然后点击工具栏的View/GraPh。如果选择折线图,出现图2.4的对话框,在此对话框中键入要做图的序列,点击OK那么出现折线图,横轴表示时间,纵轴表示纱产量,见图2.5,选择图2.5上工具栏optio
33、ns可以对折线图做相应修饰。点击主菜单的Edit/Copy,然后粘贴到文档就变成了如图2.6的折线图。图2.2QUiCkJ OptiOnS WindoW HelPSample.Generate Series.Show.GraphEmpty Group (Edit Series)Series Statistics Group Statistics Estimate Equation. Estimate VAR.图2.3Line graph Bar graph Scatter XYline PieSeries List图2.4从图1.5可以看出,纱产量呈现波动中上升的趋势,显然不平稳,所以不是一个
34、平稳序列。这一结论,还可以通过平稳性统计检验来进一步说明。二、平稳性判断例1续.为了进一步的判断序列SHA的平稳性,需要绘制出该序列的自相关图。双击序列名sha出现序列观测值的电子表格工作文件,点击ViewZCorreIogram,出现图1.6的相关图设定对话框,上面选项要求选择对谁计算自相关系数:原始序列(LeVe1)、阶差分(1stdifference)和二阶差分(2nddifference),默认是对原始序列显示相关图。下面指定相关图显示的最大滞后阶数k,假设观测值较多,k可取77/0或卜厅;假设样本量较小k一般取7%(7表示时间序列观测值个数,说明不超过其的最大整数)。假设序列是季节数
35、据,一般k取季节周期的整数倍。设定完毕点击OK就出现图L7的序列相关图和相应的统计量。图2.7Sample:19641999Includedobsevations:36AutocorrelationPartialCorrelationACPACQ-StatProbI1 0.914 0.914 32.646 0.000I I2 0.843 0.050 61 268 0 000I LI3 0,767 -0.065 85 668 0 000I4 0,695 -0.021 106.34 0 000I匚I5 0,609 -0 129 122.70 0 000I 6 0.544 0 065 136.18
36、0 000I7 0,476 -0 034 146.88 0 000I匚I8 0,395 -0 139 154.52 0 000I9 0,321 -0019 159.74 0 000I I10 0,242 -0 094 162.82 0 0I匚I11 0,147 -0 166 164.00 0 000I12 0,058 -0 038 164.19 0 0I匚I13 -0.033 -0 116 164.25 0 000I14 -0.108 0.010 164.98 0 000I I15 -0.168 0.053 166.83 0 000I16 -0.215 -0.015 169.99 0 000I
37、17 -0.260 -0.021 174.85 0 000I tI18 -0.306 -0.083 181.98 0 000I19 -0.346 -0.040 191.62 0,000I20 -0.382 -0.010 204.08 0.000I21 -0.417 -0.069 219.95 0.000I I22 -0.433 0.049 238.26 0.000I23 -0.438 0.013 258.49 0.000I I24 -0.426 0.042 279.20 0.000图2.8相关图的左半局部是自相关和偏自相关分析图,垂立的两道虚线表示2倍标准差。右半局部是滞后阶数、自相关系数、偏
38、自相关系数、Q统计量和相伴的概率。从自相关和偏自相关分析图可以看出自相关系数趋向0的速度相当缓慢,且滞后6阶之后自相关系数才落入2倍标准差范围以内,并且呈现一种三角对称的形式,这是具有单调趋势的时间序列典型的自相关图的形式,进一步说明序列是非平稳的。三、纯随机性判断一个时间序列是否有分析价值,要看序列观测值之间是否有一定的相关性,假设序列各项之间不存在相关,即相应滞后阶数的自相关系数与0没有显著性差异,序列为臼噪声序列,那么图1.7中Q统计量正是对序列是否是白噪声序列即纯随机序列进行的统计检验,该检验的原假设和备择假设分别为:H&1=P2=.,=m=0,mlH1:至少存在某个pk0,Vnzl,km在图2.8中,由每个Q统计量的伴随概率可以看出,都是拒绝原假设的,说明至少存在某个k,使得滞后k期的自相关系数显著非0,也即拒绝序列是白噪声序列的原假设。进行时间序列分析,我们希望序列是平稳的,且非随机的,假设随机,前后观察值之间没有任何关系,没有信息可以提取。所以我们在研究时间序列之前,首先要对其平稳性和随机性进行检验,目的是对平稳且非随机序列进行研究。