《时间序列模型案例分析.docx》由会员分享,可在线阅读,更多相关《时间序列模型案例分析.docx(21页珍藏版)》请在课桌文档上搜索。
1、时间序列模型案例分析案例分析1:中国人口时间序列模型(file:b2cl)(如何建立AR模型)从人口序列图能够看出我国人口总水平除在I960与1961两年出现回落外,其余年份基本上保持线性增长趋势。51年间平均每年增加人口1451.5万人,年平均增长率为17.5%。由于总人口数逐年增加,实际上的年人口增长率是逐步下降的。把51年分为两个时期,即改革开放往常时期(19491978)与改革开放以后时期(19791996),则前一个时期的人口年平均增长率为20%。,后一个时期的年平均增长率为13.4%。从人口序列的变化特征看,这是一个非平稳序列。见人口差分序列图。建国初期由于进入与平环境,同时随着国
2、民经济的迅速恢复,人口的年净增数从1950年的1029万人,猛增到1957年的1825万人。由于粮食短缺,三年经济困难时期是建国后我国惟一一次人口净负增长时期(I960,1961),人口净增值不但没有增加,反而减少。随着经济形势的好转,从1962年开始人口年增加值迅速恢复到1500万的水平,随后呈连年递增态势。1970年是我国历史上人口增加最多的一个年份,为2321万人。随着70年代初计划生育政策执行力度的加强,从1971年开始。年人口增加值逐年下降,至1980年基本回落到建国初期水平C1981至1991年人口增加值大幅回升,要紧原因是受1962-1966年高出生率的影响(1963年为43.7
3、3%。)。这种回升的下一个周期将在2005年前后出现,但强势会有所减弱。从数据看,1992年以后,人口增加值再一次呈逐年下降趋势。由于现在的人口基数大于以往年份,因此尽管年增人口仍在1千万人以上,但人口增长率却是建国以来最低的(1996年为10.5%。)。从Ng的变化特征看,1960,1961年数据可看作是两个离群值,其它年份数据则表现为平稳特征。但也不是白噪声序列,而是一个含有自有关与(或者)移动平均成分的平稳序列。下面通过对人口序列%与人口差分序列小,的有关图,偏有关图分析判别其平稳性与识别模型形式。:I10.9490.94949.5340.00020,896-0.04194.5720.0
4、0030,841-0.038135.150.00040,787-0.036171.360.00050,732-0.033203.350.00060,677-0.031231.320,00070,622-0.034255.450.00080,567-0.031275.960.00090,513-0.025293.160.000100.460-0.032307.290.000AutocorrelationPartialCorrelationACPACQ-StatProb图2.13M的有关图,偏有关图AutocorrelationPartialCorrelationACPACQ-StatProb10
5、.6090.60920.0200.00020,247-0.19523.3940.00030.1300.11524.3520.00040.074-0.04124.6700.0005-0.001-0.05124.6700.0006-0.062-0.04324.8980.0007-0.139-0.12026.0920.0008-0.1530.00227.5650.0019-0.185-0.13029.7730.00010-0.219-0.06532.9460.000图2.14Oy,的有关图,偏有关图(虚线到中心线的距离是2(1/J钉)=0.28)见图2.13与图2.14。人口序列M是非平稳序列。人口
6、差分序列OV是平稳序列。应该用Qv建立模型。由于Oy均值非零,结合图2.14拟建立带有漂移项的AR(I)模型。估计结果如下:DependentVariable:D(Y)Method:LeastSquaresDate:07/26/04Time:20:44Samplefadjusted):19512000Includedobservations:50afteradjustingendpointsConvergenceachievedafter3iterationsVariableCoefficientStd.Errort-StatisticProb.C0.1428620.0164678.67573
7、60.0000AR(1)0.6171160.1139535.4155260.0000R-squared0.379267Meandependentvar0.143094AdjustedR-squared0.366335SDdependentvar0056004SEofregression0044581Akaikeinfocriterion-3343828Sumsquaredresid0.095399Schwarzcriterion-3267348Loglikelihood8559571F-statistic2932792Durbin-Watsonstat1757605Prob(F-Statist
8、ic)0000002InvertedARRoots.62Dyl=0.1429+0.6171(Dy;.i-0.1429)+v,(8.7)(5.4)R?-0.38,Qao)=5.2,(k-p-q)=,O5(IO-I-O-I)=15.5模型参数都通过了显著性,检验。注意:(1)根据Wold分解定理,EViews的输出格式表示的是,对序歹IJ(QM-0.1429)建立AR(I)模型,而不是对QM建立AR(I)模型。(2)整理输出结果:Dy,=0.1429(1-0.6171)+0.6171Dyr.+=0.0547+0.6171Dyt.+v,漂移项a=0.0547,特征根是1/0.62=1.61。输出结果
9、中的0.1429是以的均值,不是模型漂移项。以AR过程Wa+0卬+为例,两侧求期望,得均值与漂移项徐的关系是QE(x,)=,或者a=-)1-城对整理后的输出结果两侧求期望,就会反求出4=0.0547/(1-0.6171)=0.1429(3)是否具有漂移项对求特征方程与特征根无影响。模型残差的有关图与偏有关图如F,AutocorrelationPartialCorrelationACPACQ-StatProbII10.1180.1180.74242-0.182-0.1992.53300.1113-0.0230.0282.56260.27840.0440.0082.67330.4455-0.024
10、-0.0332.70640.60860.0080.0292.71060.7447-0.078-0.1013.08140.7998-0.0310.0013.14070.8729-0.046-0.0763.27260.91610-0.172-0.1785.20610.816图2.15表2.5中模型(1)残差序列的有关图,偏有关图由于Q(Io)=5.2xd88Mgns: 1Rooc Mean SqgmC ErnOf002S358MeBn AMOU Error0025358Mean AM. Pft Error0 19e685图2.17点击forecast键只选取2001年动态或者静态的预测结果解法2:
11、把中国人口序列M看作是含有确定性趋势的平稳序列。前提是中国人口序列M务必是退势平稳序列。用M对时间,回归,得y;=5.0152+0.1502/+w,(110)(102)R2=0.995,(1949-2001)用小检验单位根如下。clu,=-0.0940ut.+0.6681dut.(-2.5)(6.3)R2=0.45,(1951-2001),DFo.o5=-l96AugmentedDickey-FullerUnitRootTestonRESADFTestStatistic-2.4918041%CriticalValue*-2.60815%CriticalValue-1.947110%Critic
12、alValue-1.6191处是一个平稳序列。因此M是一个退势平稳序列。有理由建立一个含有固定趋势项的时间序列模型。AutocorrelationPartialCorrelationACPACQ-StatProb10900090045.4330.000IIII二III20745-034577.1710.000IIICI30574-0105963960000I=ILI40399-0.112105.880.000IZIIICI50,223-0130108890.000I1IIEI60,050-0.126109.050.000ICIII7-0.108-0.084109790.000III8-0.24
13、6-0.085113.700.000I=II匚I9-0.370-0.155122.750.000IIII10-0.468-0.068137.600.000IIII11-0534-0.060157.370.000III12-05250.211176.990,000UIII13-04570088192.230.000匚IIII14-0367-0043202290000日1IqI15-0276-0.076208120000图17”,的有关图与偏有关图通过观察处的有关图与偏有关图,判定m是一个二阶自回归过程。0为正,力为负。特征根应该为复根。建立含有固定趋势项的二阶自回归模型YCtrend(1948)
14、AR(I)AR(2)估计结果如下:DependentVariable:YMethod:LeastSquaresDate:07/26/04Time:22:10Sample(adjusted):19512000Includedobservations:50afteradjustingendpointsConvergenceachievedafter3iterationsVariableCoefficientStd.Errort-StatisticProb.C4.9728560.14262734.866100.0000TREND(1948)0.1508220.00426535.362540.0000
15、AR(I)1.5503380.11283613.739680.0000AR(2)-0.6490570.110151-5.8924170.0000R-squared0.999653Meandependentvar9.141142AdjustedR-squared0.999630S.D.dependentvar2.219306S.E.ofregression0.042670Akaikeinfocriterion-3.394029Sumsquaredresid0.083753Schwarzcriterion-3.241068Loglikelihood88.85073F-statistic44168.
16、83Durbin-Watsonstat1.852560Prob(F-Statistic)0.000000InvertedARRoots.78-.22i,78+.22i写表达式如下:yr=4.9729+0.1508/+W,(1949,t=1)(34.9)(35.4)其中ul=1.5503ul.-0.6491ul.2+vf,(1949,/=1)(13.7)(-5.9)或者写为yl=4.9729+0.1508/+1.5503ut.-0.6491ul.2+v;,(1949,t=1)(34.9)(35.4)(13.7)(-5.9)R?=0.995,(1951-2000),Q(io)=4.6,Qa(k-p
17、y)=0o.os(10-2-0-2)=12.6模型残差序列的有关与偏有关图如下,;I,10.0660.0660.23242-0.191-0.1972.215430.0090.0392.21960.13640.0760.0362.54860.28050.0010.0012.54870.46760.0290.0532.59910.6277-0.087-0.1023.06180.6908-0.036-0.0083.14230.7919-0.059-0.0973.36310.85010-0.139-0.1464.61680.798AutocorrelationPartialCorrelationACP
18、ACQ-StatProb根据上式预测,2001年中国人口预测数是IfiewIProcsIObjectsPrintNameFreezeobsRESYF1999-0.09728412,606432000-0.15179312,7065620012.80329y200=4.9729+0.1508253+1.5503(-0.15179)-0.6491(-0.09728)=12.7942(亿人),(2001年,1=53)也能够把输出结果写为,yf=4.9729+0.15081+1.5503Uu4.9729-0.1508(t-l)-0.6491(y,.2-4.9729-0.1508(t-2)+vz(34.
19、9)(35.4)(13.7)(-5.9)整理后得M=O.5293+0.0149/+1.5503yl.-0.6492+H注意:EViews的输出格式表示的是对序列UL4.9729-0.15081)估计AR(2)模型。根据上式预测,2001年中国人口预测数是ViewIProCSObjeCtSPrintjNameFreeZeobsYYF199912.5786012,60643200012.6743012.70656200112,7627012.80329J2OOi=0.5293+0.014953+1.5503(12.6743)-0.649Ix(12.5786)=12.8032(亿人),(2001年,
20、Z=53)EViews预测的结果是12.8033。已知2001年中国人口实际数是12.7627亿人。预测误差为12.8033-12.7627=Q00312.762712.90125512012.7512.70Forecast: YFActual: YForecast sample: 2001 2001 included observations: 1Root Mean Squared Error0.040592Mean Absolute Error0.040592Mean Abs. Percent Error0.318051图2.18点击forecast键只选取2001年动态或者静态的预测结果
21、案例2日本人口时间序列模型(file:japopu)(如何建立缺项的AR模型)I三日本人口序列5)日本人口差分序列(分,)人口数字之因此起于1872年,是由于1872年日本才有了全国人口统计数字。在122年间(1872-1994),日本人口从3480.6万人增至12503.4万人(3.6倍)。日本人口增加的特点是两头慢,中间快。同时在1944-1946年与1972年人口总量出现了猛烈波动。1944-1946年的波动是由于战败,1972年的波动是由于美国归还冲绳。由图1中的有关图能够判定日本人口序列M是一个非平稳序列。由图2能够看出日本人口差分序列Dy是一个平稳序列。图3是日本人口的二次差分序列
22、DDm。它也是一个平稳序列。差分序列DM的极差是0.059,差分序列DDy的极差是0.087。可见DDM是一个过度差分序列。应该用DM建立时间序列模型。日本历史上有两次大规模向国外学习的过程。一次是大化改新。大化改新(公元645-649)是一场以圣德太子政治理念为基础的贵族革命。圣德太子(公元574-622)一心加强皇权,决心向中国学习,启蒙日本。他四度向中国派遣使团与留学生。在它的影响下,其死后23年,即公元645年,中大兄皇子发动政变,成功地建立了类似唐朝的中央集权机构。一次是明治维新。明治维新始于1868年。从而开始了全面向西方学习的历史。口号是“富国强兵”(福泽谕吉)。要紧措施是(1)
23、加强中央集权,1871年实施“废藩治县”,(2)1872年采取美国三权分立的政治体制,(3)1872年统一货币,实行1日元=1美元的兑换率,(3)1872年开始修铁路、建立现代统计制度,使用阳历等,(4)1873年迁都东京。AutocorrelationPartialCorrelationAutocorrelation Partial Correlation图3日本人口二次差分序列Z5Dy的有关图与偏有关图AutocorrelationPartialCorrelationD有关图、偏有关图由DM的有关图、偏有关图(见图2)初步判定应建立均值非零的AR(3)或者AR(4)模型。估计结果如下:先估
24、计AR(4)模型,化简至AR(3)模型DependentVariable:DYMethod:LeastSquaresDate:04/30/01Time:02:22Sample(adjusted):18761994Includedobservations:119afteradjustingendpointsConvergenceachievedafter3iterationsVariableCoefficientStd.Errort-StatisticProb.CAR(1)AR(3)0.0075690.2626730.2766810.0010207.4189260.0877722.9926900
25、.0873613.1670880.00000.00340.0020R-squared0.192971Meandependentvar0.007539AdjustedR-squared0.179057S.D.dependentvar0.005658S.E.ofregression0.005126Akaikeinfocriterion-10.52192Sumsquaredresid0.003048Schwarzcriterion-10.45186Loglikelihood460.2005F-statistic13,86854Durbin-Watsonstat2.171019Prob(F-Stati
26、stic)0.000004InvertedARRoots.75-.24+.56i-.24-.56i图4EVieWS估计结果AutocorrelationPartialCorrelation图5模型(2.79)残差的有关图与偏有关图obsActual|FittedIResidualResidualPlot19890.004600.00651-0.00191II19900.004060.00630-0.00224II19910.004320.00595-0.00163II19920.004090.00589-0.00180I-I19930.003120.00568-0.00256lI19940.0
27、02700.00550-0.00280I对应的模型表达式是Dyl=0.0076+0.2627(Dyl.i-0.0076)+0.2767(Dyl.3-0.0076)+v,(7.4)(3.0)(3.2)R=019,Q7.0,Q(k-pq)=00,05(15-2-0)=22.4注意:EViews的输出格式表示的是对序列(QM-0.0076)估计AR(3)模型。整理:Dyl=0.0076(1-0.2627-0.2767)+0.2627Dy,.1+0.2767Dyt.3+必Dyl=0.0035+0.2627Dyl.+0.2767D3+v,通过/值、。卬值、产值与。值,说明(2.79)式是一个满意的日本人
28、口模型。图5显示模型(2.79)的残差中己不含有自回归与移动平均成分。模型特征方程的3个根是Zl=1/0.75=1.33Z2=1/(-0.24-0.56/)=0.9375-2.1875zZ3=1/(-0.24+0.56i)=0.9375+2.1875/下面利用模型(2.79)预测995,并计算预测误差。已知I),,=0.0027,力1992=0.00409,则预测结果是,Dy1995=0.0035+0.2627Dy994+0.2767Qv992=0.00350.26270.0027+0.2767X0.0041=0.0053y1995=y1994+Dy1995=1.25034+0.0053=1.
29、25564已知1995年日本人口实际数是1.25569亿人。预测误差为些564-1.2当Ko.。.1.25569案例3中国粮食产量序列(M)的MA模型(file:5arma07)(如何建立MA模型)粮食产量(M)定义见中国统计年鉴2005。匕是一个非平稳序列。用它的对数差分序列北M建立时间序列模型。的自有关函数见下图。4。叨是一个ARMA过程或者MA过程。ARMA()过程Date:05/25/06Time:07:48Sample:19492002Includedobservations:53AutocorrelationPartialCorrelationACPACQ-StatProb:10.
30、2650.2653.94870.0472-0.122-0.2074.79360.09130.0120.1194.80250.1874-0.114-0.2055.58000.2335-0.1070.0196.27710.2806-0.033-0.0726.34320.3867-0.173-0.1718.23800.31280.0410.1648.34470.40190.031-0.1598.41030.49310-0.290-0.24614.1060.168首先估计ARMA(1,1)模型。结果如下:dLnyt=0.025-0.320dLnyt.-0.025)+vt+0.784V.(2.3)(-1
31、.7)(6.1)R2=0.19,(15)-11.6,(k-p-q)-,O5(15-1-1)=22.4注意:假如估计结果中有均值项,只在自回归项中减之,不必在移动平均项中减之。DependentVariable:DLOG(Y)Method:LeastSquaresDate:09/1W6Time:11:37Sample(adjusted):19512002Includedobservations:52afteradjustmentsConvergenceachievedafter12iterationsBackcast:1950VariableCoefficientStd.Errort-Stati
32、sticProb.C0.0242760.0106732.2744380.0274AR(1)-0.3202340.192577-1.6628910.1027MA(1)0.7845350.1292816.0684690.0000R-squared0.189368Meandependentvar0.023866AdjustedR-squared0.156281S.D.dependentvar0.062106S.E.ofregression0.057047Akaikeinfocriterion-2.833914Sumsquaredresid0.159465Schwarzcriterion-2.7213
33、42Loglikelihood76.68176F-statistic5.723341Durbin-Watsonstat1.994829Prob(F-Statistic)0.005837InvertedARRoots-.32InvertedMARoots-.78自回归项没有显著性,去掉AR(I)项,进一步建立MA(I)模型。结果如下:dLnyt=0.027+vl+0.5963Vt-I(2.1)(5.6)R?=0.13,Q(20)=28.2,Q(k-pp)=00,05(20-0-1-1)=28.9DependentVariable:DLOG(Y)Method:LeastSquaresDate:09
34、/11/06Time:11:40Sample(adjusted):19502004Includedobservations:55afteradjustmentsConvergenceachievedafter9iterationsBackcast:1949VariableCoefficientStd.Errort-StatisticProb.C0.0270600.0129902.0831510.0421MA(1)0.5963470.1071415.5660160.0000R-squared0.134062Meandependentvar0.025866AdjustedR-squared0.11
35、7723S.D.dependentvar0.064473SE.ofregression0.060559Akaikeinfocriterion-2.734715Sumsquaredresid0.194371Schwarzcriterion-2.661721Loglikelihood77.20467F-statistic8.205296Durbin-Watsonstat2.296366Prob(F-Statistic)0.005974InvertedMARoots-.60上述模型的各类检验与诊断都能通过,能够作为备选模型。假如进一步分析,还能够把模型做得更好。观察残差序列发现在7年与10年上仍有较
36、大的自有关。这预示着序列中还存在710年的变化周期。Date:09/1W6Time:11:41Sample:19502004Includedobservations:55Q-statisticprobabilitiesadjustedfor1ARMAterm(s)AutocorrelationPartialCorrelationACPACQ-StatProbI匚II匚I1-0.194-0.1942.1796III匚I2-0.094-0.1362.69960.100IIII30.1210.0783.57640.167IEIII4-0.098-0.0734.16410.244I匚II匚I5-0.1
37、68-0.1945.93750.204III60.1700.0777.79200.168匚I匚I7-0.266-0.26312.4060.054I0III80.0640.01112.6750.080IIZl190.1830.10814.9470.060匚II匚I10-0.268-0.23219.9590.018下图给出的是作3年移动平均后退去趋势的序列,显然该序列存在着710年的变化周期。把“7与“io作为变量加入模型。得结果如下:dLnyt=0.025+vz+0.3187v,.-0.1623v.-0.6895vf.o(4.8)(4.2)(-3.0)(-14.1)R2=0.37,2(15)=1
38、7.0,Q(k-pp)=,05(l503l)=19.7IIIII10.0270.0270.0438I匚IEI2-0.170-0.1711.7605I0II0I30.1050.1192.4245I匚II匚I4-0.173-0.2214.25850.039II5-0.240-0.1947.87960.019IIII60.058-0.0068.09280.044IIIICI7-0.049-0.1058.25040.083IIII8-0.024-0.0048.28890.141IZliII90.2030.10111.0870.086I1III100.1110.08211.9500.102CIIdI11
39、-0.151-0.13113.5820.093I3IIJI120.1100.11514.4680.107IIIII13-0.012-0.03914.4780.152I匚IIII14-0.183-0.04117.0270.107IIIdI15-0.014-0.04817.0430.148AutocorrelationPartialCorrelationACPACQ-StatProb2.7回归与ARMA组合模型(combinedregression-timeseriesmodel)己经学习回归模型与时间序列模型,假如把这两种分析方法结合在一起,有的时候会得到比其中任何一种方法都好的预测结果。比如有
40、如下回归模型丫尸o+Xt+g(15)其中最是解释变量,M是被解释变量,,是随机误差项。上述模型的估计式是令日产0,用上式可预测M的值。口是一个平稳的、非自有关的残差序列。当均存在自有关时,时间序列分析的一个有效应用是对残差序列建立ARMA模型。然后将上式中的残差项用ARMA模型替换。在利用上述模型预测M时,能够利用ARMA模型先预测出访的值。有的时候,这会使M的预测值更准确。这种回归与时间序列相结合的模型形式是y,=0+ixl+L)6(L)vt(16)其中禹=(L)(L)或者写成0(L)力=O(L)怔力是服从正态分布的、非自有关的误差项。口的方差通常与力不一样,这种回归与时间序列相组合的模型称作转(变)换函数模型(tr