《运用SPSS建立多元线性回归模型并进行检验-副本1.doc》由会员分享,可在线阅读,更多相关《运用SPSS建立多元线性回归模型并进行检验-副本1.doc(6页珍藏版)》请在课桌文档上搜索。
1、 计量经济学实验报告一.实验目的:1、 学习和掌握用SPSS做变量间的相关系数矩阵;2、 掌握运用SPSS做多元线性回归的估计;3、 用残差分析检验是否存在异常值和强影响值4、 看懂SPSS估计的多元线性回归方程结果;5、 掌握逐步回归操作;6、 掌握如何估计标准化回归方程7、 根据输出结果书写方程、进展模型检验、解释系数意义和预测;二实验步骤:1、根据所研究的问题提出因变量和自变量,搜集数据。2、绘制散点图和样本相关阵,观察自变量和因变量间的大致关系。3、如果为线性关系,那么建立多元线性回归方程并估计方程。4、运用残差分析检验是否存在异常值点和强影响值点。5、通过t检验进展逐步回归。6、根据
2、spss输出结果写出方程,对方程进展检验拟合优度检验、F检验和t检验。7、输出标准化回归结果,写出标准化回归方程。8、如果通过检验,解释方程并应用预测。三.实验要求: 研究货运总量y与工业总产值x1,农业总产值x2,居民非商品支出x3,之间的关系。详细数据见表: 1计算出y,x1,x2,x3的相关系数矩阵。 2求y关于x1,x2,x3的三元线性回归方程 3做残差分析看是否存在异常值。 4对所求方程拟合优度检验。 5对回归方程进展显著性检验。 6对每一个回归系数做显著性检验。 7如果有的回归系数没有通过显著性检验,将其剔除,重新建立回归方程,在做方程的显著性检验和回归系数的显著性检验。 8求标准
3、化回归方程。 9求当x1=75,x2=42,x3=3.1时y。并给出置性水平为99%的近似预测区间。 10结合回归方程对问题进展一些根本分析。四.绘制散点图或样本相关阵相关性货运总量工业总产值农业总产值居民非商品支出货运总量Pearson 相关性1.556.731*.724*显著性双侧.095.016.018N10101010工业总产值Pearson 相关性.5561.155.444显著性双侧.095.650.171N10111111农业总产值Pearson 相关性.731*.1551.562显著性双侧.016.650.072N10111111居民非商品支出Pearson 相关性.724*.4
4、44.5621显著性双侧.018.171.072N10111111*. 在 0.05 水平双侧上显著相关。五建立并估计多元线性回归模型:六残差分析找异常值 由上表分析得,残差分析找异常值后其Cook距离不能大于1,Student化已删除的残差的绝对值不能大于3,综上所述删除第六组观测值继续进展如上操作,再未发现异常值。七.删除异常值继续回归:模型汇总模型RR 方调整 R 方标准估计的误差1.975a.950.92012.94188a. 预测变量: (常量), 居民非商品支出, 工业总产值, 农业总产值。Anovaa模型平方和df均方FSig.1回归15968.09435322.69831.77
5、9.001b残差837.4625167.492总计16805.5568a. 因变量: 货运总量b. 预测变量: (常量), 居民非商品支出, 工业总产值, 农业总产值。系数a模型非标准化系数标准系数tSig.B 的 95.0% 置信区间B标准误差试用版下限上限1(常量)-659.510126.833-5.200.003-985.546-333.474工业总产值4.0701.071.4123.802.0131.3186.822农业总产值16.0432.8241.0575.681.0028.78423.301居民非商品支出-14.3599.109-.306-1.576.176-37.7769.05
6、7那么回归方程为:由上述分析知居民的非商品支出的参数估计量所对应P值为0.176大于=0.05,所以货运总量与居民非商品支出无显著性差异,即剔除变量:居民的非商品支出,继续做回归。此时的回归方程为:八.统计检验:1拟合优度检验:由估计结果图表可知,可决系数 =0.962,修正的可决系数=0.925。计算结果说明,估计的样本回归方程较好的拟合了样本观测值。2F检验提出检验的原假设为:=0对立假设为:至少有一个 不等于零i=0,1,2对于给定的显著性水平=0.05,P=0.000=0.05,所以否认原假设,总体回归方程是显著的。 (3)t检验提出的原假设为:=0 i=0,1,2由表得,t统计量为所
7、对应的P值为0.002所对应的P值为0.021所对应的P值为0.000对于给定的显著性水平a=0.05,因为所对应的P值均小于=0.05,所以货运总量与工业总产值和农业总产值之间有显著性关系,4预测假设X1=75,X2=42试预测货运总量并构造其99%的置信区间将X1=75,X2=42代入估计的回归方程经计算得Y的置信区间为237.71840,312.28406.(5)相关分析 当维持农业总产值不变的情况下,每增加一单位的工业总产值,货运总量相应的增加3,534亿吨;当维持工业总产值不变的情况下,每增加一单位的农业总产值,货运总量相应的增加12.333亿吨;综上得出农业总产值引起货运总量的变化相比于工业总产值较大。6 / 6