《第7讲多元线性回归3.ppt》由会员分享,可在线阅读,更多相关《第7讲多元线性回归3.ppt(26页珍藏版)》请在课桌文档上搜索。
1、2023/11/7,1,第七讲,多元(重)线性回归,Multiple linear regression(3),2023/11/7,2,2.4 多元回归计算程序,例2.1 某精神病学医生想知道精神病患者经过个月治疗后疾病恢复的情况Y是否能通过精神错乱的程度X1、猜疑的程度X2两项指标来较为准确地预测。资料如下,试作分析。,2023/11/7,3,DATA d4p15;INPUT y x1 x2;CARDS;28 3.36 6.924 3.23 6.514 2.58 6.221 2.81 6.022 2.80 6.410 2.74 8.428 2.90 5.6 8 2.63 6.9,23 3.1
2、5 6.516 2.60 6.313 2.70 6.922 3.08 6.320 3.04 6.821 3.56 8.813 2.74 7.118 2.78 7.2;,2023/11/7,4,PROC REG;MODEL y=x1 x2;RUN;,以上是程序的参数估计结果,不难看出截距项可以去掉。,2023/11/7,5,DATA abc2;SET D4P15;PROC REG;MODEL y=x1 x2/NOINT P R;RUN;,将截距项去掉,计算各点上因变量的预测值,进行残差分析,2023/11/7,6,2023/11/7,7,这是程序的方差分析和参数估计结果,方程与各参数的检验结果都
3、有显著性意义,所求得的二元线性回归方程为:,线性回归方程的估计标准误为:,2023/11/7,8,2023/11/7,9,这是对程序中的二元回归模型作残差分析的结果,从第、两列发现第个观测点所对应的学生化残差的绝对值大于(因STUDENT=-2.170),故认为该点可能是异常点,需认真检查核对原始数据。,2023/11/7,10,DATA abc3;SET D4P15;IF _N_=8 THEN DELETE;PROC REG;MODEL y=x1 x2/NOINT P R;RUN;,2023/11/7,11,2023/11/7,12,这是程序的方差分析和参数估计结果,方程与各参数的检验结果都
4、有显著性意义,所求得的二元线性回归方程为,线性回归方程的估计标准误为:,2023/11/7,13,2023/11/7,14,比较第个观测点去掉前后预测平和Press的值从122.8819降为79.9550;对整个方程检验的F值从474.661上升为660.326;线性回归方程的估计标准误由2.53714下降为2.14515,表明该点对因变量预测值的影响是比较大的,值得注意。,2023/11/7,15,例2.2有人在某地抽样调查了29例儿童的血红蛋白与种微量元素的含量,资料如下,试问可否用种微量元素(单位都是mol/L)钙(X1)、镁(X2)、铁(X3)、铜(X4)来较好地预测血红蛋白(Y,g/
5、L)的含量?,SAS程序:DATA d4p16a;INPUT y x1-x4;CARDS;135.0 13.70 12.68 80.32 0.16.70.0 11.80 11.73 52.75 0.13;,2023/11/7,16,PROC reg;MODEL y=x1-x4/COLLIN COLLINOINT;RUN;,先用程序作试探性分析,并用了共线性诊断的技术。,共线性诊断选择项,对截距未进行校正,共线性诊断选择项,对截距进行校正,2023/11/7,17,输出结果及其解释,2023/11/7,18,程序的参数估计结果截距项、X2、X4都无显著性意义,但不应过早将X2、X4从模型中去掉。
6、最好等截距项从模型中去掉之后,重新拟合,视最后的结果再作决定。,2023/11/7,19,这是共线性诊断的第部分,即未对截距项校正的回归诊断结果从最后一行的条件数25.558510可知,自变量之间有较强的共线性;从该行方差分量的数值可看出自变量之间的共线性主要表现在X2、X3两变量上。,2023/11/7,20,这是共线性诊断的第部分,即对截距项校正之后的回归诊断结果因本例的截距项无显著性意义,故用第部分诊断结果就可以了。,2023/11/7,21,data d4p16b;set d4p16a;PROC REG;MODEL y=x1-x4/NOINT SELECTION=STEPWISE SL
7、E=0.30 SLS=0.10 STB;RUN;,用逐步回归法筛选自变量,变量进入方程的显著性水平,剔除变量的显著性水平,求出标准化回归参数,2023/11/7,22,Stepwise Procedure for Dependent Variable YStep 1 X3 EnteredR-square=0.98979882 C(p)=4.72240744Step 2 X1 EnteredR-square=0.99086912 C(p)=3.39412226Step 3 X4 EnteredR-square=0.99175444 C(p)=2.64104696Step 4 X4 Removed
8、 R-square=0.99086912 C(p)=3.39412226All variables in the model are significant at the 0.1000 level.No other variable met the 0.3000 significance level for entry into the model.,2023/11/7,23,这是程序中逐步回归分析的扼要结果,详细结果省略了。筛选的结果表明 X3是有非常显著性影响的变量;而X1仅在P=0.0865水平上有显著性意义,若规定SLS=0.05,则回归方程中只有X3一个自变量。,2023/11/7,24,2023/11/7,25,这是逐步回归分析的最后结果,回归方程为,两个标准化回归系数分别为-0.174394、1.166184,结合前面共线性诊断的结果可知,X1与X3之间无密切的相关关系,故可认为X3对Y的影响大于X1。,2023/11/7,26,专业结论微量元素中铁(X3)的含量对血红蛋白(Y)的影响有非常显著性意义。铁的吸收量提高后,有助于血红蛋白含量的提高(因B3=1.166);而钙的吸收量提高后,反而会使血红蛋白含量有减少的趋势(因B1=-0.174)。,