《第9章回归分析.ppt》由会员分享,可在线阅读,更多相关《第9章回归分析.ppt(21页珍藏版)》请在课桌文档上搜索。
1、第9章 回归分析,本章重点:回归分析的基本概念 线性回归分析 线性回归分析应用实例 非线性回归分析,曲线估计 时间序列的曲线估计 含虚拟自变量的回归分析 逻辑回归分析,9.1 回归分析的基本概念,在数量分析中,经常会看到变量与变量之间存在着一定的联系。要了解变量之间如何发生相互影响的,就需要利用相关分析和回归分析。相关分析和回归分析都是研究变量间关系的统计学课题。“回归”一词是英国统计学家F.Galton在研究父亲身高和他们成年儿子身高关系时提出的。从大量的父亲身高和其成年儿了身高数据的散布图中,F.Galton天才地发现了一条贯穿其中的直线,它能描述父亲身高和其成年儿子身高之间的关系,并可用
2、于预测某身高父亲其成年儿子的平均身高。他的研究发现,如果父亲的身高很高,那么他的成年儿子也会较高,但不会有他父亲那么高;如果父亲的身高很矮,那么他的成年儿子也会较矮,但不会像他父亲那么矮。他们会趋向于子辈身高的平均值。F.Galton将这种现象称为回归,将那条贯穿于数据点中的线称为“回归线”。后来,人们借用“回归”这个名词将研究事物之这间统计关系的数量分析方法称为回归分析。,9.2 线性回归分析,一元线性回归多元线性回归,9.2.1 一元线性回归,一元线性回归是只有一个解释变量的线性回归模型,用于提示被解释变量与另一个间的线性关系。现实社会经济现象中,某一事物总会受到多方面因素的影响。一元线性
3、回归分析是在不考虑其他影响因素或在认为其他影响因素确定的条件下,分析一个解释变量是如何影响被解释变量的,因而是比较理想化的分析。,9.2.2 多元线性回归,研究在线性相关条件下,两个或两个以上自变量对一个因变量的数量变化关系,称为多元线性回归分析,表现这一数量关系的数学公式,称为多元线性回归模型。多元线性回归模型是一元线性回归模型的扩展,其基本原理与一元线性回归模型类似,只是在计算上更为复杂,需借助计算机来完成。,9.3 线性回归分析应用实例,一元线性回归分析实例 多元线性回归分析实例,9.3.1 一元线性回归实例,本例将使用一元线性回归分析研究某厂生产的橡皮的韧性和拉伸倍数是否存在着显著的线
4、性关系。,9.3.2 多元线性回归实例,某厂在一次选举活动前,对该厂的10名高级干部进行心理素质调查,希望用多元线性回归分析来观测其效果。,9.4 非线性回归分析,非线性回归分析概念非线性回归分析的计算公式非线性回归分析应用实例,非线性回归分析主要研究在非线性相关条件下,自变量对因变量的数量变化关系。在实际问题中,变量之间的相关关系往往不是线性的,而是非线性的,因而不能用线性回归方程来描述它们之间的相关关系,而要采用适当的非线性回归分析。非线性回归问题大多数年可以化为线性回归问题来求解,也就是通过对非线性回归模型进行适当的变量变换,使其化为线性模型来求解。一般步骤为:(1)根据经验或绘制散点图
5、,选择适当的非线性回归方程;(2)通过变量转换,把非线性回归方程化为线性回归;(3)对各系数进行显著性检验。,9.4.1 非线性回归分析概念,9.4.2 非线性回归分析的计算公式,在本节中介绍几种常见的非线性回归模型,其计算公式如下:,1双曲线模型,若因变量 随自变量 的增加而增加(或减少),最初增加或减少很快,以后逐渐放慢并趋于稳定,则可以选用双曲线来拟合。,幂函数模型的一般形式为:,2.幂函数模型,幂函数模型的一般形式为:,3.指数函数模型,对数函数模型是指函数的反函数,其方程形式为:,4.对数函数模型,多项式模型在非线性回归分析中占有重要的地位。因为根据级数展开的原理,任,5.多项式模型
6、,曲线、曲面、超曲面的问题,在一定的范围内都能够用多项式任意逼近。所以,当因变量与自变量之间的关系未知时,可以用适当幂次的多项式来近似反映。当所涉及的自变量只有一个时,所采用的多项式方程称为一元多项式,其一般形式为:,9.4.3 非线性回归分析应用实例,本例将使用非线性回归分析方法研究民用空调总量与国内生产总值的关系。,9.5 曲线估计,曲线估计概述曲线估计的计算公式 曲线估计应用实例,在一元回归分析中,一般先绘制自变量和因变量间的散点图,然后通过数据在散点图中的分布特点选择所要进行回归分析的类型,是使用线性回归分析还是某种非线性的回归分析。然而,在实际问题中,用户往往不能确定究竟该选择何种函
7、数模型更接近样本数据,这时可以采用曲线估计的方法。,9.5.1 曲线估计概述,9.5.2 曲线估计的计算公式,SPSS中,曲线估计模型主要有以下几种:,1Linear模型,Linear模型又叫做一元线性,其公式如下:,Compound模型又叫做复合函数,其公式如下:,3.Compound模型,Growth模型又叫做生长函数,其公式如下:,4.Growth模型,Logarithmic模型又叫做对数函数,其公式如下:,5.Logarithmic模型,Quadratic模型又叫做二次函数,其公式如下:,2.Quadratic模型,S:S形曲线模型的公式如下:,7.S:S形曲线模型,Exponenti
8、al模型又叫做指数函数,其公式如下:,8.Exponential模型,Inverse模型又叫做逆函数,其公式如下:,9.Inverse模型,Cubic模型又叫做三次函数,其公式如下:,6.Cubic模型,Logistic模型又叫做逻辑函数,其公式如下:,11.Logistic模型,Power模型又叫做幂函数,其公式如下:,10.Power模型,9.5.3 曲线估计应用实例,本例将使用曲线估计来研究某公司在10年中总收入与支出之间的关系。,9.6 时间序列的曲线估计,时间序列的曲线估计是分析社会和经济现象中经常用到的一种曲线估计。通常把时间设为自变量x,代表具体的经济或社会现象的变量设为因变量y
9、,研究变量x与y之间关系的方法就是时间序列曲线估计。其具体步骤与一般的曲线估计基本类似。,9.7 含虚拟自变量的回归分析,含虚拟自变量的回归分析概念含虚拟自变量的回归分析计算公式应用实例,本章前面几节介绍的回归模型是可以直接用数字计量的,即可以获得其实际观测值。而在实际问题的研究中,经常会碰到一些非数量型的变量,如,民族、职业等定性变量。在建立一个实际问题的回归方程时,经常需要考虑这些定性变量。在回归分析中,对一些自变量是定性变量的先作数量化处理,处理的方法是引进只取“0”和“1”两个值的0-1型虚拟自变量。当某一属性出现时,虚拟变量取值为“1”,否则为“0”。如果在回归模型中需要引入多个0-
10、1型虚拟变量 时,虚拟变量的个数应按下列原则来确定:对于包含一个具有k种特征或状态的质因素的回归模型,如果回归模型不带常数项,则需引入 个0-1型虚拟变量;如果有常数项,则只需引入-1个模型虚拟变量。当=2时,只需要引入一个0-1型虚拟变量。,9.7.1 含虚拟自变量的回归分析概念,9.7.2 含虚拟自变量的回归分析计算公式,1自变量中只含一个定性变量,且该变量只有两种特征 2自变量中含多个定性变量,含虚拟自变量的回归分析的计算公式可分成以下两种类型:,9.7.3 应用实例,本例将使用含虚拟自变量的回归分析研究保险公司的革新速度与公司的规模及公司项目所分的类型之间的关系。,9.8 逻辑回归分析
11、,逻辑回归分析概念逻辑回归分析应用实例,在许多实际问题中,会经常出现因变量是定性变量的情况。如,买汽车会受到如家庭、收入等因素的影响,但最终的可能性只能两个,要么买,要么不买。把y=1定义为购买,y=0则表示不购买。可见,在现实因变量的结果只取两种可能情况的应用很广泛。可用于处理定性因变量的统计分析方法有判别分析、Probit分析、Logistic回归分析和对数线性模型等。,9.8.1 逻辑回归分析概念,9.8.2 逻辑回归分析实例,本例通过调查某城市中居民上、下班使用的交通主要分为坐公共汽车和骑电动车两类通过对这些居民的年龄、月收入和性别进行调查,要求使用逻辑回归分析方法建立因变量 与自变量间的Logistic回归。,