成对数据的统计分析 第5课时 一元线性回归模型及其应用.docx

上传人:夺命阿水 文档编号:266253 上传时间:2023-04-07 格式:DOCX 页数:16 大小:97KB
返回 下载 相关 举报
成对数据的统计分析 第5课时 一元线性回归模型及其应用.docx_第1页
第1页 / 共16页
成对数据的统计分析 第5课时 一元线性回归模型及其应用.docx_第2页
第2页 / 共16页
成对数据的统计分析 第5课时 一元线性回归模型及其应用.docx_第3页
第3页 / 共16页
成对数据的统计分析 第5课时 一元线性回归模型及其应用.docx_第4页
第4页 / 共16页
成对数据的统计分析 第5课时 一元线性回归模型及其应用.docx_第5页
第5页 / 共16页
点击查看更多>>
资源描述

《成对数据的统计分析 第5课时 一元线性回归模型及其应用.docx》由会员分享,可在线阅读,更多相关《成对数据的统计分析 第5课时 一元线性回归模型及其应用.docx(16页珍藏版)》请在课桌文档上搜索。

1、8.2一元线性回归模型及其应用(3课时,单元教学设计)第一课时刘谦(安徽省淮南第一中学)第二、三课时石伟伟(安徽省寿县第二中学)1单元内容与内容解析1.1内容一元线性回归模型,一元线性回归模型参数的最小二乘估计.第一课时:一元线性回归模型.第二课时:一元线性回归模型参数的最小二乘估计.第三课时:一元线性回归模型的应用.1.2内容解析一元线性回归模型是描述两个随机变量之间相关关系的最简单的回归模型.当两个变量具有显著的线性相关关系时,可以建立一元线性回归模型来刻画两个变量间的随机关系,并通过模型进行预测.建立一元线性回归模型的基础是对成对样本数据进行相关性分析.通过散点图,直观观察相关关系的类型

2、、方向和强弱;构造相关系数,定量刻画两个变量相关的正负性和线性相关关系的密切程度.在此基础上,建立一元线性回归模型,使用最小二乘法估计参数,得到经验回归方程,进行预测.为了评价和改进模型,引入残差和残差图,以及决定系数R2对模型进行诊断,使其不断完善,帮助决策.一元线性回归模型是统计学中一种最基础且重要的模型,许多回归模型都是以一元线性回归模型为基础进行研究.其涉及的统计模型的思想、最小二乘思想、方差分析思想(构造统计量,评价回归拟合效果)在统计学中占有重要的地位.在一元线性回归模型的建立和应用过程中,通过创建回归方程、估计模型参数、分析模型有效性、将非线性回归模型转化为线性回归模型等内容的学

3、习,使学生亲力亲为、参与其中,体会统计的思想,理解统计的概念,了解统计分析的一般方法,积累数据分析的经验,增强应用意识.让学生感悟到根据实际情况进行科学决策的必要性和可能性,体会统计思维与确定性思维的差异、归纳推理与演绎证明的差异,夯实“四基”,提高“四能”,全面培养学生的数据分析、数学建模、逻辑推理、数学抽象、数学运算等数学核心素养.基于以上分析,确定本单元的教学重点:(1)一元线性回归模型的意义;(2)用最小二乘法估计回归模型参数的方法;(3)残差分析和决定系数R2的意义;(4)一元线性回归模型的应用.2单元目标与目标解析2.1目标(I)结合具体事例,了解一元线性回归模型的含义,了解模型参

4、数的统计意义,了解最小二乘原理.(2)掌握一元线性回归模型参数的最小二乘估计方法,会使用相关的统计软件进行数据分析.(3)掌握残差分析的方法,理解决定系数R2的意义.(4)针对实际问题,会用一元线性回归模型进行预测.2.2目标解析达成上述Rl标的标志是:(1)知道线性回归模型与函数模型的区别,知道线性回归模型中误差e满足E(e)=O,D(e)=2的理由.(2)能依据使用距离来刻画接近程度的数学方法了解最小二乘原理,并利用该原理推导参数估计值的计算公式.(3)会使用统计软件绘制散点图,计算样本相关系数、求回归方程,能用残差、残差图和决定系数R2对回归模型进行评价等.(4)通过具体案例,理解利用一

5、元线性回归模型可以刻画随机变量之间的线性相关关系,在建立一元线性回归模型解决实际问题的过程中,提升数据分析、数学建模、逻辑推理等素养.3单元教学问题诊断分析“一元线性回归模型及其应用”与“成对数据的统计相关性”一样,都是关于定量变量进行的研究.在前一节“成对数据的统计相关性”的学习中,主要介绍了散点图和相关系数,侧重于考查变量之间相关的形态和程度,而“一元线性回归模型及其应用”侧重于考查变量之间的数量关系,展示变量之间的具体形态.因此,可以看作是在前一节基础上的进一步深入刻画.为了揭示这种数量关系,在第一节里引入回归模型这一概念,教学时要注意与函数模型的区别,体会统计思维和确定性思维的差异,这

6、也是由于统计学的学科特点决定的.统计学是建立在数据的基础上,通过演绎方式,对随机现象进行研究的科学.许多样本数据带有随机性,因此,在构建模型时,特地设置了随机误差项e,反映未列入方程的其它各种因素对y的影响,并对其均值和方差做了要求.学生们在学习随机误差时可能会存在理解困难.在第二节里,介绍了利用最小二乘原理寻求最佳拟合直线的方法,让学生体会其蕴含的最小二乘思想,认识到最小二乘法是统计分析中一种常用的数据处理方法.利用该方法对模型的参数做出估计时,学生们容易误将参数的估计值当作模型的参数,对参数的意义理解不够准确,这是由于对样本的随机性了解不够造成的.教学设计时专门设置解惑环节,消除障碍,深化

7、理解.基于以上分析,确定本单元的教学难点:(1)对随机误差的理解;(2)最小二乘的原理和方法;参数的意义及参数估计公式的推导;(4)残差变量的解释与分析;(5)模型的应用以及优度的判断.4单元教学支持条件分析一元线性回归模型主要研究两个随机变量的线性相关关系,通过成对样本数据建立模型,寻找数据背后隐藏的规律.在教学时,由于需要处理大量数据,涉及画散点图、求回归方程、画回归直线、计算残差和决定系数R2以及数据变换等等,计算量大.课标(2017年版)里明确要求“会使用相关的统计软件”.因此,在本单元教学中,需要使用GeoGebra.ExceL图形计算器等统计软件帮助处理数据.利用信息技术工具辅助教

8、学,不仅仅是教学的需要,也是现如今大数据时代,对于每个受教育者掌握必备的信息技术提出的要求.借助大数据的东风,创建信息技术高效课堂.7课时教学设计3第三课时7.1 教学内容一元线性回归模型的应用.7.2 教学目标(1)能通过具体事例说明一元线性回归模型修改的依据与方法.(2)通过对具体问题的进一步分析,能将某些非线性回归问题转化为线性回归问题并加以解决,提高数学运算能力.(3)能通过事例说明R2的意义和作用,提高数据分析能力.7.3 教学重点与难点教学重点:一元线性回归模型的修改,将非线性回归问题转化为线性回归问题,决定系数R2的意义和作用.教学难点:运用适当的变换将非线性相关问题转化为线性相

9、关问题,用决定系数R2判断模型的优度.7.4 教学过程设计7.4.1复习回顾引导语:上一节课我们一起学习了一元线性回归模型参数的最小二乘估计,学会使用数学的方法一一距离,来刻画点与直线的接近程度,体会最小二乘原理,掌握一元线性回归模型的最小二乘估计方法,能推导出回归模型中参数的估计值公式.我们还学习了残差和残差图,借助残差分析,对模型进行评价.下面我们再通过一道例题,复习回顾解决线性回归问题的具体流程.例1.经验表明,对于同一树种,一般树的胸径(树的主干在地面以上1.3m处的直径)越大,树就越高.由于测量树高比测量胸径困难,因此研究人员希望由胸径预测树高.在研究树高与胸径之间的关系时,某林场收

10、集了某种树的一些数据如下表所示,试根据这些数据建立树高关于胸径的经验回归方程.表1编号123456胸径/cm18.120.122.224.426.028.3树高/m18.819.221.021.022.122.1编号789101112胸径/cm29.632.433.735.738.340.2树高/m22.422.623.024.323.924.7师生活动:教师让学生上讲台,合作演示使用GeOGebra统计软件,自主解决问题的全过程,必要时教师加以适当的引导.其余学生通过师生互动平台观摩、学习他们的学习成果,总结、归纳使用GeoGebra统计软件,解决线性回归问题的一般步骤,具体如下:(1)确定

11、研究对象,明确哪个变量是解释变量,哪个变量是响应变量.(2)画出解释变量与响应变量的散点图,观察它们之间的关系(如是否存在线性关系等).(3)根据散点图及相关系数,结合经验,确定经验回归方程的类型.(4)按一定规则(如最小二乘法)估计经验回归方程中的参数,建立经验回归方程.(5)对结果进行残差分析.操作方法如下:(1)在GeoGebra表格区的B、C两列分别输入树的胸径和数高的观测数据.(为方便讲解,设置A列为样本数据的编号,第一行为相关数据的表示说明)(2)鼠标左键同时选中B、C两列,点击工具栏中的第2个图标的倒三角下拉标志,选择“双变量回归分析”,出现“数据源”的对话框,点击“分析”,出现

12、“数据分析”区,位于“散点图”一栏下,出现了成对样本数据的散点图.观察散点图,发现散点大致分布在一条从左下角到右上角的直线附近,表明两个变量具有线性相关关系,并且是正相关,可以使用线性回归方程来近似刻画二者之间的关系.接下来继续操作软件,点击“数据分析”区工具栏的,在弹出的对话框里可以看到相关系数为0.9657,说明两个变量的相关性很强,可以建立一元线性回归模型来刻画树高与胸径之间的关系.图1(3)点击“数据分析”区的“回归模型”下方的倒三角下拉标志,选择“线性”.右边界面会弹出根据最小二乘法计算得到的经验回归方程y=Q2493x+14.8402.若以表示胸径,力表示树高,贝IJ人=0.249

13、3d+14.8402.图2(4)在表格区可以根据经验回归方程,计算出树高的预测值和相应的残差.具体操作方法:点击Q2表格,输入“=0.2493*及+14.8402”,点击“Enter”键,出现计算结果”19.35”,这是第一组样本数据对应树高的预测值.利用GeoGebra软件自带的表格计算功能,把光标移动到02单元格的右下角,当光标呈现细十字架时,按住鼠标左键下拉,依次得到其余各组数据对应树高的预测值.利用同样的方法,在硬单元格里输入“=C2-。2”,然后下拉填充,求得12个残差值,从残差表中,可以看到残差在T).65,0.78内,有6个正数,6个负数.残差表明随机误差符合一元线性回归模型的假

14、设.o*!图3(5)在“数据分析区”,选择“残差图”,便可得到残差图.由图可知,残差点比较均匀地分布在以横轴为对称轴、宽度小于2m的带状区域内,说明经验回归方程6=0.2493c/+14.8402能够较好地刻画树高与胸径之间的关系.因此,可以根据经验回归方程0=0.24934+14.8402,由树的胸径预测树高.图4问题:请同学们总结解决线性回归问题的具体流程和一般步骤:设计意图:通过复习回顾,检查学生对一元线性回归模型掌握的情况,并由此总结归纳求解经验回归方程的一般步骤.同时,了解学生使用统计软件的情况,培养学生使用信息技术的意识和初步能力,贯彻课标(2017年版)“会使用相关的统计软件”的

15、要求.统计的核心就是数据分析,让学生体会到使用统计工具可以大大提高处理数据的效率.当数据的处理不再是一个困难时,学生主动使用所学的统计方法去解决实际问题才成为可能.7. 4.2案例分析引导语:在例题1里,我们根据树高与胸径两个变量之间的线性关系,建立了一元线性回归模型进行有效预测,帮助决策.但是在实际问题中,两个变量之间的依赖关系并不总是以线性的形式表现出来,可能是非线性的,比如指数相关或对数相关等非线性相关关系,那么就需要我们对建立的模型进行诊断和改进,使其能够更好地反映两个变量间的真实关系.统计学的基本任务就是建立拟合效果更好的模型,来反映真实情境下的变量关系.但是在现实世界中,通常情况下

16、,虽然两个变量的真实模型是客观存在的,我们也并不知道真实模型具体是什么,只能根据问题背景和已掌握的知识建立模型,来近似于这个真实的模型.接下来,我们将通过一道例题,借助于一元线性回归模型研究非线性相关的两个变量间的关系,探究寻找近似效果更好的模型的全过程.例2.人们常将男子短跑IOOm的高水平运动员称为“百米飞人”.下表给出了1968年之前男子短跑IOOm世界纪录产生的年份和世界纪录的数据.试依据这些成对数据,建立男子短跑IOOnI世界纪录关于纪录产生年份的经验回归方程.表212345678年份18961912192119301936195619601968记录/S11.8010.6010.4

17、010.3010.2010.1010.009.95师生活动:教师指导学生按照例题1建立经验回归方程的步骤求解.(1)分析实际背景,确定解释变量和响应变量.由于研究问题是男子百米的世界纪录与纪录产生的年份之间的关系,年份不能完全确定世界纪录,世界纪录的产生可能还受到气候、风向等其他因素的影响.因此,确定将年份作为解释变量,世界纪录作为响应变量.(2)在成对数据中,以世界纪录产生年份为横坐标,世界纪录为纵坐标,绘制散点图,并计算样本相关系数.根据散点图和相关系数,判断是否可以建立一元线性回归模型刻画年份与世界记录之间的关系,即能否可以用线性经验回归方程刻画二者之间的关系.使用GeOGebm软件,画

18、出散点图,并计算出相关系数r=-0.8559.观察散点图,发现各散点大致分布在一条从左上角到右下角的直线附近(除了第一个点位置比较特殊),表明两个变量是递减的关系,似乎可用一元线性回归模型建立经验回归方程.图5(3)用Y表示男子短跑IoOm的世界纪录,表示纪录产生的年份,建立一元线性回归模型=加+。+内刻画两个变量之间的关系.E(e)=0,D(e)=2使用GeOGebra软件,根据最小二乘原理,计算表中数据,得到经验回归方程为:y=-0.02034/+49.76913并在散点图中,画出回归直线.图6设计意图:通过具体案例,巩固求解经验回归方程具体步骤,为接下来发现回归分析中的问题,对模型进行修

19、改,寻找近似效果更好的模型做准备.【课堂探究】问题L从图中可以看到,经验回归方程较好地刻画了散点的变化趋势,请再仔细观察图形,你能看出其中存在的问题吗?师生活动:教师引导学生从两方面进行讨论,分析线性回归方程的不足之处:1 .围绕拟合精度与模型选择的贴合性.从几何直观层面解释,让学生主动观察各散点与直线的位置关系,会发现各散点更为精细的分布特征.例如,笫一个世界纪录所对应的散点远离经验回归直线,并且前后两个时间段中的散点都在经验回归直线的上方,中间时间段的散点都在经验回归直线的下方.这说明散点并不是随机分布在经验回归直线的周围,而是围绕着经验回归直线有一定的变化规律,即成对样本数据呈现出明显的

20、非线性相关的特征.2 .从回归模型的实际意义考虑.由经验回归方程X=-0.02034,+49.76913可知,男子百米的世界纪录随着时间的增大而线性递减.教师使用GeoGebra软件,计算当时间t=2500时,得到男子百米世界纪录y=-1.074440.7325,因此经验回归方程的刻画效果比经验回归方程的好很多.说明:在一元线性回归模型中,R2=r2t即决定系数R2等于样本相关系数/平方.设计意图:向学生介绍三种模型诊断的方法,第一种是定性的方法,残差图比较直观,但是不够精确,后两种是定量的方法,构建统计指标,对模型刻画数据的效果进行比较.方法二,较方法三而言比较方便,但是受样本容量n的影响,

21、须在同一量纲下进行比较才有意义.方法三R2是在实践中被广泛使用的一种统计量.它摆脱了量纲的影响,可以用来判断不同模型对原始数据拟合效果的好坏,是回归模型进行有效性检验的一个重要指标.师生活动:教师带领学生回顾解决非线性回归问题的过程,指出至关重要的一步一一依据样本点的分布,选择合适的曲线方程进行拟合.教师向学生讲解几种常见的非线性经验回归方程的转化方法,如下表所示.表3曲线方程变换公式变换后的线性关系式JJaX*c-lntft*-lnxtu-lnyrc+ftvF=etoc-lntftTnjw-cx11iLhI0,V,Ir-IlIFXuc+bv-lnxya+bv-+ftxV-、-+6v教师点拨:

22、对于非线性经验回归问题,可以画出已知数据的散点图,把它与学过的各种函数(耗函数、对数函数、指数函数等)的图像作比较,挑选一种跟这些散点拟合得最好的函数,然后采用适当的变量变换,将非线性回归问题转化为线性回归方程问题来解决.设计意图:总结可线性化的回归方程类型,通过变量代换,掌握将非线性回归问题转化为线性回归问题的方法,提高学生的运算能力.7.4.3课堂训练,巩固新知由于钢水对耐火材料的侵蚀作用,炼钢厂出钢时所用的盛钢水的钢包,随着使用次数的增加,容积不断增大,实测得到15组数据如表所示使用次数x/次23456789增大容积ym36.708.209.589.509.7010.OO9.969.99

23、使用次数x/次10111213141516增大容积ym310.49105910.6010.8010.6010.9010.76试根据散点图建立两种回归方程,并判断那种回归方程具有更好的拟合效果。师生活动:让学生用GeOGebra软件解决,老师相机完善,经历一元线性回归模型的应用的全过程.设计意图:通过散点图选择不同模型对数据进行拟合,选择效果最佳的模型作为回归曲线,综合评价学生对一元线性回归分析的掌握程度,同时提升学生的数学建模意识和数据分析能力.7.4.4归纳小结,反思提升通过本节课的学习,你有哪些收获?(请从知识、获得过程、思想方法等方面谈一谈你的感受和体会)(1)使用经验回归回归方程进行预

24、测时,需要注意哪些问题?(2)如何将非线性回归问题转化为线性回归问题?基本步骤有哪些?使用什么方法?(3)在回归分析中,残差分析有必要吗?如何判断回归模型的有效性?师生活动:教师引导学生梳理、总结本节课所学的内容.对于问题(1),注意以下几点:回归方程只适用于所研究的样本的总体.经验回归方程一般都有实效性.解释变量的取值不能离样本数据的范围太远.一般解释变量的取值在样本数据范围内,经验回归方程的预报效果会比较好,超出这个范围越远,预报的效果越差.不能期望经验回归方程得到的预报值就是响应变量的精确值.事实上,它是响应变量的可能取值的平均值.对于问题(2),基本步骤:明确解释变量和响应变量,绘制散

25、点图.根据样本点的分布,结合专业知识,确定非线性经验回归方程的类型(可同时选取几类).作曲线直线化变换,即通过变量代换,将非线性回归方程转化为线性回归方程.计算经验回归系数,得到线性经验回归方程.将变量还原,得到非线性经验回归方程.分析残差图,比较决定系数A2,选取“最佳”曲线方程,构建非线性回归模型.使用的方法是变量代换,渗透着转化与化归的思想.(3)有必要.通过残差和残差图直接观察,或者比较残差平方和的大小、决定系数尸与1的接近程度,都可以帮助我们判断回归模型的拟合效果.设计意图:通过系统回顾本课所学的主要知识,让学生掌握将非线性回归问题转化为线性回归问题的一般方法和基本步骤,提高学生分析

26、、解决实际问题的能力,强化实践意识,全面提升学生的数学建模、数据分析、数学运算、数学抽象等数学核心素养.7.4.5布置作业,应用迁移必做题:教科书P120练习第1,2题选做题:校本资料习题8.2第5,6题设计意图:分层作业,因材施教,体现差异,巩固知识,促进发展.7.5目标检测设计1.5G网络是指第五代移动网络通讯技术,它的主要特点是传输速度快,峰值传输速度可达每秒钟数十G总作为新一代移动通讯技术,它将要支持的设备远不止智能手机,而是会扩展到未来的智能家居,智能穿戴等设备.某科技创新公司基于领先技术的支持,经济收入在短期内逐月攀升,该公司1月份至6月份的经济收入(单位:万元)关于月份的数据如下

27、表所示:月份X123456收入y611233772124(1)试绘制散点图,建立三种不同形式的回归方程,并根据心值判断哪一个更适合作为经济收入关于月份的回归方程类型.(2)预测该公司7月份的经济收入.解:(1)以月份X为横坐标,经济收入)为纵坐标,绘制散点图.,收入如20(x8(6040202468月份根据散点图,我们可以选择三种函数模型:y=bx+aly=axhy=aebx均为常数)如果认为散点是集中在直线y=bx+a附近,那么根据一元线性回归模型及最小二乘法,得到经验回归方程为y=22.4857%33.2,计算Q1=(ef)21345.3714R;).868J-I如果认为散点是集中在曲线y

28、=a?附近,那么利用变量代换,得到非线性经验回归方程为y=452967,计算2=(3i1307.24648.8718如果认为散点是集中在曲线),=讹床附近,那么利用变量代换,得到非线性经验回归方程为y=336eax,计算Qi=t(el),31.5396R;).9969r=通过比较,显然第三个经验回归方程是最优模型.(3)当X=7时,=336e06,x7236.1035.预测该公司7月份的经济收入约为236.1035万元.2.汽车轮胎凹槽深度是影响汽车刹车的因素,汽车行驶会导致轮胎胎面磨损.某实验室通过实验,测得行驶里程与某品牌轮胎凹槽深度的9组数据如下表所示.行驶里程/万km0.000.641.291.932.573.223.864.515.51轮胎凹槽深度mm10.028.377.396.485.825.204.554.163.82试根据散点图建立两种回归方程,并判断哪种回归方程具有更好的拟合效果.设计意图:考察学生将某些非线性的问题转化为线性问题的方法掌握的情况,以及利用散点图直观判断和利用决定系数R2,判断两种不同的回归方程对原始数据拟合效果的理解情况.

展开阅读全文
相关资源
猜你喜欢
相关搜索
资源标签

当前位置:首页 > 在线阅读 > 生活休闲


备案号:宁ICP备20000045号-1

经营许可证:宁B2-20210002

宁公网安备 64010402000986号