统计学第三章.ppt

上传人:夺命阿水 文档编号:259942 上传时间:2023-03-31 格式:PPT 页数:70 大小:1.19MB
返回 下载 相关 举报
统计学第三章.ppt_第1页
第1页 / 共70页
统计学第三章.ppt_第2页
第2页 / 共70页
统计学第三章.ppt_第3页
第3页 / 共70页
统计学第三章.ppt_第4页
第4页 / 共70页
统计学第三章.ppt_第5页
第5页 / 共70页
点击查看更多>>
资源描述

《统计学第三章.ppt》由会员分享,可在线阅读,更多相关《统计学第三章.ppt(70页珍藏版)》请在课桌文档上搜索。

1、第三章 统计整理,第一节 统计整理的意义和方法第二节 统计分组第三节 频数分布第四节 数据显示,第一节 统计整理的意义和方法,一、统计整理的意义二、统计整理的内容与程序,一、统计整理的意义,统计整理是统计工作的中间环节,是统计调查的继续和发展,是统计分析的前提和条件,在整个统计工作过程中起承上启下的作用。,二、统计整理的内容与程序,1、统计数据整理的内容2、数据整理的程序1)统计资料的审核。2)资料的分组和汇总。分组,即对资料按其性质和特点,划分为若干类;汇总,加总计算形成各项统计指标。统计分组和统计指标是整理的中心工作。3)编制统计表或绘制统计图。4)统计资料的积累、保管和公布。,第二节统计

2、分组,一、统计分组的概念和原则,1、概念2、原则穷尽原则:使总体中的每一个单位都应有组可归,或者说各分组的空间足以容纳总体所有的单位。互斥原则:在特定的分组标志下,总体中的任何一个单位的只能归属于某一组,而不能同时或可能归属于几个组。,二、统计分组的意义,1、划分现象类型,例:按所有制性质划分,我国工业企业可分为:国有企业;集体企业;个体企业;合资企业;外资企业。,2、研究总体结构,例:某市按GDP计算的三次产业结构(%),例 40户居民家庭按月收入分组,3、研究现象之间的依存关系,三、统计分组的种类,1、按分组标志的多少,可分为简单分组和复合分组。简单分组:就是对研究现象按一个标志进行分组。

3、复合分组:用两个或两个以上标志分组,即先按一个标志分组,在此基础上再按第二个标志分小组,又再层叠地按第三个标志分成更小的组,这称为复合分组。,简单分组和复合分组,例:某地区1997年底各类工业企业数,例:某班学生分组表,例:某班学生分组表,例:某地区1997年底各类工业企业及规模构成情况,(接上),2、按分组的标志的性质不同,分为品质分组(或称属性分组)和数量分组(或称变量分组)。品质分组:按品质(或属性)标志进行分组。品质分组所形成的数列称为品质数列。数量分组:按数量标志分组,数量标志的变异性体现在它不断变动自身的数量上,故也称为变量分组。变量分组所形成的数列称为变量数列。,3、按分组的作用

4、和任务不同,分为类型分组、结构分组和分析分组。类型分组:把复杂的现象总体,划分为若干个不同性质的部分,就是类型分组。结构分组:在对总体分组的基础上计算出各组对总体的比重,借此研究总体各部分的结构,即结构分组。分析分组:为研究现象之间依存关系而进行的统计分组即分析分组。,四、统计分组方法,(一)品质分组的方法(二)变量分组的方法,(一)品质分组的方法,品质分组一般较简单,分组标志一旦确定,组数、组名、组与组之间的界限也就确定。但也有较难的情况,需经专门的研究才能确定。有些复杂的品质标志分组可根据统一规定的划分标准和分类目录进行。,(二)变量分组的方法,1、单项式分组与组距式分组,单项式分组将一个

5、变量值作为一组适合于对变量值较少的离散变量的分组举例:居民家庭按儿童数或人口数分组,组距式分组,将变量值的一个区间作为一组适合于变量值变动大、项数又较多的离散变量。如分数。适合于连续变量。如身高。可采用等距分组,也可采用不等距分组,2、间断组距式分组和连续组距式分组,间断组距式分组:组限不相连的组距式分组。如儿童按年龄分组。连续组距式分组:组限相连(或称相重叠的),即以同一数值作为相邻两组的共同界限的组距式分组。如学生按成绩分组。下限,上限:组距式分组的每一组变量值中,其最小值为下限,最大值为上限。组距:上下限之间的距离。组限:相邻两组的界限。离散型变量,可间断组距式分组,也可连续组距式分组。

6、连续型变量,只能采用连续组距式分组。“上限在不内”原则:在连续组距式分组中,以同一个数值作为相邻两组共同的界限,统计上规定,凡是总体某一个单位的变量值是相邻两组的界限值,这一个单位归入作为下限值的那一组内。,3等距分组和不等距分组,等距分组是各组保持相等的组距,也就是说各组标志值的变动都限于相同的范围。一般用于标志值变动比较均匀的场合。如工人工资、年龄。不等距分组即各组组距不相等的分组。适用于标志值分布很不均匀,标志值相等的量具有不同意义的场合和标志值按一定比例发展变化的场合。分别举例。,4组限和组中值,(1)组限、组距组距两端的数值称组限。其中,每组的起点数值称为下限,每组的终点数值称为上限

7、。上限和下限的差称组距,表示各组标志值变动的范围。1.组距连续式分组的组距计算公式:组距=本组上限本组下限间断式分组的组距计算公式:组距=本组上限本组下限+1开口组的组距:以相邻组的组距为本组的组距。,(2)组中值:上下限之间的中点数值,以代表各组标志值的一般水平。,组中值=(上限+下限)2 或者 组中值=下限+(组距2)对于第一组是“多少以下”,最后一组是“多少以上”的开口组,组中值的计算可参照邻组的组距来决定。即:缺下限开口组组中值=上限-1/2邻组组距,缺上限开口组组中值=下限+1/2邻组组距。,等距分组(上下组限重叠),等距分组(上下组限间断),等距分组(使用开口组),第三节 频数分布

8、,一、频数分布的概念1、频数分布在统计分组的基础上,将总体所有的单位按某一标志进行归类排列,并计算各组的单位数,称为频数分布,或次数分布。根据分组标志特征的不同,分布数列可分为品质(分布)数列和变量(分布)数列。2、分布数列的两个要素1)总体按某标志所分的组。2)各组所出现的单位数,即频数,亦称次数。对于变量数列,标志值形成的数列,称为变量,一般用x表示;频数(次数)用f表示。,2分布数列的类型,分布数列包括品质分布数列(简称品质数列)和变量分布数列(简称变量数列),分别由品质标志分组和数量标志分组形成。变量数列又有单项式数列和组距式数列,分别由单项式分组和组距式分组形成。,品质数列示例,例:

9、某企业职工按性别分组表,变量数列示例组距式数列,例:某小学四(1)班学生分组表,变量数列示例单项式数列,二、变量数列的编制,例:某企业100名工人每周工资资料 单位:元,(1)排序列。将原始资料按数值大小排列。,例:依前表的数据整理而成的变量序列资料,(2)确定全距(计为R),即:,式 中,,:原数列的最大值,:原数列的最小值,此例中,R650200450(元),(3)确定组数和组距,编制变量数列的关键在于确定组数。组数一经确定,组距也就随之确定。确定组数的基本原则是:1)根据现象的性质和特点确定组数。2)根据原数据的分布特征及集中趋势确定组数。3)具体操作上来说,组数既不能太多,也不能太少。

10、一般来说,组数不应少于6或大于15。,其中,:组距,:组数,=,=56.2557(元),斯特杰斯经验公式:组数=1+3.3 Lg N,(4)确定组限。,1)确定最小组的下限。有两种方法:将原始资料中的最小变量值确定为最小组的下限。将原始资料中的最小变量值确定为最小组的组中值。2)确定组限的表示方法。与组数和组距一样,组限和组中值也最好取整数。对于相邻两组的组限有两种表示方法:变量是连续型的,相邻两组的上下限可以重叠,即同一变量值可以作为相邻两组的上限和下限。变量是离散型的,相邻两组的上下限就用整数断开。,(5)归类汇总计算各组次数,所谓归类汇总,是指按照各个总体单位的具体标志值,将其划归某一具

11、体组之中,在归类汇总时,要遵循“不重复不遗漏”的基本原则。对于恰好是组限的标志值的总体单位之归类问题,一般应按“上限不在内”原则,即本组下限的次数属于本组,本组上限的次数归于邻近的较大组。计算结果可以用频数或频率表示。,例:某工业企业100名工人按每周工资额分组,三、频数与频率,统计分组后各组对应的单位数称频数,也叫次数;各组次数(频数、单位数)占总次数(总频数、总体单位总数)的比重称频率,表明各组单位数在总体中所占的比重。各组的频率大于0,所有组的频率总和等于1。为了更简便地概括总体各单位的分布特征,还需要编制累计频数数列和累计频率数列。累计有向上累计和向下累计的方法。,累计频数和累计频率,

12、1.累计频数(cumulative frequencies):各类别频数的逐级累加2.累计频率(cumulative percentages):各类别频率(百分比)的逐级累加,累计有向上累计和向下累计,1向上累计是指将各组频数和频率由变量值低的组向变量值高的组累计,表明在这些数值以下所有数值所占的比重。是各组上限以下的累计频数(频率),关心的是标志值比较小的现象的次数分布。2向下累计是指将各组频数和频率由变量值高的组向变量值低的组累计,表明在这些数值以上所有数值所占的比重。是各组下限以上的累计频数(频率),关心的是标志值比较大的现象的次数分布。,例:某工业企业100名工人按每周工资额分组,例题

13、:累计频数和累计频率,可以更简便的概括总体各单位的分布特征。,【例】在一项城市住房问题的研究中,研究人员在甲乙两个城市各抽样调查300户,其中的一个问题是:“您对您家庭目前的住房状况是否满意?1非常不满意;2不满意;3一般;4满意;5非常满意。问:哪一个城市的满意度高一些?,基尼系数 G=A/(A+B),洛伦兹曲线,频数分布的类型,钟型分布 型分布 J型分布,钟型分布,钟型分布,型分布,J型分布,第四节 数据显示,一、统计表的概念和结构(一)统计表的概念 把统计数据按一定的顺序排列在表格上,就形成了统计表。它清楚地、有条理地显示统计资料,直观地反映统计分布特征,是统计分析的一种重要工具。,(二

14、)统计表的结构,1从表式上看,统计表包括总标题、横行标题、纵栏标题和指标数值四部分。2从内容上看,统计表由主词和宾词两部分组成。,总 标 题,主词栏 宾词栏 资料来源:1994年中国统计年鉴,3编制统计表应注意的问题,统计表式设计应注意事项:(1)统计表应设计成由纵横交叉线条组成的长方形表格,长与宽之间保持适当的比例。(2)线条的绘制:表的上下端应以粗线绘制,表内纵横线以细线绘制。表格的左右两端一般不划线,采用“开口式”。(3)合计栏的设置。(4)栏数的编号。,3编制统计表应注意的问题,统计表内容设计应注意事项:(1)标题设计:以简练而又准确的文字表述统计资料的内容、资料所属的空间和时间范围。

15、(2)指标数值:统计表内的数字应用同等精度。当数字因小可略而不计时,可写上“0”。统计表中不应有空格,当表中不应有内容或可免填时,用“”表示;当缺某项数字资料时,可用符号“”表示。(3)计量单位:统计表必须注明数字资料的计量单位。当全表只有一种计量单位时,可以把它写在表头的右上方。如果表中各格的指标数值计量单位不同,可在横行标题后添一列计量单位。(4)注解或资料来源。,(二)统计表的种类,1.统计表按其作用不同,可分为调查表、整理表(或称汇总表)和分析表。2.统计表按主词的结构不同,即主词是否分组或分组情况的不同,可分为简单表、简单分组表(分组表)和复合分组表(复合表)。,(二)统计表的种类,

16、3.统计表按宾词设计不同,可分为宾词简单排列、分组平行排列和分组层叠排列等三种。,二、统计图,直方图折线图曲线图,直 方 图,1.用矩形的宽度和高度来表示频数分布的图形。2.绘制直方图时,横轴表示各组组限,纵轴表示次数(一般标在左方)和比率(或频率,一般标在右方)。,直 方 图,我一眼就看出来了,销售量在170180台之间的天数最多!,折线图,1.折线图也称频数多边形图2.是在直方图的基础上,把直方图顶部的中点(组中值)用直线连接起来,再把原来的直方图抹掉3.折线图的两个终点要与横轴相交,具体的做法是第一个矩形的顶部中点通过竖边中点(即该组频数一半的位置)连接到横轴,最后一个矩形顶部中点与其竖边中点连接到横轴,折线图,曲线图,当所分的组数很多时,组距会越来越小,这时所绘制的折线图就会越来越光滑,逐渐形成一条平滑的曲线,这就是频数分布曲线图。,

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 在线阅读 > 生活休闲


备案号:宁ICP备20000045号-1

经营许可证:宁B2-20210002

宁公网安备 64010402000986号