数据统计与分析.ppt

上传人:夺命阿水 文档编号:250716 上传时间:2023-03-27 格式:PPT 页数:77 大小:2.62MB
返回 下载 相关 举报
数据统计与分析.ppt_第1页
第1页 / 共77页
数据统计与分析.ppt_第2页
第2页 / 共77页
数据统计与分析.ppt_第3页
第3页 / 共77页
数据统计与分析.ppt_第4页
第4页 / 共77页
数据统计与分析.ppt_第5页
第5页 / 共77页
点击查看更多>>
资源描述

《数据统计与分析.ppt》由会员分享,可在线阅读,更多相关《数据统计与分析.ppt(77页珍藏版)》请在课桌文档上搜索。

1、数据统计与分析,统计学的定义:,是研究如何收集、整理、分析数据的一门科学。寻找、预测、确定随机现象中所呈现的统计规律。被称为数字的科学。,1、搜集数据;2、整理数据分组、统计表、统计图、综合指标等;3、统计分析运用统计方法及分析对象的有关知识,从定量与定性的结合上进行研究。统计分析可以把数据、情况、问题、建议等融为一体。是发挥统计的信息、咨询、管理、监督和决策功能的重要内容。,统计工作的步骤,第一章 统计方法,一、什么是统计方法二、统计方法的性质三、统计方法的用途四、统计方法的作用五、统计方法应用的基本条件,一、什么是统计方法,统计方法:是指有关收集、整理、分析和解释统计数据,并对其所反映的问

2、题作出一定结论的方法。,统计描述:是对统计数据进行整理和描述的方法;常用曲线、表格、图形等反映统计数据和描述观测结果,以使数据更加容易理解,例如,可将统计数据整理成折线图、曲线图和频数直方图等。,统计推断:通过对数据的分析和统计运算所得到的特性值,对事物的状态和发展趋势进行预测和推断。又称归纳统计法。,统计控制:通过对数据的整理、分析和统计计算所得到的结果,评价事物状态、监测变异,从而保持控制过程处于稳定的状态。,二、统计方法的性质,1.描述性利用统计方法对统计数据进行整理和描述,以便展示统计数据的的规律;统计数据可用数量值加以度量,如平均数、中位数、级差和标准差等,亦可用统计图表予以显示,如

3、条形图、折线图、圆形图、频数直方图、频数曲线等。,2.推断性统计方法都要通过详细研究样本来达到了解、推测总体状况的目的,因此它具有由局部推断整体的性质。,3.风险性统计方法既然要推断用部分整体,那么这种由推断而得出的结论就不会是百分之百正确,即可能有错误。犯错误就要担风险。,三、统计方法的用途,1.提供表示事物特征的数据;(平均值、中位数、标准偏差、方差、极差)2.比较两事物的差异;(假设检验、显著性检验、方差分析、水平对比法)3.分析影响事物变化的因素;(因果图、调查表、散布图、分层法、树图、方差分析)4.分析事物之间的相互关系;(散布图、试验设计法)5.研究取样和试验方法,确定合理的试验方

4、案;(抽样方法、抽样检验、试验设计、可靠性试验)6.发现质量问题,分析和掌握质量数据的分布状况和动态变化;(频数直方图、控制图、排列图)7.描述质量形成过程。(流程图、控制图),评价过程质量的控制状态。预防不合格品的发生或再发生。降低检验成本。揭示产品不合格的原因或主要原因,四、统计方法的作用:,形成产品质量、谋求改进机会、进行质量管理的重要方法、工具。,五、统计方法应用基础条件:,1.基本条件:过程稳定处于受控状态 必要的资源:计量工具;检测手段;记录图表;高素质员工。,2.基础工作:建全规范的管理体系或制度;产品质量可追溯;计算机技术的应用:如 MINITAB 软件。,第二章 统计数据的运

5、用,数据的收集、整理与图示方法,第一节 统计数据及其分类,一、计量数据凡是可以连续取值的,或者说可以用测量工具具体测量出小数点以下数值的这类数据。如:长度、容积、质量、化学成分、温度、产量、职工工资总额等。计量数据一般服从正态分布。二、计数数据凡是不能连续取值的,或者说即使使用测量工具也得不到小数点以下数值,而只能得到0或1,2,3等自然数的这类数据。记件数据一般服从二项式分布,记点数据一般服从泊松分布。,第二节 总体与样本,总体(母体):是指在某一次统计分析中研究对象的全体。个体:组成总体的每个单元(产品)叫做个体。总体含量(总体大小):总体中所含的个体数,常用N表示。样本容量(样本大小):

6、样本中所含的样品数目,常用n表示。抽样:是指从总体中随机抽取样品组成样本的活动过程。随机抽样:是指要使总体中的每一个个体(产品)都有同等机会被抽取出来组成样本的活动过程。样本(子样):是指从总体中随机抽取出来并且要对它进行详细研究分析的一部分个体(产品);样本是由1个或若干个样品组成的。,第三节 抽样方法,1、简单随机抽样法又叫随机抽样法,是指总体中的每个个体被抽到的机会是相同的。优点:抽样误差小。缺点:抽样手续比较繁杂。2、系统抽样法又叫等距抽样法或机械抽样法。优点:操作简便,实施不易出差错。缺点:容易出较大偏差。3、分层抽样法也叫类型抽样法。它是从一个可以分成不同于总体的总体(或称为层)中

7、,按规定的比例从不同层中随机抽取样品(个体)的方法。优点:样本的代表性比较好,抽样误差比较小。缺点:抽样手续较简单随机抽样还要繁杂。适用场合:常用于产品质量验收。4、整群抽样法又叫集团抽样法。是将总体分成许多群,每个群由个体按一定方式结合而成,然后随机抽取若干群,并由这些群中的所有个体组成样本。优点:抽样实施方便。缺点:代表性差,抽样误差大。适用场合:常用在工序控制中。,案例,某种成品零件分装在20个零件箱装,每箱各装50个,总共是1000个。如果想从中取100个零件作为样本进行测试研究。,简单随机抽样:将20箱零件倒在一起,混合均匀,并将零件从1 1000编号,然后用查随机数表或抽签的办法从

8、中抽出编号毫无规律的100个零件组成样本。,系统抽样:将20箱零件倒在一起,混合均匀,并将零件从1 1000编号,然后用查随机数表或抽签的办法先决定起始编号,按相同的尾数抽取100个零件组成样本。,分层抽样:20箱零件,每箱都随机抽取5个零件,共100个组成样本。,整群抽样:先从20箱零件随机抽出2箱,该2箱零件组成样本。,第四节 统计特征数,一、样本平均值二、样本中位数三、样本方差四、样本标准偏差五、样本极差,表示数据的集中位置,表示数据的离散程度,一、样本平均值,如果从总体中抽取一个样本,得到一批数据X 1,X 2,X 3.X n,则样本的平均值:,:样本的算术平均值;,n:样本大小。,二

9、、样本中位数,把收集到的统计数据X 1,X 2,X 3.X n,按大小顺序重新排列,排在正中间的那个数就叫作中位数,用符号 来表示。,当 n 为奇数时,正中间的数只有一个;,当 n 为偶数时,正中间的数有两个,此时,中位数为正中两个数的算术平均值。,三、样本方差,样本方差是衡量统计数据分散程度的一种特征数,其计算公式:,S 2:样本方差;,:某一数据与样本平均值之间的偏差。,四、样本标准偏差,国际标准化组织规定,把样本方差的正平方根作为样本标准偏差,用符号 S 来表示。其计算公式:,五、样本极差,极差是一组数据中最大值与最小值之差。常用符号 R 表示,其计算公式:,R=X max-X min,

10、第五节 因果图、树图与关联图,一、因果图二、树图三、关联图,一、因果图(又称“鱼骨图”),应用因果图的步骤:,简明扼要地规定结果,即规定需要解决的质量问题;规定可能发生的原因的主要类别,这时可以考虑下列因素作为因素的主要类别:数据和信息系统、人员、机器设备、材料、方法、度量和环境等;开始画图,把“结果”画在右边的矩形框中,然后把各类主要原因放在它的左边,作为“结果”框的输入;寻找所有下一个层次的原因并画在相应的枝上,继续一层层地展开下去。,一张完整的因果图展开的层次至少应有二层,一些情况下还可以有三层以上。,画因果图的注意事项:,画因果图时必须开“诸葛亮会”,充分发扬民主,各抒己见,集思广益,

11、把每个人的意见都一一记录在图上;确定要分析的主要质量问题(特性)不能笼统,一个主要质量问题只能画一张因果图,多个主要质量问题则应画多张因果图,因果图只能用于单一目标的分析;因果关系的层次要分明,最高层次的原因应寻求到可以直接采取对策为止;对分析出来的所有末端原因,都应到现场进行观察、测量、试验等加以确认。,因果图常同排列图、对策表联合起来应用。,实例噪声超标因果图,在提高135W电机的一次装机合格率时,运用因果图对“噪声超标”进行原因分析:,未按要求做,装配经验不足,人,料,环,设计,转子部件,外圆跳动大,端盖,垂直度不够,刚性不够,环境噪声大,工作间距小,定、转子间的间隙小,转子外圆大,端盖

12、的轴承室与轴承配合不当,轴承公差不合理,二、树图,树图又叫系统图。用来表示某个质量问题与其他组成要素之间的关系,从而明确问题的重点,寻求达到目的所应采取的最适当的手段和措施的一种树枝状图。,树图常用于单目标的展开。,树图的主要用途,企业方针目标实施项目的展开;在新产品开发中进行质量设计展开;为确保质量保证活动而进行的保证质量要素(事项)的展开;对为解决企业内质量、成本、产量等问题所采取的措施加以展开;企业承包责任制项目的展开;工序分析中对质量特性进行主导因素的展开;探求明确部门职能、管理职能和提高效率的方法;可以用于因果分析。,应用树图的步骤,简明扼要地讲述清楚要研究的主题(如质量问题);确定

13、该主题的主要类别,即主要的层次;构造树图,把主题放在左框内,主要类别放在右边的方框内;针对这个主要类别确定其组成要素和子要素;把针对每个主要类别的组成要素及其子要素放在主要类别右边的方框内;评审画出的树图,确保无论在顺序上或逻辑上都没有差错和空档。,画树图的注意事项,用于因果分析的树图一般是单目标的,即一个质量问题用一张树图;树图中的主要类别一般可以不先从 5M1E 出发,而是根据具体的质量问题或逻辑关系去选取。,实例塑料试片麻坑厚度超差龟裂因果分析数图,试片麻坑厚度超差龟裂,人员,设备,工艺,原料,环境,操作不熟练,执行工艺不严,压力、温度、时间控制不严,新调入人员经验少,没定机、定人,压力

14、不稳定,模具不适,电热板不平行,设备密封不严,模具设计不合理,电热板间垫层不匀,模具厚度大,毛坯质量差,毛坯厚度偏差大,压辊调节不当,混炼时间不统一,塑化时间不统一,塑炼时间不准,杂质,塑化时间不统一,原材料性能不稳定,暖气片少,没有排风设备,工作台不洁,室温过高或过低,卫生条件差,主题,主要类别,组成要素,子要素,第三节 关联图,关联图又叫关系图。它是解决关系复杂、因素之间又相互关联的原因与结果或目的与手段等的单一或多个问题的图示技术,是根据逻辑关系理清复杂问题、整理语言文字资料的一种方法。,关联图的基本类型:中央集中型:把要分析的问题放在图的中央位置,把同“问题”发生关联的因素逐层排列在其

15、周围。单侧汇集型:把要分析的问题放在右(或左)侧,与其发生关联的因素从右(左)向左(右)逐层排列。,第三节 关联图,关联图的用途:制定全面质量管理计划;制定质量方针;制定生产过程的质量改进措施;推进外购、外协件的质量管理工作;制定质量管理小组活动规划与目标展开;解决工期、工序管理上的问题;改进职能部门的工作;其他。,第三节 关联图,应用关联图的步骤:确定要分析的“问题”。“问题”宜用简洁的“主语 谓语”的短语表示,一般用粗线方框 圈起。一个粗方框只圈一个“问题”,多个问题则应用多个方框圈起来。“问题”识别规则是“箭头只进不出”。召开诸葛亮会。与会者应用“头脑风暴法”就分析的“问题”充分发表意见

16、,找“因素”(手段)。边记录,边绘制,反复修改关联图。用箭头表示原因与结果(目的与手段)的关系;箭头指向是:原因 结果。原因要深入细致地分析,直至找出末端原因。末端原因应是可以直接采取对策的原因,其识别标志是:箭头只出不进。,第三节 关联图,应用注意事项:用因果分析关联图时,“要因”必是由对其末端原因逐一经现场验证并作出“标识”;图中一定有若干相互关联的因素。,实例产品的焊缝质量不良进行原因分析,外观质量差,气孔,构件表面处理不净,温度控制不好,焊接材料不当,坡口尺寸不合要求,焊丝材质不对,焊接预热温度低,后热保温不严谨,层温未在较高温度,断续未融合,焊速不当,时间控制不好,焊缝成型粗糙,长时

17、间平稳操作难,立姿操作,焊接中断,抗风雨能力差,机具出故障,CO2出口压力小,焊机操作不对,焊枪角度不对,焊接电弧电压不准确,焊丝伸出长度不够,缺少培训,无相应焊接经验,CO2气流流量不适宜,第六节 水平对比、流程图与简易图表,一、水平对比二、流程图三、简易图表,一、水平对比,水平对比就是将过程、产品和服务质量同公认的处于领先地位的竞争者的过程、产品和服务质量进行比较,以寻找自身质量改进的机会。水平对比在确定企业质量方针、质量目标和质量改进中都十分有用。,应用水平对比的步骤:确定对比的项目。确定对比的对象。收集资料。归纳、整理和分析资料。制成表格进行对比。,二、流程图,流程图就是将一个过程(如

18、工艺过程、检验过程、质量改进过程等)的步骤用图的形式表示出来。通过对一个过程中各步骤之间关系的研究,一般能发现故障的潜在原因,知道哪些环节需要进行质量改进。,流程图可以用于从材料流向产品销售和售后服务的全过程的所有方面。流程图可以用来描述现有的过程,亦可用来设计一个新的过程。,流程图由一系列容易识别的标志构成。一般使用的标志如下:,开始和结束,活动说明,决策,按顺序示出从一个活动到另一个活动的流向,流程图标志:,描述和分析现有过程流程图的步骤:,判断过程的开始和结束;观察从开始到结束的整个过程;规定在该过程中的程序(输入、活动、判断、决定、输出);画出表示该过程的流程草图;与该过程中所涉及的有

19、关人员共同评审该草图;根据评审结果改进流程草图;与实际过程比较,验证改进后的流程图;注明正式流程图的形成日期,以备将来使用和参考(它可用作过程实际运行的记录,亦可用于判断质量改进的时机)。,设计新过程流程图的步骤:,判断该过程的开始和结束;使这个新过程中将要形成的程序(输入、活动、判断、决定、输出)形象化;确定该过程中的程序(输入、活动、判断、决定、输出);画出表示该过程的流程草图;与预计该过程将要涉及到的有关人员一起评审该流程草图;根据评审结果改进流程草图;注明形成正式流程图的日期,以备将来使用和参考(它可用作设计该过程的运行记录,亦可用于判断质量改进的时机)。,实例复印文件的流程图,开始,

20、接受文件,输入复印份数,开始复印,重新开始,机器运转正常?,装订?,装订文件,纠正错误,整理,结束,是,是,否,否,三、简易图表,1、折线图2、柱状图3、饼分图4、雷达图,1、折线图,折线图又叫波动图。它常用来表示质量特性数据随着时间推移而波动的状况。,0,1,2,3,4,5,6,7,8,9,10,11,12,20,40,60,80,100,销售额(万元),时间(月),年度销售额折线图,2、柱状图,是用长方形的高低来表示数据大小,并对数据进行比较分析。,一级品率,消耗,利润,活动前,活动后,3、饼分图,饼分图也叫圆形图。它是把数据的构成按比例用圆的扇形面积来表示的图形。各扇形面积表示的百分率加

21、起来是100,即整个圆形面积。,操作者引起42.5,其他6.3,环境引起12.7,测量引起17.3,设备引起21.2,产品质量事故原因构成图,4、雷达图,雷达图是模仿电子雷达机图像形状的一种图形。它常用来检查(包括自我检查和他人检查)工作成效。,雷达图一般可用极坐标纸根据要检查的若干项目数,从坐标原点引出若干条射线,同时确定三条圆弧线分别表示被检查项目的理想水平、平均水平、不理想水平。三条圆弧中相邻的两条中心线为界,把圆内分出A、B、C三个区域。在圆心引出的射线上标明指标名称,把实际情况(检查结果)根据比例在图中坐标点上点出相应的点子,连接各点形成一个封闭的折线。闭环折线的形状反映出被检查项目

22、的总状况和特点。,四、雷达图实例复合膜消耗雷达图,12.52,4月,5月,6月,7月,8月,9月,10月,12月,11,12,11,12.75,12.24,11.79,11.36,12.68,12.71,12.23,第三章 直方图与散布图,第一节 直方图第二节 散布图,第一节 直方图,一、概念二、应用直方图的步骤三、直方图的观察分析,一、概念,直方图是频数直方图的简称。它是用一系列宽度相等、高度不等的长方形表示数据的图。长方形的宽度表示数据范围的间隔,长方形的高度表示在给定间隔内的数据数。,直方图的作用是:显示质量波动的状态;较直观地传递有关过程质量状况的信息;当人们研究了质量数据波动状况之后

23、,就能掌握过程的状况,从而确定在什么地方集中力量进行质量改进工作。,二、应用直方图的步骤,收集数据(作直方图数据一般应大于50个)。,确定数据的极差(R=X max X min)。,确定组距(h=R k,一般取测量单位的整倍数)。,组数 k 选用表,二、应用直方图的步骤,确定各组的界限值(界限值单位应取最小测量单位的1/2)。,编制频数分布表(统计各组数据的频数 f)。,按数据值比例画横坐标。,按数据值比例画纵坐标。,画直方图。在直方图上应标注出公差范围(T)、样本大小(n)、样本平均值()、样本标准偏差值(s)和、公差中心 M 的位置等。,二、应用直方图的步骤实例,某厂产品的重量规范要求为1

24、000(g)。,+0.50+0,收集数据。,注:表中数据是实测数据减去1000g的简化值。,n=100,二、应用直方图的步骤实例,确定数据的极差。,R=X max X min 48147(cg),确定组距(取组数k10)。,h R k 4710 4.7 5(cg),确定各组的界限值(界限值单位应取最小测量单位的1/2,即1 20.5)。,第一组下限值:最小值0.5,即10.50.5;第一组上限值:第一组下限值组距,即0.555.5;第二组下限值:等于第一组上限值,即5.5;第二组上限值:第二组下限值组距,即5.5510.5;第三组以后,依此类推出各组的界限值:15.5,20.5,25.5,30

25、.5,35.5,40.5,45.5,50.5。,二、应用直方图的步骤实例,编制频数分布表。,二、应用直方图的步骤实例,0.5,5.5,10.5,15.5,20.5,25.5,30.5,35.5,40.5,45.5,50.5,55.5,0,5,10,15,20,25,30,T,TU,TL,50,M,n 100 26.6(cg)S 9.(cg),重量(cg),频 数,三、直方图的观察分析,(一)、直方图的形状分析与判断,(一)、直方图的形状分析与判断,(一)、直方图的形状分析与判断,(二)、与规范界限(公差)的比较分析,M,TL,TU,M,TL,TU,(二)、与规范界限(公差)的比较分析,M,TL

26、,TU,M,TL,TU,(二)、与规范界限(公差)的比较分析,M,TL,TU,第二节 散布图,一、概念二、应用散布图的步骤三、散布图的相关性判断,一、概念,散布图是研究成对出现的两组相关数据之间相关关系的简单图示技术。在散布图中,成对的数据形成点子云,研究点子云的分布状态便可推断成对数据之间的相关程度。,散布图可以用来发现、显示和确认两组相关数据之间的相关程度,并确定其预期关系。,六种典型的点子云形状图,X,Y,0,X,Y,0,X,Y,0,X,Y,0,X,Y,0,X,Y,0,强正相关,强负相关,弱正相关,弱负相关,不相关,非直线相关,二、应用散布图的步骤,收集成对数据(X,Y)(至少不得少于3

27、0对)。标明 X 轴和 Y 轴。找出X和Y的最大值和最小值,并用这两个值标定横轴X和纵轴Y。描点(当两组数据值相等,即数据点重合时,可围绕数据点画同心圆表示)。判断(分析研究点子云的分布状况,确定相关关系的类型)。,三、散布图的相关性判断,对照典型图例判断法象限判断法相关系数判断法,实例钢的淬火温度与硬度的相关关系判断,对照典型图例判断法,810,42,44,46,48,50,52,54,56,58,60,820,830,840,850,860,870,880,890,硬度(HRC),淬火温度(),象限判断法,象限判断法又叫中值判断法、符号检定判断法。使用此法的步骤如下:,在散布图上画一条与Y

28、 轴平行的中值线 f,使 f 线的左、右两边的点子数大致相等;在散布图上画一条与X 轴平行的中值线 g,使 g线的上、下两边的点子数大致相等;f、g 两条线把散布图分成4个象限区域I、II、III、IV。分别统计落入各象限区域内的点子数;分别计算对角象限区内的点子数;判断规则;若n I n III n II n IV,则判为正相关若n I n III n II n IV,则判为负相关,象限判断法,810,42,44,46,48,50,52,54,56,58,60,820,830,840,850,860,870,880,890,810,42,44,46,48,50,52,54,56,58,60,

29、820,830,840,850,860,870,880,890,810,42,44,46,48,50,52,54,56,58,60,820,830,840,850,860,870,880,890,硬度(HRC),淬火温度(),g,f,相关系数判断法,相关系数判断法的应用步骤:,简化X、Y数据。计算X2,Y2,X Y、(X Y)和(X Y)2。计算 X、Y、X Y、X2、Y2、(X Y)和(X Y)2。计算L X X、L Y Y、L X Y。,L X X=X2,(X)2,N,L Y Y=Y2,(Y)2,N,L X Y=X Y,(X)(Y),N,相关系数判断法,计算相关数据()。,L X Y,L

30、X X,L Y Y,查出临界相关数据()。,可根据N2和显著性水平查表求得。,判断。判断规则:,若,则X与Y相关若,则X与Y不相关,相关系数判断法,相关系数判断法,相关系数判断法,注:表中X 值是(X800)1/10的简化值;Y值是(Y40)1的简化值。表中X Y、(X Y)2栏是校对栏,以免X、Y、X2、Y2、X Y各栏计算错误,导致相关性结论错误。校核公式是:(X Y)X Y(X Y)2X22(X Y)Y2,计算L X X、L Y Y、L X Y。,L X X=X2,(X)2,N,L Y Y=Y2,(Y)2,N,L X Y=X Y,(X)(Y),839,(141)2,30,176.3,3778,(312)2,30,533.2,1716,30,249.6,141 312,相关系数判断法,计算相关系数()。,L X Y,L X X,L Y Y,176.3,533.2,249.6,0.814,判断。判断规则:,查出临界相关数据()。,根据N2和显著性水平查表求得0.361(0.05),0.814 0.361,所以钢的硬度与淬火温度呈强正关。,后附相关系数检查表,以上三种判断方法对同一实例进行分析判断的结论是一致的。,相关系数检查表,N2,N2,相关系数检查表,N2,N2,返回目录,

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 在线阅读 > 生活休闲


备案号:宁ICP备20000045号-1

经营许可证:宁B2-20210002

宁公网安备 64010402000986号