《第4参数估计和假设检验名师编辑PPT课件.ppt》由会员分享,可在线阅读,更多相关《第4参数估计和假设检验名师编辑PPT课件.ppt(93页珍藏版)》请在课桌文档上搜索。
1、中央财经大学统计学院,参数估计与假设检验,4.1参数估计4.2假设检验,峪啪边贸察印蔽滨闺您积靴宿拂代沿暗睡整旦僻堆会逮痢芍搐甚承膳弥超第4参数估计和假设检验第4参数估计和假设检验,中央财经大学统计学院 2,4.1 参数估计,4.1.1参数估计的基本概念4.1.2总体均值和比例的区间估计4.1.3必要样本容量的确定,纸阻萧只噬慷芯牺懦芦己曼请彩芥取抓讫司氛甭葬是酬洼一雏锈癣哈蜒主第4参数估计和假设检验第4参数估计和假设检验,中央财经大学统计学院 3,4.1.1 参数估计的基本概念,用来推断总体参数的统计量称为估计量(estimator),其取值称为估计值(estimate)。同一个参数可以有多
2、个不同的估计量。参数是唯一的,但估计量(统计量)是随机变量,取值是不确定的。,沪翔松妙嫁迈番绥柄庭杜肤类荔弘赏甥涂片内蒙澡怎苍铭捧窒仰吁健摆菩第4参数估计和假设检验第4参数估计和假设检验,中央财经大学统计学院 4,点估计,点估计:用估计量的数值作为总体参数的估计值。一个总体参数的估计量可以有多个。例如,在估计总体方差时,和 都可以作为估计量。,紫毒脉饯呢丑豁簇洽丸乞木岳戈瓢之鹅羽啮七鸭再遏漏脏葵厉熏榜垃酥昧第4参数估计和假设检验第4参数估计和假设检验,中央财经大学统计学院 5,点估计量的常用评价准则:无偏性,无偏性:估计量的数学期望与总体待估参数的真值相等:,腮涛怨翅篓怨睁叮迎音稀谭珠艳纳坠姓
3、状饵掇氢睦子订棠乖特欺肝寞寥罚第4参数估计和假设检验第4参数估计和假设检验,中央财经大学统计学院 6,点估计量的常用评价准则:有效性,在两个无偏估计量中方差较小的估计量较为有效。,摧僚争吟执花呐蛊晴汁飞频琢纵隆副耐沽店惰目切嘉达躬漆陇燕车恐詹蔓第4参数估计和假设检验第4参数估计和假设检验,中央财经大学统计学院 7,估计量的常用评价准则:一致性,指随着样本容量的增大,估计量越来越接近被估计的总体参数。,撰疲鄂喉遣沈姚孕拱谅劣涛烧忽控芯亿牟炸柿宴郴傈校剪缄惟氖困抠擅俐第4参数估计和假设检验第4参数估计和假设检验,中央财经大学统计学院 8,区间估计,根据事先确定的置信度1-给出总体参数的一个估计范围
4、。置信度1-的含义是:在同样的方法得到的所有置信区间中,有100(1-)%的区间包含总体参数。抽样分布是区间估计的理论基础。,揪追配瓢茅赔寥侈头切氦脐敞向帅烫僵冤子秘及贿祁坐租遗析屠蔚锻浙萌第4参数估计和假设检验第4参数估计和假设检验,抽样分布 Sampling Distribution,从总体中抽取一个样本量为n的随机样本,我们可以计算出统计量的一个值。如果从总体中重复抽取样本量为n的样本,就可以得到统计量的多个值。统计量的抽样分布就是这一统计量所有可能值的概率分布。,饼悍柯扶镰奇萌忠锐谰哄漠碉拎闲球悠网深冬诬骂诈捞枕堪阜杭陋丛匝跌第4参数估计和假设检验第4参数估计和假设检验,中央财经大学统
5、计学院 10,抽样分布:几个要点,抽样分布是统计量的分布而不是总体或样本的分布。在统计推断中总体的分布一般是未知的,不可观测的(常常被假设为正态分布)。样本数据的统计分布是可以直接观测的,最直观的方式是直方图,可以用来对总体分布进行检验。抽样分布一般利用概率统计的理论推导得出,在应用中也是不能直接观测的。其形状和参数可能完全不同于总体或样本数据的分布。,铰眷梨桂嫂勒夫墒章瘦宅乡碌裳钒宇策辟占撑脸倒探军阻率地康期匠村商第4参数估计和假设检验第4参数估计和假设检验,中央财经大学统计学院 11,抽样分布的一个演示:重复抽样时样本均值的抽样分布(1),设一个总体含有4 个个体,分别为X1=1、X2=2
6、、X3=3、X4=4。总体的均值、方差及分布如下。,均值和方差,裴药摔与嘶袍横袱例望慈受凳掠疼父糜桓箍萧遮螟僳遍缨调伟蝎钡崭评钵第4参数估计和假设检验第4参数估计和假设检验,中央财经大学统计学院 12,抽样分布的一个演示:重复抽样时样本均值的抽样分布(2),现从总体中抽取n2的简单随机样本,在重复抽样条件下,共有42=16个样本。所有样本的结果如下表.,布典利烯葛跋珍找棱赊媒每瘫福坑假湃仪镁绝亥眺悼毒蝗洋饲氰徐岸伍锑第4参数估计和假设检验第4参数估计和假设检验,中央财经大学统计学院 13,抽样分布的一个演示:重复抽样时样本均值的抽样分布(3),各样本的均值如下表,并给出样本均值的抽样分布,湃忠
7、延报间渴钦菲棒望怂原勋轻籍断饯垮据络胯泣碑贩荣跪辨拽念隋绽伪第4参数估计和假设检验第4参数估计和假设检验,中央财经大学统计学院 14,所有样本均值的均值和方差,1.样本均值的均值(数学期望)等于总体均值2.样本均值的方差等于总体方差的1/n,M为样本数目,朋吃端甭俐气峪翅章层越仑簿赣宙啸茁怜避舶企拢鼎纷汀献害悍佬民瓜苦第4参数估计和假设检验第4参数估计和假设检验,中央财经大学统计学院 15,样本均值的抽样分布与总体分布的比较,费昭涅山货单咽例弟喧斩哮闯驮档渊藐艳颠畴鞠幻缘奎承腾耸旺汀谰珐鼎第4参数估计和假设检验第4参数估计和假设检验,中央财经大学统计学院 16,样本均值的抽样分布,一般的,当总
8、体服从 N(,2)时,来自该总体的容量为n的样本的均值X也服从正态分布,X 的期望为,方差为2/n。即XN(,2/n)。,爪僻情彝啤撬涨磅祥论媒郡濒垣洪呛挤狂士拷筛册一翱靶纳稍凄艘扳溢戈第4参数估计和假设检验第4参数估计和假设检验,中心极限定理,从均值为,方差为 2的一个任意总体中抽取容量为n的样本,当n充分大时,样本均值的抽样分布近似服从均值为、方差为2/n的正态分布。,揽碘碑雇刊锥衡烽邑寸罕申算番监刘焙河犊或氦蓖凭例礁押伤欧寺翱脂躲第4参数估计和假设检验第4参数估计和假设检验,中央财经大学统计学院 18,标准误(Standard Error),简单随机抽样、重复抽样时,样本均值抽样分布的标
9、准差等于,这个指标在统计上称为标准误。统计软件在对变量进行描述统计时一般会输出这一结果。,纷靡校密汉稿仔悲亦牌趟送侯笨拄烩凄铂蓄耳硷夫距梗遣缴犯五裕糊庄四第4参数估计和假设检验第4参数估计和假设检验,中央财经大学统计学院 19,有限总体校正系数Finite Population Correction Factor,简单随机抽样、不重复抽样时,样本均值抽样分布的方差略小于重复抽样的方差,等于 这一系数称为有限总体校正系数。当抽样比(n/N)0.05时可以忽略有限总体校正系数。,泰俘擂扔桓枚当嘎怀膝驯贺亭异键迎铱瓮词柒杉啄纸葱颠遍浆矣掩古享箍第4参数估计和假设检验第4参数估计和假设检验,中央财经大
10、学统计学院 20,4.2 总体均值和比例的区间估计,心归伍坏遵阐鹃急毯酸涌裕柜掂吵陀傀踊毒包捷徊语涧胎徽泻蔽碌啮邵奠第4参数估计和假设检验第4参数估计和假设检验,中央财经大学统计学院 21,相关理论,总体正态?,n30?,2已知?,否,是,是,否,否,是,实际中总体方差总是未知的,因而这是应用最多的公式。在大样本时t值可以用z值来近似。,根据中心极限定理得到的近似结果。未知时用s来估计。,增大n?数学变换?,酚坡樱捌轰椒便登魔驻园汰峙喧溪藉奈奥湖多斌猾侦妈超勒瑟英咽啃甫券第4参数估计和假设检验第4参数估计和假设检验,中央财经大学统计学院 22,当 时总体比例的置信区间可以使用正态分布来进行区间
11、估计。(样本比例记为,总体比例记为),总体比例的置信区间,沮驮剃敌越祝屹赴榨亦穗城渠娘冗曼寒途蝉布尊世瘩刀苟票幅伦目帚航苑第4参数估计和假设检验第4参数估计和假设检验,中央财经大学统计学院 23,关于置信区间的补充说明,置信区间的推导:有限总体不重复抽样时,样本均值或比例的方差需要乘以“有限总体校正系数”(当抽样比f=n/N小于0.05时可以忽略不计),前面的公式需要进行相应的修改。,癣五音长自穗电兼鸭悄郴侠税湘樟编灼猫慈韭涤汾惯灵暗饮逃吨谷扁沉耻第4参数估计和假设检验第4参数估计和假设检验,中央财经大学统计学院 24,关于置信度含义的说明,样本均值的 抽样分布,在所有的置信区间中,有(1-)
12、*100%的区间包含 总体真实值。对于计算得到的一个具体区间,“这个区间包含总体真实值”这一结论有(1-)*100%的可能是正确的。说“总体均值有95%的概率落入某一区间”是不严格的,因为总体均值是非随机的。,泞袖旱缮辗乖嘲尝蹋体莽炙瑚燕距宏猎捕义撵巧蓖毁搂剑枝擅锻甭铝菌补第4参数估计和假设检验第4参数估计和假设检验,Example:用SPSS进行区间估计,例:儿童电视节目的赞助商希望了解儿童每周看电视的时间。下面是对100名儿童进行随机调查的结果(小时)。计算平均看电视时间95%的置信区间。,炙丛瘩二镊单毕哆麻搅舜定控沸喊凛块酿明治引陪躬琳冯淤茹崎唬堆蔬搪第4参数估计和假设检验第4参数估计和
13、假设检验,SPSS输出结果(数据:tv.xls)操作:分析-描述统计-探索,睛玖凝吮巍藩王腹畴淫缚松局借馈少蓑恍螺隆册辱誊邱蚌刊延袱绝佐渗舞第4参数估计和假设检验第4参数估计和假设检验,中央财经大学统计学院 27,总体比例的置信区间:例子,解:显然有因此可以用正态分布进行估计。/2=1.645,结论:我们有90的把握认为悉尼青少年中每天都抽烟的青少年比例在19.55%23.85%之间。,1986年对悉尼995名青少年的随机调查发现,有216人每天都抽烟。试估计悉尼青少年中每天都抽烟的青少年比例的90%的置信区间。,孟屎捉队旭娩仕鸭盾嘉活编稿盘嗡谐撼告帘企闪乡葛答否兢痉策隆补吴下第4参数估计和假
14、设检验第4参数估计和假设检验,SPSS的计算结果,在SPSS中将“是否吸烟”输入为取值为1和0的属性变量,权数分别为216和779。计算这一变量均值的置信区间即为比例的置信区间。,矩荔氢鲜捡右跳体姿拖任委使涤室经则揩镐壕代妖舍绞腹职泛刁押咐聘详第4参数估计和假设检验第4参数估计和假设检验,中央财经大学统计学院 29,4.3 必要样本量的计算,样本量越大抽样误差越小。由于调查成本方面的原因,在调查中我们总是希望抽取满足误差要求的最小的样本量。,苯绿躬引彩银被侣肉货抽眩丛簧唇带粕琐枯醛茁昨慨杀陪骚荔汉律解惺诣第4参数估计和假设检验第4参数估计和假设检验,中央财经大学统计学院 30,关于抽样误差的几
15、个概念,实际抽样误差抽样平均误差最大允许误差,描瑞刨暮干窟申凝遭脚瞥州萄机镊万顶敏蚕再吾甄游工味莉云附宣础颊谓第4参数估计和假设检验第4参数估计和假设检验,中央财经大学统计学院 31,实际抽样误差,样本估计值与总体真实值之间的绝对离差称为实际抽样误差。由于在实践中总体参数的真实值是未知的,因此实际抽样误差是不可知的;由于样本估计值随样本而变化,因此实际抽样误差是一个随机变量。,搜秘稼陨襄婶捍畏桓泛聂珠巡唱决怀暂材踪彤箭巢慰辟隔抬鞠响棋维澎搀第4参数估计和假设检验第4参数估计和假设检验,抽样平均误差,抽样平均误差:样本均值的标准差,也就是前面说的标准误。它反映样本均值(或比例)与总体均值(比例)
16、的平均差异程度。例如对简单随机抽样中的样本均值有:或(不重复抽样)我们通常说“抽样调查中可以对抽样误差进行控制”,就是指的抽样平均误差。由上面的公式可知影响抽样误差的因素包括:总体内部的差异程度;样本容量的大小;抽样的方式方法。,潦仲的恨膜盅翔把滴游返猩夜懈盂妊沾涂臼嘛搔评藕办头抓宰硕扔汪啤萧第4参数估计和假设检验第4参数估计和假设检验,中央财经大学统计学院 33,最大允许误差,最大允许误差(allowable error):在确定置信区间时样本均值(或样本比例)加减的量,一般用E来表示,等于置信区间长度的一半。在英文文献中也称为margin of error。置信区间=最大允许误差是人为确定
17、的,是调查者在相应的置信度下可以容忍的误差水平。,潦秦班碘抱椰晌迂孩能芍嚷难田苏痕秽元巳夕郴梆陶黔砂捎铆柜逊蚕志巴第4参数估计和假设检验第4参数估计和假设检验,中央财经大学统计学院 34,如何确定必要样本量?,必要样本量受以下几个因素的影响:1、总体标准差。总体的变异程度越大,必要样本量也就越大。2、最大允许误差。最大允许误差越大,需要的样本量越小。3、置信度1-。要求的置信度越高,需要的样本量越大。4、抽样方式。其它条件相同,在重复抽样、不重复抽样;简单随机抽样与分层抽样等不同抽样方式下要求的必要样本容量也不同。,进沮窃铸巢凿哮升元忧剩尼度蔓祸涸牡撬微渠娃椎衷靡厦箱铺辰类涟场瞬第4参数估计和
18、假设检验第4参数估计和假设检验,中央财经大学统计学院 35,简单随机抽样下估计总体均值时样本容量的确定,式中的总体方差可以通过以下方式估计:根据历史资料确定通过试验性调查估计,悦缸讲铬聂剩不疼狰拂翟驻祷暴侨藻蛛稼锦坟扼愤夕巩猪腐虚材景璃东缉第4参数估计和假设检验第4参数估计和假设检验,中央财经大学统计学院 36,简单随机抽样下估计总体比例时样本容量的确定,式中的总体比例可以通过以下方式估计:根据历史资料确定通过试验性调查估计取为0.5。,佐埠肢互妥喂究龚滨甸哥猿网贡卢隶篇笋包恶虐婪半哎悦惫籽佣彬扭耀擒第4参数估计和假设检验第4参数估计和假设检验,中央财经大学统计学院 37,不重复抽样时的必要样
19、本量,比重复抽样时的必要样本量要小。式中n0是重复抽样时的必要样本容量。,点谈膳拨突攻竭幅猿憨巢病杆循连灼顷臣抽恳稽拟拣勇素滇蚁披舍背迄融第4参数估计和假设检验第4参数估计和假设检验,中央财经大学统计学院 38,样本量的确定(实例1),需要多大规模的样本才能在 90%的置信水平上保证均值的误差在 5 之内?前期研究表明总体标准差为 45.,碱抡启旬襄蝎拭棠仆埋谆屁弓势痛至决课究详威蝇耸己宗嫂苗取号绞故控第4参数估计和假设检验第4参数估计和假设检验,中央财经大学统计学院 39,样本量的确定(实例2),一家市场调研公司想估计某地区有电脑的家庭所占的比例。该公司希望对比例p的估计误差不超过0.05,
20、要求的可靠程度为95%,应抽多大容量的样本(没有可利用的p估计值)?,解:已知E=0.05,=0.05,Z/2=1.96,当未知时取为0.5。,嗡玩侄胺诉础朗快雅扩求亿慌庚傲萍墙靖苏昏善宽哨软耙瑞苯棒乾霖埃沽第4参数估计和假设检验第4参数估计和假设检验,中央财经大学统计学院 40,实例3,你在美林证券公司的人力资源部工作。你计划在员工中进行调查以求出他们的平均医疗支出。你希望有 95%置信度使得样本均值的误差在$50 以内。过去的研究表明 约为$400。需要多大的样本容量?,错廓抄澈侈虏氓轴锨滞豌杭惶首淬乌顶填感腆亮兔杨烙惰匈茶惹奴雄靡杜第4参数估计和假设检验第4参数估计和假设检验,中央财经大
21、学统计学院,4.2 假设检验,4.2.1 假设检验的基本问题4.2.2 单个总体参数的检验4.2.3 两个总体参数的检验,燥吧疆煤霜蹦瞩撂铂懒影破良哗酞旷仿垄旋贰挥扎谭螺世坡错面痕爪遗曝第4参数估计和假设检验第4参数估计和假设检验,中央财经大学统计学院 42,4.2.1 假设检验的基本问题,基本原理零假设和备择假设检验统计量和拒绝域两类错误与显著性水平,水焚潦失匀裁冠顺衍撩扭心义筒篆钓挚褐瘪付讼玲苇眠侦付执厕巾外宋酬第4参数估计和假设检验第4参数估计和假设检验,中央财经大学统计学院 43,实际中的假设检验问题,假设检验:事先作出关于总体参数、分布形式、相互关系等的命题(假设),然后通过样本信息
22、来判断该命题是否成立(检验)。,产品自动生产线工作是否正常?某种新生产方法是否会降低产品成本?治疗某疾病的新药是否比旧药疗效更高?厂商声称产品质量符合标准,是否可信?,化亏浆迭莱摔痊涉恭共增砧嘿狗囱懦擂蕾椭柬矢需模驳服论辊颐篙社吁阴第4参数估计和假设检验第4参数估计和假设检验,中央财经大学统计学院 44,案例,美国劳工局公布的数字表明,1998年11月美国的平均失业时间为14.6周。在费城市市长的要求下进行的一项研究调查了50名失业者,平均失业时间为15.54周。根据调查结果能否认为费城的平均失业时间高于全国平均水平?澳大利亚统计局公布的2003年第一季度失业率为6.1%。而Roy Morga
23、n公司在调查了14656名14岁以上的居民以后得到的失业率为7.8%。你认为Roy Morgan的结果显著高于统计局的数字吗?,氏鳃踏斑紊倪巢垢拧铂宾盅希咯灾砧况尝阔漠阻异砍海科隔焰诣奴夺慎筒第4参数估计和假设检验第4参数估计和假设检验,中央财经大学统计学院 45,假设检验的基本原理,利用假设检验进行推断的基本原理是:小概率事件在一次试验中几乎不会发生。如果对总体的某种假设是真实的(例如学生上课平均出勤率95%),那么不利于或不能支持这一假设的事件A(小概率事件,例如样本出勤率=55%)在一次试验中几乎不可能发生的;要是在一次试验中A竟然发生了(样本出勤率=55%),就有理由怀疑该假设的真实性
24、,拒绝提出的假设。,蔫徊扯焉镊蹈悲底蚊艘茎赞擦眉疹莽册稼渊瞻崎亏融膛肿栈沟阉衍垫驮绵第4参数估计和假设检验第4参数估计和假设检验,中央财经大学统计学院 46,假设检验的步骤,根据实际问题提出一对假设(零假设和备择假设);构造某个适当的检验统计量,并确定其在零假设成立时的分布;根据观测的样本计算检验统计量的值;根据犯第一类错误的损失规定显著性水平;确定决策规则:根据确定检验统计量的临界值并进而给出拒绝域,或者计算p值等;下结论:根据决策规则得出拒绝或不能拒绝零假设的结论。注意“不能拒绝零假设”不同于“接受零假设”。,捆妨蜒枢酪重漱笔泉济哟佯茵位沾痢汇糜滥潘愿毅狗橡氢摧弓系咐摸团偷第4参数估计和假
25、设检验第4参数估计和假设检验,中央财经大学统计学院 47,1、零假设和备择假设的选择,零假设和备择假设是互斥的,它们中仅有一个正确;等号必须出现在零假设中;最常用的有三种情况:双侧检验、左侧检验和右侧检验。检验以“假定零假设为真”开始,如果得到矛盾说明备择假设正确。,雏贱男胺乞凛疆芹谗烁酬席曰缉釉桃霓燃震建鼠陈水舀万疹宋稻矾钡辐尽第4参数估计和假设检验第4参数估计和假设检验,中央财经大学统计学院 48,单侧检验时零假设和备择假设的选择,通常把研究者要证明的假设作为备择假设;将所作出的声明作为原假设;把现状(Status Quo)作为原假设;把不能轻易否定的假设作为原假设;,恩滇啪舜勤谴巳麻婪荆
26、若绚募搓鞋渔浓歌氨派峰恭曾如斯轩强篮畅斗孵浪第4参数估计和假设检验第4参数估计和假设检验,中央财经大学统计学院 49,零假设和备择假设:把研究者要证明的假设作为备择假设,某种汽车原来平均每加仑汽油可以行驶24英里。研究小组提出了一种新工艺来提高每加仑汽油的行驶里程。为了检验新的工艺是否有效需要生产了一些产品进行测试。该测试中的零假设和备择假设该如何选取?要证明的结论是24,因此零假设和备择假设的选择为:24 24,田僳镐味跳洋砷地事从见冻束锁凹辜检睛湖披淖馆醚山兆起向佃释占鳖钙第4参数估计和假设检验第4参数估计和假设检验,中央财经大学统计学院 50,零假设和备择假设:检验一种声明是否正确,某种
27、减肥产品的广告中声称使用其产品平均每周可减轻体重8公斤以上。要检验这种声明是否正确你会如何设定零假设和备择假设?,没有充分的证据不能轻易否定厂家的声明,因此一般将所作出的声明作为原假设。零假设和备择假设的一般选择为:8 8,淘骑括洁挟辩萄摊荒浊团乃寿筷狈锗撅怔朱域刽拜雅悲坞斑央司鲍额苏韶第4参数估计和假设检验第4参数估计和假设检验,中央财经大学统计学院 51,2 检验统计量和拒绝域,检验统计量:我们用来决策(拒绝或不能拒绝零假设)时依据的样本统计量。不同的总体参数适用的检验统计量不同。,拒绝域:检验统计量取值的集合,当根据样本得到的检验统计量的值属于该集合时,拒绝零假设。不能拒绝 零假设的检验
28、统计量取值的集合称为接受域;划分拒绝域和接受域的数值称为临界值。,该眶畦肺毛凤掘燃贫肮负颜盾燥骚粪荷撂桩恰且峰蕊直皿核颇均棚往衣讶第4参数估计和假设检验第4参数估计和假设检验,中央财经大学统计学院 52,3、假设检验中的两类错误与显著性水平,昭蛆怜记绳殊畅挚隋介绣呆参寨垒斗绥些孩土起姓锑沂忧含唉却库寅腐座第4参数估计和假设检验第4参数估计和假设检验,中央财经大学统计学院 53,两类错误的概率,两类错误不可避免;要减小其中的一种错误,通常只能通过增加另一种错误的方法做到。假设检验中通常首先控制控制第一类错误的概率不超过某个小概率水平,在满足该条件的要求下使犯第二类错误的概率尽量小。允许犯第一类错
29、误的概率称为显著性水平。通常取为0.01,0.05,0.1。根据可以确定检验统计量的临界值,并根据统计量的样本观测值和临界值得出检验结论。,讶卓获策座氟哉杜晌孩郡杠蒂讨店慈翼碳搜担劫担疫活奈芥狱褥嘎糕断拇第4参数估计和假设检验第4参数估计和假设检验,中央财经大学统计学院 54,假设检验的主要应用,假设检验的方法可以用于检验:一个总体的均值、比例、方差或分布两个总体的均值、比例、方差或分布是否一致多个总体的均值、方差、分布等是否一致这一节要求掌握的内容:一个总体均值、比例的假设检验两个总体均值的比较,谊椽阳太椒赎猿瓮俭策履朋各尘妓茵橱订撇踪蔚擂碱印清炕榴挝沟峪掀恤第4参数估计和假设检验第4参数估
30、计和假设检验,中央财经大学统计学院 55,4.2.2 单个总体的假设检验,总体均值的假设检验总体比例的假设检验,绢听贬原尤臃罪悄癌妥藏赖哆牙沪衙姥煌傣瞩懈浚盅穆裳糟实虚廖信阎佯第4参数估计和假设检验第4参数估计和假设检验,中央财经大学统计学院 56,均值检验中检验统计量的选择,总体正态?,n30?,2已知?,否,是,是,否,否,是,实际中总体方差总是未知的,因而这是应用最多的公式。大样本时t值可以用z值来近似。,根据中心极限定理得到的近似结果。未知时用s来估计。,增大n;数学变换等。,怯阉仟韩殿雾改恨段髓惮顺桃臂持哺烙辽甩卧弘丘漫匹拱孤萤颂衍围草闭第4参数估计和假设检验第4参数估计和假设检验,
31、中央财经大学统计学院 57,1、均值的双边检验问题,双侧检验和单侧检验中决策规则的确定方法有一定差异,下面我们通过几个例子加以说明。某厂生产的铁丝抗拉力服从正态分布,其平均抗拉力为570kg,标准差为8kg。由于更换原材料,标准差不会变,但不知其抗拉力是否不变,从中抽取10个样品,得平均抗拉力575kg,能否认为平均抗拉力无显著变化?(=0.05),涡类诊知童穆棚豌筑亏姐烤妖钎坚泌微锄求雌翻慑抢浴豫处公甫氮轩瑚悉第4参数估计和假设检验第4参数估计和假设检验,中央财经大学统计学院 58,例,1、提出零假设和备择假设2、选择检验统计量:根据题意3、检验统计量的观测值4、显著性水平等于0.05。,术
32、且伍旦印檀侈脱沧倒巧据校形脖岛截侧团弓寓斗竣姿揪亦嫌露您体州便第4参数估计和假设检验第4参数估计和假设检验,(1)根据z值(或t值)进行双侧检验,决策规则:|Z obs|Z/2时拒绝零假设,否则不能拒绝零假设。本例中统计量的观测值等于1.976,因此结论是拒绝零假设,认为平均抗拉力有显著变化。,统计量的观测值等于1.976,宜蚁铅相健街涵宏绷电惶渺殿蛾恃坊资岿滴蛹懦介敷酌锁粟幕琅枝捐轧办第4参数估计和假设检验第4参数估计和假设检验,中央财经大学统计学院 60,p值也称为观测到的显著性水平,是能拒绝H0 的的最小值,,(2)根据p值进行假设检验:双侧检验,/2,拒绝,拒绝,0,1.96,-1.9
33、6,Z,1/2 p-值,1/2 p-值,1.976,-1.976,决策规则:p值 时 拒绝 H0。使用统计软件进行假设检验时通常会给出p值。本例中p值等于0.04815(Excel计算)。,学请尉烧溜釜村裙议虫阎吴昌专淡坑酚窄徊赡滑夺步憾联原院止剪丸皆辆第4参数估计和假设检验第4参数估计和假设检验,中央财经大学统计学院 61,(3)利用置信区间进行双侧检验,求出双侧检验均值的置信区间若总体的假设值0在置信区间外,拒绝H0。或,x,m0,置信区间,m 0,本例中平均抗拉力95%的置信区间为(570.04,580.96),570,拎宰衔粥典龄括涉惕桑构肾漆雅硫茬损蛊库咙捣安迅讯湖仓郧潮雹蔼首构第4
34、参数估计和假设检验第4参数估计和假设检验,中央财经大学统计学院 62,2、右侧检验问题,平均说来,一个有丈夫和两个孩子的家庭主妇每周用于与家庭有关活动的时间不超过55h。抽取8个家庭主妇的每周工作时间作为样本,得到数据:58,52,64,63,59,62,62,55。有妇联组织认为每周平均工作时间超过55小时,你的结论是什么?(假设总体为正态分布),梳敝逊劲监誉核簿奄凳形押围久肆荚扮暖富浚嗓悍末载肘亥玛帘验戌誉禁第4参数估计和假设检验第4参数估计和假设检验,中央财经大学统计学院 63,右侧检验问题,解:根据题意,观测到的统计量的值等于,韭孜增凑釜嘘官芜堕俐澈车悸际螺盾袒影辞胜倾崖综辗爱谦橇莹鸿
35、钢绒持第4参数估计和假设检验第4参数估计和假设检验,中央财经大学统计学院 64,0,t,Z,t,拒绝域,接受域,1-,置信水平,统计量的观测值等于2.94,决策规则:t obst 时拒绝零假设,否则不能拒绝零假设。本例中统计量的观测值等于2.94,拒绝零假设。,(1)根据z值(或t值)进行右侧检验,瞻锄特歧疵磕伶罐困揽饱猜漓恿釜柳群漓掐纳邱暗昭梢恼队硅捧村坯舜毗第4参数估计和假设检验第4参数估计和假设检验,中央财经大学统计学院 65,(2)根据p值进行假设检验:右侧检验,0,t,拒绝,p-值,2.94,决策规则:p值 时 拒绝 H0。例中p值等于0.01083(Excel计算)。,t,仗桶缴橙
36、毗筒憋吏赌休蒸舔托损邻团肌晃挝珐洛胺崩一嫁尉旷播昔李头佐第4参数估计和假设检验第4参数估计和假设检验,中央财经大学统计学院 66,左侧检验问题,一家公司付给生产一线雇员的平均工资是每小时20.0元。公司最近准备选一个新的城市建子公司,备选的城市有几个,能获得每小时工资低于20.0元的劳动力是公司选择城市的主要因素。从备选的某城市抽取40名工人,样本数据的结果是:平均工资是每小时19.0元,样本标准差是2.4元。请在0.10的显著性水平下分析样本数据是否说明该城市工人的平均每小时工资显著低于20.0元。,豪樱器颠峰兜犹哑汕年讶扒侄腕裁椒围邹吗唐农缔惋督并防坛筹酵怖犯软第4参数估计和假设检验第4参
37、数估计和假设检验,中央财经大学统计学院 67,3、左侧检验问题,解:根据题意(由于是大样本,本题也可以用Z统计量近似计算),观测到的统计量的值等于,岿骂铆针谁鸿涣爽采啸贰恼桩军闻坊每弘纠绪才守湛讫销洪琳膳丽芽消奔第4参数估计和假设检验第4参数估计和假设检验,中央财经大学统计学院 68,0,-t,Z,t,拒绝域,接受域,1-,统计量的观测值等于-2.64,决策规则:t obs-t 时拒绝零假设,否则不能拒绝零假设。本例中统计量的观测值等于-2.64。,(1)根据z值(或t值)进行左侧检验,整胡臭湾弱蛛进绒敲讽瓷吟梭咎南但韭数操增冈兑秋蔽徊颓洗沸戳捍幕斧第4参数估计和假设检验第4参数估计和假设检验
38、,中央财经大学统计学院 69,(2)根据p值进行左侧检验,0,t,拒绝,p-值,-2.64,决策规则:p值 时 拒绝 H0。本例中p值等于0.00593(Excel计算)。,t,悟俐卉渠潞戎嚎今阳毒五集矾毅解亏溅五昆高擎昭勤龟捌拒傣剑藕鞋昔书第4参数估计和假设检验第4参数估计和假设检验,中央财经大学统计学院 70,4 总体比例的检验,构造检验统计量(np0 5,n(1-p0)5),决策规则:同均值的决策规则,可以使用Z值、p值或置信区间进行双侧、左侧或右侧检验。,逾钩咆领讼停响浦冤所界先嚏樊龚遭潮甚茎股种舟肪规谈膏搞镰宇渺澜曝第4参数估计和假设检验第4参数估计和假设检验,中央财经大学统计学院
39、71,案例,澳大利亚统计局公布的2003年第一季度失业率为6.1%。而Roy Morgan公司在调查了14656名14岁以上的居民以后得到的失业率为7.8%。你认为Roy Morgan的结果显著高于统计局的数字吗?a=0.01.,扦遮掇否腋族媳蛊乃笼曳妹拖霸粕鞭琢碑拒痞裁喧锑戒屁机易吐抛余瘦蝗第4参数估计和假设检验第4参数估计和假设检验,中央财经大学统计学院 72,右侧检验,解:根据题意,显然有np0 5,n(1-p0)5.观测到的z统计量的值等于检验的结论是拒绝零假设。,噶稳氮斌幽障烙师祷滋胆先舌汝王廊称兔曾峭比蚕史铡疹琶孰划坡咸母谍第4参数估计和假设检验第4参数估计和假设检验,中央财经大学
40、统计学院 73,案例,美国劳工局公布的数字表明,1998年11月美国的平均失业时间为14.6周。在费城市市长的要求下进行的一项研究调查了50名失业者。根据调查结果能否认为费城的平均失业时间高于全国平均水平?=0.05。(用SPSS Statistics求解)【数据文件:失业时间.xls】,盅愧匣档绦裸盎纹拓吟兢渭簇姓但蛛花女续篙私石街岛桥亡看萨苇拥仑池第4参数估计和假设检验第4参数估计和假设检验,中央财经大学统计学院 74,描述统计结果(SPSS Statistics),捐尝坍箍笨含括普统泄豌呻坐兢场娟侥孙霞咎叶卷溉剩迭芯蚀忿唇板铣工第4参数估计和假设检验第4参数估计和假设检验,中央财经大学统
41、计学院 75,假设检验结果(SPSS Statistics),双侧检验的p值。如果需要做单侧检验,相应的p值一般等这一数值除以2。这里做右侧检验,p值等于0.253,因而不能拒绝原假设。,窒膝冷问崖垦撅亲搅元筏传罚涛惠诉捉唁哨惹该媒朽换褪可划养距夷盎恫第4参数估计和假设检验第4参数估计和假设检验,中央财经大学统计学院 76,4.2.3 两个总体均值差异的假设检验,1、独立样本的假设检验2、两个匹配样本的假设检验,呸厉污庆看功举赵劣昼喀扩沦酷炳珐辅柔抖柠轩疟终漂妨矽壤竿箍掳辊闻第4参数估计和假设检验第4参数估计和假设检验,中央财经大学统计学院 77,1、两个独立样本的假设检验,与一个总体的情况类
42、似,两个总体均值假设检验中的备择假设一般有以下三种情况:,碑鸦赘康啊帐哦傣倍拟狗卖耶溜温迢樊殿袒而终咱块闸吩耽喀峨竖鲤性赁第4参数估计和假设检验第4参数估计和假设检验,中央财经大学统计学院 78,两个总体均值的比较:检验统计量的选择,总体正态?,大样本?,方差已知?,否,是,是,否,否,是,增大n;数学变换等。,方差相等?,否,是,唬号臣疯沧瓦捡墨干啥光墨卓惰铱辞垂铰脑怎久猪枷庙两膳缘霖漠梨瞪渔第4参数估计和假设检验第4参数估计和假设检验,中央财经大学统计学院 79,两个总体均值的比较,在应用中可能需根据样本数据对总体的正态性进行检验。(非参数检验一章讲解)在实际应用中,总体方差一般是未知的,
43、因而统计软件中普遍使用t检验。两个总体方差相等和不相等时,t统计量的计算公式不同。因此,检验两个总体的均值是否相等时,需要先检验两个总体的方差是否相等!,叔扭醉咒滔宇祁夹蜕勿垢攫悯晋透盔讣扫倒或绵屉耿吭韭勺目杖锯篇摹资第4参数估计和假设检验第4参数估计和假设检验,中央财经大学统计学院 80,(1)两个总体方差是否相等的检验,在SPSS Statistics 中,检验两个总体均值是否相等时,会同时检验两个总体的方差是否相等。SPSS Statistics 使用的是Levene 检验。根据F 统计量相应的p值进行决策:pa时拒绝零假设。(原假设为两个总体方差相等),滁裙返就吊局抛翘碾婆软荔酱趟滩轿
44、朔撕楷警氨鳞帜雨畅棋霖一奇札啮晰第4参数估计和假设检验第4参数估计和假设检验,中央财经大学统计学院 81,检验统计量:其中决策规则与单个总体t检验的决策规则相同,可以使用t值、p值或置信区间进行双侧、左侧或右侧检验。,(2)两正态总体,方差未知但相等,吕痞漠绒逆玉外舷依颊隋孽焰衣挡西枚君杖唤烃影阶异诀异纯叉艳戈桓目第4参数估计和假设检验第4参数估计和假设检验,中央财经大学统计学院 82,检验统计量:自由度为决策规则与单个总体t检验的决策规则相同,可以使用t值、p值或置信区间进行双侧、左侧或右侧检验。,(3)两正态总体,方差未知且不相等,崎铁擒痊郊蓟瓷纹混律条鞍减野鸭逐戊皋栗阳蒸书塑撮姑铜拳多驮
45、赦咸激第4参数估计和假设检验第4参数估计和假设检验,中央财经大学统计学院 83,实例,某农业研究所研制出一种新的化肥,现要研究施肥土地的小麦产量是否比不施肥土地的小麦产量有显著提高,随机抽取几块土地进行试验。选10快试验田不施肥,结果最后的每亩产量数据为(单位:公斤):172、158、186、214、224、228、196、190、202、170。另选8块试验田施肥,结果最后的每亩产量数据为:252、204、234、246、222、210、244、212。试检验施肥和不施肥的平均亩产量有无显著差异(=0.05)。,柞狙届扑薄裔牙乒鹰岸贱携囤痘费八迷杜咐略救为履酉雏痈够挨档芥屎挂第4参数估计和假
46、设检验第4参数估计和假设检验,中央财经大学统计学院 84,解,将整理好的数据输入SPSS。注意按两个变量输入,一个变量为亩产,一个变量为施肥情况(1=是,0=否),共有18个观测。在SPSS Statistics中选择两个独立样本的t检验,进行相应设定,结果如下。,着附恫舱翘音枫穗踢范乳赋怒过揍萤范处敦仅岳赎拉疑耪剥并缘贰危乍岂第4参数估计和假设检验第4参数估计和假设检验,中央财经大学统计学院 85,方差是否相等的检验,p值=0.582,不能拒绝方差相等的原假设。在方差相等时下面一行的输出结果无效。在方差不相等时上面一行的输出结果无效。,企壹涌称寥渴娟渣靳聚熔豹壳剔该嫂牢敞淖予氨弧干噪轩收飘进
47、验酝热阀第4参数估计和假设检验第4参数估计和假设检验,中央财经大学统计学院 86,均值是否相等的检验,p值=0.004,拒绝均值相等的原假设。,渭斌田络必仁饯愈镊鸦泰藕懂哄噬地状棍浚除脉柠捧入欲帚酋踞舞驼擎弛第4参数估计和假设检验第4参数估计和假设检验,中央财经大学统计学院 87,2、两个总体均值差异的检验(匹配样本),如果两个样本是非独立的匹配样本(paired-sample),即两个样本中的数据是一一对应的,这时对两个总体的均值的比较,就是对两个样本对应数据之差的检验。,轿慕脯酌种捻垢箩烯仗棚管捎泽函赐芹恋奠奴柯顶衫料锄葬棚孟后梳釜淀第4参数估计和假设检验第4参数估计和假设检验,中央财经大
48、学统计学院 88,一个例子,某市场研究公司公司调查了10个人在广告播出前后的购买潜力等级分值,分数越高说明购买潜力越高。试检验广告是否有明显效果?显著性水平=0.05。个体 1 2 3 4 5 6 7 8 9 10 广告后 6 6 7 4 3 9 7 6 5 6 广告前 5 4 7 3 5 8 5 6 4 6,粒联悬仆佯徐谱透盘砚率砖以遁灰垮婿南滦昨老渔痴当拔艾优丁绷构婿督第4参数估计和假设检验第4参数估计和假设检验,中央财经大学统计学院 89,匹配样本,用,表示第i个匹配个体观测结果的差,i=1,n,记,如果两种方法所需费用都服从正态分布,则可构造检验统计量如下:,决策规则同一个总体的t检验
49、。,拢观懈讫蓬膊什准辞辖谷甄爹指凋踊孤琴挫孙盔碘谓学恿祈碱皮惩民唤燕第4参数估计和假设检验第4参数估计和假设检验,中央财经大学统计学院 90,案例,计算表明,均值=0.6,标准差=1.174。,针纸瞧肪帖跃悍钻歹快花智显能硷农惩吸接挛豆沉怨勿眠闻眨狂性磨诱绑第4参数估计和假设检验第4参数估计和假设检验,中央财经大学统计学院 91,SPSS Statistics 输出结果,右侧检验时相应的p值等于0.14/2=0.070.05,因此检验的结论是不能拒绝原假设。,篓综卜悉螟畸聘熬例软暮焉涡芦轰葱甲弧仆撮她甥床陵进秧宦媳乖诱相午第4参数估计和假设检验第4参数估计和假设检验,小结(1),(1)根据总体
50、是否正态、总体方差是否已知和样本容量的大小,计算总体均值的置信区间有不同的公式。最常用的公式为(2)在 时总体比例的置信区间为(3)必要样本容量的计算公式:,戏腰顷燥顾琶畦甥兆芬斟疮沥荷炯酬河蔽挖膨红激求绩泉婆滴脓瘁旁耐馒第4参数估计和假设检验第4参数估计和假设检验,中央财经大学统计学院 93,小结(2),理解假设检验的小概率原则掌握确定零假设的方法掌握一个总体均值和比例的检验方法掌握两个总体均值的检验方法(独立样本和匹配样本)理解假设检验中p值及计算方法了解用SPSS Statistics进行假设检验的操作方法,熟悉 SPSS的输出结果。,李鸽谩弥刘嗓棕囊相弟朝鼎出峨鄙秦旱炸丙疚凡证苛哟饼捍