中科大概率论与数理统计讲义06假设检验.docx

上传人:夺命阿水 文档编号:393169 上传时间:2023-05-18 格式:DOCX 页数:17 大小:40.89KB
返回 下载 相关 举报
中科大概率论与数理统计讲义06假设检验.docx_第1页
第1页 / 共17页
中科大概率论与数理统计讲义06假设检验.docx_第2页
第2页 / 共17页
中科大概率论与数理统计讲义06假设检验.docx_第3页
第3页 / 共17页
中科大概率论与数理统计讲义06假设检验.docx_第4页
第4页 / 共17页
中科大概率论与数理统计讲义06假设检验.docx_第5页
第5页 / 共17页
点击查看更多>>
资源描述

《中科大概率论与数理统计讲义06假设检验.docx》由会员分享,可在线阅读,更多相关《中科大概率论与数理统计讲义06假设检验.docx(17页珍藏版)》请在课桌文档上搜索。

1、第六章假设检验教学目的:1)理解假设检验的一些基本概念:零假设、对立假设、两类错误、拒绝域、显著性水 平、功效.2)学会将实际问题转化成假设检验问题来处理.3) 一样本和两样本正态总体均值和方差的假设检验.4) 0-1分布参数的假设检验.5)拟合优度检验、列联表的独立性和齐一性检验.?6.1基本概念和问题的提法?6.1.1零假设,对立假设,两类错误,拒绝域,显著性水平,功效在参数估计问题中,常常在抽样前先对未知总体作一些假定.例如假定总体X服从 正态分布,假定某个正态总体的方差为一个已知值等等.在数理统计中,关于总体分布 的概率性质的假定称为(统计)假设.抽样前所作出的假设是否与实际符合,可以

2、用样本 所提供的信息来检查,检查的方法与过程称为(统计)检验.假设检验问题就是研究如何 根据抽样后获得的样本来检验抽样前所作出的假设.首先,由一个例子引出一些基本概 念.例611.某饮料厂在自动流水线上罐装饮料.在正常生产情况下,每瓶饮料的容量(单 位:毫升)X服从正态分布N (500, 102)(由以往的经验得知).经过一段时间之后,有人 觉得每瓶饮料的平均容量减小到49。,于是抽取了9瓶样品,称得它们的平均值为i = 492 毫升.试问此断言是否正确?即问平均每瓶饮料的容量仍是500毫升还是变成490毫升? 假定标准差10毫升不变.在这个问题中,设经过一段时间后罐装饮料容量X的平均值为,则

3、由题意可设X s N (, 102).记x , . . . , X9为取自这个正态总体X的一组样本观测值,则了 = ; 3 Xi = 492.我们需要在“饮料平均容量为500毫升与“饮料平均容量为490毫升”之间作判断 即在 = 500和“ = 490”之间作判断.数理统计中,把它们看成两个假设 习惯上,称 前者为原假设或零假设,记作Ho;后者称为备择假设或对立假设,记作或Ha.所谓检 验Ho : = 500 O Hi : = 490.就是要根据样本判断究竟是“Ho成立还是Hi成立.断言Ho成立称为接受Ho;断言Fh成 立”称为拒绝Ho .下面讨论如何检验上述假设,即给定一个接受或者拒绝零假设

4、的准则.设从总体中 抽取一个样本K ,. . ., Xn,我们可以用极大似然估计T = S (称之为检验统计量)来估 计 .由于该估计值接近 (尤其是当样本量较大时),故当T的绝对值小的时候有利于HI 而不利于HO ,此时应该拒绝HO .我们可以事先取定一个常数 ,称之为临界值,当T的取 值小于该临界值时拒绝Ho,即样本满足W = V 中时拒绝Ho,称W为拒绝域.即样本的取值落在拒绝域中,就拒绝Ho,否则不能拒绝之. 一个拒绝域就对应于一个检验方法.现在的问题是T应该取多大?这涉及到两类错误. 、 事实 、Ho成立Hi成立接受HO不犯错第类错误拒绝HO第I类错误不犯错称实际上Ho成立但是它被拒

5、绝这个错误为第I类错误(弃真),而实际上Ho不成立 但是它被接受”这样一类错误为第H类错误(存伪).由于我们的方法是基于观测数据,而 观测数据是带有随机误差的,故难免在做出决策的时候犯错,我们能做的是控制犯错的 概率一个理想的检验应该使这两类错误的概率都小,但是在实际问题中不可能使这两 类错误一致地小:要让犯第I类错误的概率小,应该让T小,而要让犯第II类错误的概率 小,则T不能太小.解决这个矛盾的一个方法是在控制I类错误的基础上,尽量少犯第H 类错误(在下一小节中我们讨论如何设定假设时会提到,应该将受保护对象设为零假设, 故犯第I类错误的严重性更大,因此必须尽量避免犯第I类错误).具体地,选

6、定一个小的 常数。,取T使得犯第I类错误的概率,即T小于T的概率小于。.称。为显著性水平.理想 情况下,取得恰好满足Ph(T Tf则称T为临界值.如果零假设成立但拒绝了零假 设,则称犯了第I类错误,如果对立假设成立但接受零假设,则称犯了第H类错误.如对 任意的0eo,犯第I类错误的概率Pe(T(X1,. . .,Xn)eA)小于或等于某个正的常数), 则称。为显著性水平.显然显著性水平不是唯一的,事实上,如果。是一个显著性水平, 则任意大于。的数都是显著性水平.实际中通常采用显著性水平最小的那一个.一个检 验对应于一个拒绝域,称B() = P (Ho被拒绝)为检验的功效函数.如果检验的显著性

7、水平为 ,则当6 e Oo时,B() 2 .而当6 e 0,我们希望功效值越大越好(这样犯第 类错误的概率1二()就越小),所以功效可以作为评价一个检验优劣的准则.?6.1.2假设检验问题的提法在有时候需要自己判断如何提假设检验问题.在建立假设检验问题时有两个原则O原则一:将受保护的对象置为零假设.如我国按照以前的司法制度,公安机关抓到 嫌疑犯后,很多情况下要犯人自己证明无罪(有罪推断),这对嫌疑犯很不利,从而容易 导致冤案.现在的司法制度则总假定嫌疑犯是无罪的,要司法部门证明其有罪(无罪推 断),这样做大大地有利于保护公民的利益,如果要将真正的嫌疑犯绳之以法,则司法部 门必须有充分的证据,这

8、样做可以有效保护公民的权益,对司法部门要求也变高了.又 比如药厂生产出一种新药,在上市前要通过食品与药品监管局的检验.显然使用药品的 病人是应该受保护的对象,这时应该设定一个有利于病人的命题作为零假设,这个命题 就是“新药不比安慰剂效果好,以尽量避免病人用无效甚至有副作用的新药.当然,对立 假设就是“新药比安慰剂效果好.将检验的显著性水平设定得较小,以保证零假设不 被轻易推翻.在实际问题中,如果根据某个合理的检验方法发现零假设被推翻,则有充 分的理由认为零假设不成立而对立假设成立,这是因为万一零假设成立而被误据的概率 不会超过。;另一方面,如果发现零假设未被拒绝,并不表明有充分理由接受零假设,

9、而是因为零假设被保护得较严密以至于未被拒绝.原则二:如果你希望“证明”某个命题,就取相反结论或者其中一部分作为零假设(类 似于反证法).这种提法往往是在两个假设命题中不太清楚哪个应受保护,此时可以借 用司法制度里的“谁主张,谁举证,即若想用统计方法向人证明一个命题,则将那个 命题置为对立假设.注意这里的证明不是数学上的严格证明,而是允许犯错的一种统计 推断方法.用统计方法证明一个命题不是一件容易的事情,所以如果没有足够把握,人 们应该避免用统计方法去证明一个命题.上述两原则是统一的:一般不应该让受保护对象去证明一个命题.?6.1.3检验统计量的选取及假设检验的步骤通过解答例6.1.1来说明假设

10、检验的步骤.例6.12 (例6.1.1续)能否在显著性水平0.05下认为饮料的平均容量确实减少到49。毫 升?解:基于统计量,我们采用“标准化过的检验统计量(减均值再除以标准差)T n(r 二 500)=10以使该统计量服从标准正态分布,检验的拒绝域仍取形如 T1 ,我们控制犯第I类 错误的概率等于。,即P(TIVTIle = 500) = .由于e = 500时TI服从标准正态分布,易知上面关于TI的方程的解为TI=二Ua,其中UC 等于标准正态分布的上C分位数,即检验的拒绝域为Tl 0 或者Ho : 2 0o Hi : 0(4) Ho : = o o Hi : o 或者HO : o o H

11、i : (,. .,Xn是取自总体X的一个样本.取显著性水平为。.(1)方差已知时均值的检验先考虑双侧假设,即要检验Ho : = o- Hi : o .由于的极大似然估计为1,取“标准化”后的检验统计量U = U(1 , . . .,Xn)= E -O注意到当HO成立时,U、N(0,1), |UI应该较小,反之当IUl的观测值U(XIxn)较大 时,不利于零假设HO应该拒绝之.所以选拒绝域形如).要求显著性水平为。,即Ph0(U I t ) = ,解得T = ua2.于是检验的拒绝域为U I Ua2.即当观测值(X1, . .,Xn)满足不等式人TiIf - A): Ua/2时拒绝Ho.类似地

12、,检验单侧假设Ho : = o- Hi : o 或者 Ho : o仍然用统计量U ,由于U大时不利于Ho,取拒绝域为 Ua.而检验另一个单侧假设Ho : = o t Hi : o 或者 Ho : W o t Hi : o的拒绝域为U IUa六.虽然我们取的临界值只考虑使检验在 = o处的犯I类错误的概率为。,从检验的拒绝 域的形状上可直接看出来在零假设下 W 0 (或小)时犯第I类错误的概率恒小于或 等于.以上三个检验统称为U检验.例621.随机地从一批铁钉中抽取16枚,测得它们的长度(单位:厘米)如下:2.9423712.988662 3.106234 3.109316 3.118427 3

13、.132254 3.140042 3.1701882.902562 3.128003 3.146441 2.978240 3.103600 3.003394 3.044384 2.849916已知铁钉长度服从标准差为0.1的正态分布,在显著性水平 = 0.01下,能否认为这批铁 钉的平均长度为3厘米?如显著性水平为 = 0.05呢?解:这是方差已知时关于均值的假设检验问题,Ho : = 3 t Hi : 3.u/2.由样本算得检验统计 量的值为U 5 2.16,如显著性水平为0.01,则临界值为SOO5 5 2.58,跟检验统计量的值比 较发现不能拒绝零假设,即不能推翻铁钉平均长度为3厘米的假

14、设;而如果显著性水平 为0.05时,临界值为so25 = 1.96,此时可以拒绝零假设,认为铁钉平均长度不等于3厘米 这个例子说明结论可能跟显著性水平的选择有关:显著性水平越小,零假设被保护得越 好从而更不容易被拒绝.(2)方差未知时均值的检验考虑检验Ho : = o t o ,由于方差未知,可以在将S标准化的过程中用样本方差S2代替总体方差2,得检验统计 量_ V I UoT= tn-1 (2).此检验称为t检验.类似地可以得到另外两个单侧假设的检验拒绝域,列于表6.2.1中.例6.2.2.(例6.2.1续)设方差未知,则在水平0.01和0.05下能否认为铁钉平均长度为3厘 米?解:这是方差

15、未知时关于均值的假设检验问题,Ho : = 3 O Hi : 3取检验统计量为T=A取:二3)S ,检验的拒绝域为IT I t- (a2).由样本算得检验统 计量的值约为2.21,与显著性水平0.01对应临界值熊(0005) 口 2.95比较,不能拒绝零假 设,而与显著性水平005对应临界值1 (0.025) 口 2.13比较,可以拒绝零假设,即在显著 性水平0.01下不能拒绝铁钉平均长度为3厘米的假定,但在显著性水平0.05下可以认为 铁钉平均长度不等于3厘米,此结论与方差已知情形一致.(3)方差的检验考虑假设检验问题Ho : 2 = o Hi : 2 g.对均值已知的情形,由。2的极大似然

16、估计2 = - (Xi 二 )2 i=1可以构造检验统计量在H。下,X2 s 2 , 2的平均值为n,而在HI下,2 = 分 的均值为沙 n,因此当2 的值过于偏离n时应该拒绝HO ,于是拒绝域取成,2 X式W2)、.对均值未知的情形,构造检验统计量2 (n 二 1)S2X = O-o其中S2为样本方差.在Ho下,2 s2.1,拒绝域取成/X2 2 .1 (a2)x .对于单侧假设,可以类似得到检验的拒绝域,参看表621.上述检验称为2检验.例6.23 (例6.2.1续)在水平0.1下能否认为铁钉的标准差大于0.1厘米?解:这是均值未知时关于方差。2的假设检验问题,Ho : 2 2 0.12

17、O Hi : 2 0.12.取检验统计量为2 =勺P ,检验的拒绝域为2 2 .1 (a).由样本算得检验统计量 的值2 口 14.32,与显著性水平0.2对应临界值X覆0l) 口 2231比较,不能拒绝零假设,即 在显著性水平0.1下可以认为铁钉的标准差小于0L表621总结了有关一样本正态总体的假设检验.?6.2.2两样本正态总体的情形为了检验某肥料是否能显著提高玉米产量,可以设计一个随机试验:选择两块条件 一样的试验区把两试验区各分成若干小块,一个试验区的各小块施肥,另一个试验区 的各小块不施肥,最后统计收成,可以采用如下的检验方法来检验玉米产量差别,从而 知道肥料是否有效.设总体X s

18、N (, f)z Y s N (2, ), o 1, 2 0; XiXn 是从总体X中抽取的一个样本,Yi, . . . , Yn是从总体Y中抽取的一个样本.设来自不同总体 的样本相互独立.下面设考虑有关均值差小二2和方差比。/的检验.取显著性水平 为。.举例说明.例6.2.4.甲乙两个农业试验区种植玉米,除了甲区施磷肥外,其他试验条件都相同,把 两个试验区分别均分成1。个和9个小区统计产量(单位:千克),得数据如下甲区 62 57 65 60 63 58 57 60 60 58表6.2.1 一样本正态总体N(,。2).检验对象检验统计量分布拒绝域十 (2已知)A-U = n(T - 0 )N

19、 (0,1)1:IU I ua2U ua .( Utn.1 (2)Ttn. (a) ( X乳a2)或者2 X(a),(2 Xa -1 (a2)或者2 XS -1 (a).仅2 0和 兔和 R2,故将其设为对立假设,假设检验问题是Ho : 1 2.构造基于 - 2的极大似然估计Y- tm+n-2 ().由所得数据算得检验统计量T的观测值为t =二=3.23.-/1.1 由 = 0.1得临界值为tm+n2 (。=t7(0.1) 口 1.33 3.23,因此拒绝Ho,即可以在显著 性水平0.1下认为磷肥对玉米的产量有显著性影响.例6.25在例6.2.4中假定了两个正态总体的方差是相等的,即。彳=/

20、=。2.现在我们 根据样本来检验这个方差齐性的假设,即要检验Ho 可=IoHI :母.1.解:因为。帛和小的极大似然估计分别是1 m1 n扉二(Xi 二 V)2 , l= - (Yi 二 V)2 .r i-1n i.1在e =。fi的极大似然估计-=第伍的基础上可以构造检验统计量S彳(m - l)mF = S(n 二 l)n 注意到F中的分子和分母分别是X和Y的样本方差.当零假设成立时,F s Fmie . 于是拒绝域为F Fmin-I (1 二 a2).由数据算得检验统计量F的观测值f = 1.19,如果取显著性水平。=0.2,那么临界值 为F9,8 (0.1) = 2.44, F9,8 (

21、0.9) = 1F8,9 (0.1) = 0.41 (如果X S Fm,n,则 1/X S Fn,m).易 见0.4IV 1.19 u(a2) U u(a) .( U tnu.n-2 (a2) T tr+n -2 S) ( Fmn(a2)或F Fm (a)(F F”(a2)或F Frn , 7 (a)(F 2和 和* po 或Ho: p 2 po o Hi: p po;(3) Ho :p =po 0 Hi: p po 或Ho: p po o Hi: p 2, TU 和 T Z例6.2.6.某厂产品不合格率通常为05厂方希望知道原料产地的改变是否对产品的质 量发生显著的影响.现在随机地从原料产地

22、改变后的产品中抽取了80个样品进行检验, 发现有5个是不合格品.试问,在显著性水平0下,厂方由此可以得出什么结论? 解:总体X s B(ls p),其中P未知.在显著性水平。=0.1下,产品质量无变化等价 于P = 0.05,故我们要检验Ho : p = 0.05 O Hi : p 0.05.由于7 = 5/80 = 0.0625,因此检验统计量T的观测值_r Po podPo)=0.513.由 = 0.10得临界值So5 = 1.645.易见,Itl 1.645,因此不能拒绝Ho,即在近似显著性水平0.10下可以认为原料产地的改变对该厂产品的质量没有发生显著的影响.?6.3拟合优度检验前面的

23、假设检验基本上是在假定总体是正态的条件下做的,但是这个假设本身不一 定成立,需要收集样本(Xi . . . . , Xn)来检验它.一般地,检验Ho : X服从某种分布可以采用Karl PearSon提出的2拟合优度检验.?6.3.1离散总体情形(1)理论分布不含未知参数的情形设某总体X服从一个离散分布,且根据经验得知总体落在类别, . . . , ak的理论频 率分别为6 ,,现从该总体抽得一个样本量为n的样本其落在类S3 ,. . , ak的观 测数分别为6,.,侏.感兴趣的问题是检验理论频率是否正确,即下面假设是否正确:H0 : P(Xeal) = P1P(Xeak) = pk.这类问题

24、只提零假设而不提对立假设,相应的检验方法称为拟合优度检验.显然,在零 假设下,各类别的理论频数分别为叩I, . . .,叩匕将理论频数和观测频数列于下表:类别a1电. a理论频数P P2 .npk观测频数12.k由大数定律知,在零假设成立时,n/n依概率收敛于p,故理论频数叩与观测频 数川接近.而检验统计量取为v2 _ k Si 二 npM X 一i=1 叩简单地,就是y2 .(。二 E)2其中O为观测频数,E为期望频数.这个统计量中每项的分母的选取有点讲究,我们可以这样粗略地解释:假设卬服 从POiSSOn分布,则ni的均值和方差均为np,从而(ni二npi)npi的极限分布为标准正态 分布

25、,因此2近似为k个服从自由度为1的2分布的随机变量之和,由于 3(用二np)= 0,故这k个随机变量满足一个约束,从而2的自由度为k二1.事实上,可以严格地证明, 在一定的条件下,X2的极限分布就是自由度为k二1的2分布,但其证明超出本课程的 要求范围.下面给出一个例子来说明拟合优度检验的应用.例631 .有人制造一个含6个面的骰子,并声称是均匀的.现设计一个实验来检验此命 题:连续投掷60。次,发现出现六面的频数分别为97, 104, 82, no, 93, H4 .问能否在显 著性水平0.2下认为骰子是均匀的?解:该问题设计的总体是一个有6个类别的离散总体,记出现六个面的概率分别为Pl,

26、. , P6, 则零假设可以表示为Ho : p = 1/6, i = 1,. . . , 6.在零假设下,理论频数都是100.故检验统计量2的取值为(97- 娜 IOO2 82 哪 loo2哪IOO2 =跟自由度为6二1 = 5的2分布的上0.05分位数(0.2) 口 7.29比较,不能拒绝零假设,即 可在显著性水平0.2下认为一子是均匀的.(2)理论分布含若干未知参数的情形当理论总体总含有未知的参数时,理论频数叩一般也与这些参数有关,此时应该 用适当的估计如极大似然估计代替这些参数以得到Pi的估计的,得到的统计量记为2_ k (川二 np%)2i=1 nP i拟合优度检验的提出者Karl P

27、earson最初认为在零假设下,检验统计量的2的极限分布 仍等于自由度为k二1的2分布,R. A. Fisher发现自由度应该等于k二1减去估计的独 立参数的个数r,即k二1二r.例6.3.2.从某人群中随机抽取1。个人的血液,并测定他们在某基因位点处的基因型. 假设该位点只有两个等位基因A和a,这ioo个基因型中AA, Aa和aa的个数分别为3。, 4。, 30,则能否在005的水平下认为该群体在此位点处达到Hardy- Weinberg平衡态?解:取零假设为Ho : Hardy-Weinberg 平衡态成立.设人群中等位基因A的频率为p,则该人群在此位点处达到Hardy-Weinberg平

28、衡态指的 是在人群中3个基因型的频率分别为P(AA) = p2, P (Aa) = 2p(l二p)和P(aa) = (1二p)2, 即零假设可等价地写成Ho : P(AA) =p2,P (Aa) = 2p(l 二 p), P (aa) = Q 二 p)2.在h。下,3个基因型的理论频!妫ioo p2l ioo 2 pa2(1二pa)和Ioo (1二其中PA等 于估计的等位基因频率05代入2统计量表达式,得统计量的值等于4.该统计量的值 大于自由度为3 -1-1 = 1 (恰好一个自由参数被估计)的2分布上0.05分位数3.84,故 可在0.05的水平下认为未达到Hardy-Weinberg平衡

29、态.?6.3.2列联表的独立性和齐一性检验(1)独立性检验下面考虑很常用的列联表.列联表是一种按两个属性作双向分类的表.例如肝癌病 人可以按所在医院(属性A)和是否最终死亡(属性B)分类.目的是看不同医院的疗效是 否不同.又如婴儿可按喂养方式(属性A分两个水平:母乳喂养与人工喂养)和小儿牙齿 发育状况(属性B,分两个水平:正常与异常)来分类.这两个例子中两个属性都只有两个 水平,相应的列联表称为“四格表,一般地,如果第一个属性有a个水平,第二个属性有b 个水平,称为a b表(见教材p268).实际应用中,常见的一个问题是考察两个属性是否 独立.即零假设是Ho :属性A与属性B独立.这是列联表的

30、独立性检验问题.假设样本量为n,第(i, j)格的频数为nij.记Pij = P (属性A, B分别处于水平i, j), Ui = P (属性A有水平i), Vi = P (属性B有水平j).则零假设就是Pij = UM .将Ui和Vj看成参 数则总的独立参数有a二1 + b二1 = a + b二2个.它们的极大似然估计为曲=,吟=七.Hn正好是它们的频率(证明参看教材).其中值=3刖,.j = = nij.在HO下,第(i, j)格的理论频数为np;j = i.n.jn,因此在HO下, 幻-51 (nj二np)应该较小.故取 检验统计量为2 _ a b Inii 二 ni.n.jn)2i=

31、i= Sm)在零假设下2的极限分布是有自由度为k rir = abl(a + b2) = (a l)(b二1) 的2分布.对于四格表,自由度为L(2)齐一性检验跟列联表有关的另一类重要的检验是齐一性检验,即检验某一个属性A的各个水平 对应的另一个属性B的分布全部相同,这种检验跟独立性检验有着本质的区别.独立性 问题中两属性都是随机的;而齐一性问题中属性A是非随机的,这样涉及到的分布实际 上是条件分布.虽然如此,所采用的检验方法跟独立性检验完全一样.例6.3.3.下面表是甲乙两医院肝癌病人生存情况.需要根据这些数据判断两医院的治 疗效果是否一样.甲、乙两院肝癌的近期疗效甲院I5()88(n12)

32、238(n1.)乙院36(2i)18(22)54(2.)H 186(n.1) o6(n.2)292(n)解:这是一个齐一性检验问题.检验统计量2的观测值为0.1195,远远小于自由度为1 的2分布的上0.05分位数,故可以接受零假设,即在水平0.05下可以认为两个医院的疗 效无差别的.当有某个格子的频数较小时,如果允许的话可以合并格子是每个格子的频数足够 大,实际问题中不允许合并格子(合并后失去了实际意义),此时可以用FiSher的精确检 验法.?6.3.3连续总体情形设(Xi . ., Xn)是取自总体X的一个样本,记X的分布函数为F(X),需要检验的那 种分布中含有r个总体参数我们要在显著

33、性水平下检验Ho : F(X)= F(x; 1 , . . . , r),其中F(x; 1,. . .r)表示需要检验的那种分布的分布函数.例如,当我们要检3佥Ho : X s N (, 2)时,r = 2, 1 = ,出=。2.北 I二 1Fo(x; , 2) =exp - (t )2 dt.上述假设可以通过适当的离散化总体分布,采用拟合优度法来做检验.首先把实数 轴分成k个子区间.,aj,j = l, . . .fk,其中a。可以取二。,ak可以取。.这样构造了 一个离散总体,其取值就是这k个区间.记pj = PHo(aj- , aj的频率fj = nj/n接近,其中nj表 示相应的频数.

34、当Pi的取值不含未知参数时,取检验统计量2 卜(nj 二 rip-X =j. 咱否则取2二卜(%二 np7)2j-1np j其中吟是将Pi中的未知参数换成适当的估计后得到的Pi的估计.拒绝域取为,X2 Xk.-1()、如果Pi中不含未知参数,则r = 0.使用2进行拟合优度检验时T殳要求n 50, np; 5, j = 1, . . . , k,如果不满足这个 条件,最好把某些组作适当合并.例6.3.4.从某连续总体中抽取一个样本量为10。的样本,发现样本均值和样本标准差分 别为二0.225和1.282,落在不同区间的频数如下表所示:区间(-0,二 1)-1,二05)rz0.5, 0)0,0.

35、5)0.5,1)l,o)观测频数25101824IO13理论频数271415141317可否在显著性水平。5下认为该总体服从正态分布?解:设理论正态分布的均值和方差分别为和。2,记第个区间为(a , a, i = 1, . . . , 6,则 样本落在第i个格子的理论概数为IoOP(弧V X 2由 其中X s N (t 2 ).将 =二0.225 和。=1.282代入得到估计的理论频数,列于上表中.Ho :总体服从正态分布由此算得检验统计量2的值约为9.34,与自由度为5的2分布的上0.1分位数Xg(0.1) 口 9.24比较可以拒绝零假设,即可以在显著性水平0.1下认为该总体不服从正态分布.

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 在线阅读 > 生活休闲


备案号:宁ICP备20000045号-1

经营许可证:宁B2-20210002

宁公网安备 64010402000986号