《蒙特卡罗方法在概率统计中的应用毕业设计(论文).docx》由会员分享,可在线阅读,更多相关《蒙特卡罗方法在概率统计中的应用毕业设计(论文).docx(54页珍藏版)》请在课桌文档上搜索。
1、摘要概率分布描述了随机变量的统计规律性,许多常见的概率分布在不同的理论 和实际问题中扮演着极其重要的角色。然而这些概率分布彼此不是相互孤立的,他 们之间都具有一定的联系。本文首先介绍统计学发展概况,然后给出几种常见统计分布的定义和性质, 并详细阐述二项分布与泊松分布的关系,二项分布、泊松分布、/分布、,分布和 产分布与正态分布的关系,/分布与F分布的关系,f分布与尸分布的关系,最后 详细介绍蒙特卡罗方法在概率统计中的应用。关键词:随机变量,统计分布,概率密度函数,蒙特卡罗方法AbstractProbability distribution describes the statistical r
2、egularity of random variable, and many common probability distribution play an extremely important role in different theoretical and practical issues. However, these probability distributions have a certain degree of contact rather than mutual isolation of each other.This paper first introduces the
3、development of statistics, and then provides the definitions and properties of several kinds of common statistical distribution, and explains the relationship between the binomial distribution and the Poisson distribution, the relationship among binomial distribution, Poisson distribution, 2 distrib
4、ution, t distribution and F distribution, the relationship between the 2 distribution and F distribution, the relationship between t distribution and F distribution, finally explains the application which the Monte Carlo method play in probability statistics.Key words: random variables, statistical
5、distribution, density function of probability, the Monte Carlo method目录第一章引言1统计学的研究现状及发展1本文研 的内2本文的结构2第二章一些常见统计分布3二项分布 泊松分布 正态分布/分布8F Pa zj第三章常见统计分布间的关系二项分布与泊松分布的关系二项分布与正态分布的关系泊松分布与正态分布之间的关系.101013131314/分布与正态分布的关系16t 分布与正态分布的关系 19产分布与正态分布的关系20/分布与尸分布的关系21t 分布与 F 分布的关系 * 第四章蒙特卡罗方法在概率统计中的应用蒙特卡罗方法概述蒙特
6、卡罗模拟在概率统计中的应用用蒙特卡罗方法展示几种统计分布间的关系3*C k 曲土2628282936404141外文资料原文.42外文资料译文.46第一章引言研究背景统计学是应用数学的一个分支,主要通过利用概率论建立数学模型,收 集所观察系统的数据,进行量化的分析、总结,并进而进行推断和预测,为 相关决策提供依据和参考。它被广泛的应用在各门学科之上,从物理和社会 科学到人文科学,甚至被用来工商业及政府的情报决策之上。统计学主要又分为描述统计学和推断统计学。给定一组数据,统计学可 以摘要并且描述这份数据,这个用法称作为描述统计学。另外,观察者以数 据的形态建立出一个用以解释其随机性和不确定性的数
7、学模型,以之来推论 研究中的步骤及母体,这种用法被称做推论统计学。这两种用法都可以被称 作为应用统计学。另外也有一个叫做数理统计学的学科专门用来讨论这门科 目背后的理论基础。要了解随机性或是机率必须具备基本的数学观念。数理统计是应用数学 的分支,它使用机率论来分析并且验证统计的理论基础。概率分布描述了随机变量的统计规律性,许多常见的概率分布在不同的理论 和实际问题中扮演着极其重要的角色。然而这些概率分布彼此不是相互孤立的,他 们之间都具有一定的联系。探讨各个概率分布间的逻辑关系,不仅在计算应用中非 常重要,而且在理论研究上也很重要。统计学的研究现状及发展在科学技术飞速发展的今天,统计学广泛吸收
8、和融合相关学科的新理论, 不断开发应用新技术和新方法,深化和丰富了统计学传统领域的理论与方法, 并拓展了新的领域。今天的统计学已展现出强有力的生命力。在我国,社会 主义市场经济体制的逐步建立,实践发展的需要对统计学提出了新的更多、 更高的要求。随着我国社会主义市场经济的成长和不断完善,统计学的潜在 功能将得到更充分更完满的开掘。第一,对系统性及系统复杂性的认识为统计学的未来发展增加了新的思 路。由于社会实践广度和深度迅速发展,以及科学技术的高度发展,人们对 客观世界的系统性及系统的复杂性认识也更加全面和深入。随着科学融合趋 势的兴起,统计学的研究触角已经向新的领域延伸,新兴起了探索性数据的 统
9、计方法的研究。研究的领域向复杂客观现象扩展。21世纪统计学研究的重 点将由确定性现象和随机现象转移到对复杂现象的研究。如模糊现象、突变 现象及混沌现象等新的领域。可以这样说,复杂现象的研究给统计开辟了新 的研究领域。第二,统计科学与其他科学渗透将为统计学的应用开辟新的领域。现代 科学发展已经出现了整体化趋势,各门学科不断融合,已经形成一个相互联 系的统一整体。由于事物之间具有的相互联系性,各学科之间研究方法的渗 透和转移已成为现代科学发展的一大趋势。许多学科取得的新的进展为其他 学科发展提供了全新的发展机遇。模糊论、突变论及其他新的边缘学科的出 现为统计学的进一步发展提供了新的科学方法和思想。
10、将一些尖端科学成果 引入统计学,使统计学与其交互发展将成为未来统计学发展的趋势。统计学 也将会有一个令人振奋的前景。今天已经有一些先驱者开始将控制论、信息 论、系统论以及图论、混沌理论、模糊理论等方法和理论引入统计学,这些 新的理论和方法的渗透必将会给统计学的发展产生深远的影响。统计学产生于应用,在应用过程中发展壮大。随着经济社会的发展、各 学科相互融合趋势的发展和计算机技术的迅速发展,统计学的应用领域、统 计理论与分析方法也将不断发展,在所有领域展现它的生命力和重要作用。本文研究的内容(1) .主要研究方向为一些常见统计分布。(2) .给出这几种统计分布的定义和性质。(3) .详细探究这几种
11、常见统计分布间的内在联系(4) .简述MOnteCarlO方法在概率统计中的应用。(5) .用蒙特卡罗方法展示几种统计分布间的关系。本文的结构第一章主要介绍本文的研究背景以及本文研究内容和结构。第二章分类介绍一些常见统计分布,给出它们的定义和性质。第三章探究这几种常见统计分布间的内在联系。第四章介绍MonteCarI。方法及其在概率统计中的应用,并用蒙特卡罗方法展示 几种统计分布间的关系。第五章为结束语,主要是对本文的研究工作和成果进行总结,并探讨将来的研 究内容和方向。第二章一些常见统计分布二项分布定义一般地,若我们进行次独立试验,每次试验只有两个可能的结果,要么事 件4发生,要么A不发生,
12、且P =尸(A), g = P(N), p + q = l,0vpvl,用X表示这 次事件中A发生的次数,则P(X= m) = C; pmqn-m, m = 0, L,O这个分布叫做二项分布,这种类型的试验叫做重贝努利试验,并记作X 3(%。性质性质 I: P(X =m) O,m = O, 1,.,iPQX = 2) = ( + q) = 1 o2 = 0性质2:若p = 0.5,则称二项分布是对称的;若w.5,则分布是非对称的。 但当越大时非对称性越不明显。性质3:如匕,.工独立同分布,且分布为两点分布,参数为p,则X = K + . + % 服从二项分布Bgp) .性质5:二项分布85,
13、P)的期望和方差分别为E(X) =叩,(X)=叩夕。性质6:二项分布3(,)的矩母函数和概率母函数分别为:M Q) = (q + pet ), Q) = (q + pt)n o性质7:二项分布B(,p)的分布函数/(X)为:mi( ,t) P(X = m) X Ow=0OXVO性质8:当和X给定时,二项分布8(,P)的分布函数尸(x)是p (0 p0,O则称随机变量X服从参数为4的泊松分布,记作X PW .性质性质1:泊松分布的分布律/X =A0,A=0,l,2,;PX =左 = e = ee = 1Ar=OAr=O A 性质 2 :当 kPX=R-1;当 k 时, PX=4PX=Z -1。如
14、4不是整数,则PX=A在k = 4处达到极大值;如 /1是整数,则PX =4在左=义和Z = X-I处同时达到极大值。性质3:泊松分布的分布函数万(X) = Z尸 X =左。当X固定时,F(X) k=0是4的非增函数。性质4:泊松分布是非对称的,但当;I越大是非对称性越不明显。性质5:泊松分布的期望和方差分别为石L) o = l性质8:设随机变量X,., X ”相互独立,且Xj P(4), i = l,2,.,明则EXi尸(又),其中;I = 4+4,。 z = l性质9:设随机变量P(4)和设随机变量X2P(4)独立,则给定X + X2 的值时,的条件分布为二项分布,BP (X1X1+X2=
15、x)-p),其中 =4 /(4 +4)。正态分布定义在实际生活中,许多随机变量如成年男(女)子的高度、重量;加工零件的尺 寸,每包大米(同一规格)的重量;钢的含碳量;胶片的粒数;测量的误差,射击 目标的水平或垂直偏差等都服从同一类分布,叫正态分布。在连续型随机变量的分布中,正态分布占有特殊的地位,因为正态分布为总 体分布的统计理论内容已十分丰富,应用极为广泛,并派生出许多重要的分布, 如t分布、Z?分布、F分布等,讨论这些分布的性质构成了本章的内容。连续型随 机变量的性质可通过分布密度来描述,所以在介绍每一个具体分布时,我们首先 用分布密度来定义它们,然后讨论它们的性质。定义:若随机变量X的概
16、率密度函数是112/(x) = / exp(- (x-u) ),- % 0 对一切 YOVX8 成立。OO8(2) f 于gdx = /f exp-(X w)2tA:-io2/b o2b=-z2 f e、2dy Z12兀12万工、2兀性质正态分布的性质是相当丰富的,这里仅仅列出一些最基本的。性质1: /(x),这个图形有如下性质:a.只有一个蜂,峰值在X = 处,且图形关于直线x = 对称。b.图形无论向左或向右延伸,都愈来愈接近横轴,但不会与横轴相交,即以 横轴为浙近线。 /(x),。越大,图形越胖;。越小,图形越庾。正态分布性质 2:若xN(,/),则y = (-MbN(0,i);反之,若
17、yN(0,i), 则 X=4 + yN(4,b2)0这个性质在应用中非常重要,它告诉我们总可以把一般的正态分布通过线性 变换化成标淮正态分布。在实用中经常需要正态分布的分布函数表,如果对不同 的,都列表的话,这个表将是厚厚的一本书,使用也不方便,有了这个性质, 我们只要将标准正态分布的分布函数列表就够了。性质3:正态分布N(m,o2)的分布函数是户8 = /一OO72bF(X)b1)= -=Kay72rXo=广( ei)()sr用口)记/go,i), o式告诉我们只要研究(外就够了。(x)有如下性质:a. OS) = ;,(x)有两条渐近线y = 0和y = l,从而(x)的中位数是X = 0
18、。b. (-) = l-()c. (x) = (x)f x) = -x(x)o 故(X) = O 的解是X = 0 ,即 X = O是的拐 点。性质 4:若XN(, 则E(X) = D(X) = Wo性质5:正态分布N(,b?)的矩母函数和特征函数为M(r) = exrz + r22), (t) = exit-t22性质6:若yN(),/),则y的中心矩就是它的原点矩,且有2r+1=0,r=0, 1, 2,_(2r)! 2rT oJLt2r0 ,r 1, 2,.2r 2rr!性质7:若XN(q2),则P(- X -ju )=%P(-2X-ju2)%P(-3X-3)=%这个性质在标准制定、质量管
19、理等许多方面有广泛的应用。性质8:若X N(,c2), a, b为任意实数,则a + bX - N(a + b,b1?)证明:因为X N(,/)的矩母函数是M(f) = exp+g72,从而a+bX 的矩母函数是eMSr) = e expSa+g?W)=expz(a +勿/) + /(0Cr)2BP a + bX N(a + b,b22)。性质9:若XN(从吗2)与乂27(2,2)独立,则X + X2N( +/2,0J (x)=()OxO则称随机变量Z2服从自由度为n的/分布,记为/ /()。其中6)为函数,定义为OQ厂(s) = KrS 2v(s0) OO定义2:设n个相互独立并且都服从标准
20、正态分布N (0, 1)的随机变量X1,x2,.Xn,记 =):x,2, / = 1则称随机变量Z2服从自由度为n的/分布。性质性质1:若X与X2%独立,则X + X2zL。这个性质称为开方分 布的可加性。这个性质可以推广至多个随机变量的情形,若X, XwI相互独立,Xj 媒,Z=L ., m ,贝IJX = XI + .+ X“r,其中 = +.+ 勺 o利用这个性质我们可知,若x,则X = K+.+匕,其中X,.,匕独立同分 布于为2。性质 2:若X,则 E(X) = ,D(X) = 2/7 O性质3: /分布的矩母函数和特征函数分别为M(f) = (l-2f)52, 0rO)= MdJC
21、 = 6Z 的数。Xa 5)先是标准正态分布的上侧分位数,即先是满足等式(%) = -a的数。I分布定义定义1:若随机变量了的概率密度函数为L/ + 1、1 (-O-)JC2-+1w(x) =-(1 + -) 2 , OO VXV +OO ()(少打则称T服从自由度为的,分布,记为75)。定义2:设随机变量X, y相互独立,xN(,i), y2(zi),记则随机变量T服从自由度为的,分布,记为T )。性质-|-JC2性质 I: Iim r(jv; A2)=72872 兀性质2:设Xf5),若,则E(X,)不存在。 此点由微积分中判别积分收敛的法则很容易看出。性质3: )分布由于只有-1阶矩存在
22、,故没有矩母函数存在。*)的特征 函数可以求出,但表达式不是很简洁,也没有太大的实用价值,这里就不列出了.性质4: X和X?独立同分布于/(),则随机变量Y = (X2 -X1)/ JXlX21,5)。尸分布定义若有两个正态分布的总体N(M吗2)和N(42,o),我们欲检验和22是否有显著性差异,解决这个问题所用统计量的分布就是本节欲介绍的F分布。 在方差分析中,经常需要检验某个因素是否对指标有显著地作用,这个问题也导 致产分布。在多元统计中有许多复杂的分布,它们可以用分尸布来近似.不难看 出,尸分布在统计中的地位是相当重要的。定义1:若随机变量/的概率密度函数为1川 师一2,十+ x0/(幻
23、q乡ftOOxO则称尸服从第一自由度为加,第二自由度为的尸分布,记为尸尸(加,)。定义2:若随机变量X和丫独立,且X(M, Y -n)9则F = / 服从第一自由度为加,第二自由度为的尸分布,记为 m nF F(m,n) 0性质性质1:当相2, 7*)的众数为(加二2);当m=1或2时,/(x)始终单调 ( + 2)f下降。当机=1时,曲线从+8单调下降趋于0;当机=2时,曲线从1单调下降趋 于Oo性质2:若X F(m,i) , y = lX,则丫尸(小加)。证明:由假设XRw),存在U2(M, 丫/5)且U与丫独立,使得VdrLlJvd mV L/、X =,从而 y = 1 / X 广(,?
24、)777 VnU这个性质在实际中非常有用,因为通常在教科书中列出的是尸分布的右分 位点,如用石,()表示,即尸(XE,(a) = 。但有时需要用到左0分 位点,即找乙,(1一口)使得尸(X石,“(1一&) = 1 一&。这个值在通常的表上查 不到,利用性质2可知尸(a) = l尸”,“(1),利用这个关系就可获得Ei(I 一 2)。性质3:若XT5),贝j2产(IM在应用中,利用这一关系有时将,检验化成尸检验。7,2;,n2 o性质4:若XF(根.),贝IJE(X) = n-2-v、2n2(2 + H-2)D( X)=;mn 2)(? - 4)性质5:尸分布的矩母函数并不存在。性质6: 7(x
25、;八)可用正态分布来近似,其关系是户(X(y),.X n / n 2,.,.其中 =/C ,当加充分大,4时。n 2(n m 2)z 2 V m(n 4)性质7: X 尸(用入),若令ZM=In X ,则相当和都较大时,ZM的分布近似于 N弓(:S+ )。第三章常见统计分布间的关系二项分布与泊松分布的关系定理一:在重伯努利试验中,事件A在每次试验中发生的概率为,它与试验次数有关,如果lim,=40,则对任意给定的机,有 一002 kIim C(l-P)I =TVeT,k=0,1,2, rtcoK!由该定理可知,当二项分布85,P)的参数很大,很小,而4 =叩大小适中时叫 二项分布可用参数为4
26、=他的泊松分布来近似,即2 kIime”(1 =先 -8k!这就是二项分布的泊松逼近。当然应尽可能的大,否则近似效果往往不佳。二项分布的泊松逼近常常被应用于研究稀有事件(即每次试验中事件出现的 概率P很小),当伯努利试验次数很大时,事件发生的频数的分布。实际表明, 在一般情况下,当p0.1时,这种近似是很好的,甚至不必很大都可以,这点从 比较二项分布与泊松分布的概率分布表也可以看出。例如,当p = 0.01时,甚至 =2 时,这种近似程度已经很好了。表3-1说明了这一情况,其中“p = 0.020表3-1二项分布与泊松分布的比较K5p)k gfp /人!012二项分布与正态分布的关系定理二【:
27、设随机变量X“6(, P)(OVPVI= 1,2,.),则对于任意X,. X _ ftpr 1一,Iim O),泊松分布的分布函数PXvx=wAk 7-,与正态分布N(Zl)的分布函数 k8时,O,g)0,则称分布密度函数/;*)一致渐近正态分布N(,?), 记作:fn(x) N(,2)i(n) o引理 1: (1)= 5-T(x),(xl);(x)2x X(2) In(x) = ln2- + (x)nx-x-R(x),(x) o 22其中- T(X)=y -.其中72(x-l)(xl).(xz)12(x-l),810 R(x) = Y3 1。此引理可见文献。 1 0众所周知,自由度为的/分布
28、的密度函数是2w72(n / 2), e-2721 x0 /(x)= 2nftt(n + 2nx) = N(0,1), oo。证明 记随机变量X服从自由度为的/分布,那么E(X) = n, Z)(X) = 2*如果用g(x)表示N(,2)的密度函数,只需证明当8时,/(f,g)f 0即可。 事实上/(-/ nGo 22(-)exp3。对等式2 (-) = jc exp2 AO两边关于求导,可得- n22(-) + 22(-)ln2 =J In(X)JV2 expXAO这里要指出:由于3,所以式中右边的被积函数是连续的,从而可以在积 分号下求导。这样一来,磴)jEln X)= /I-IrI 2。
29、吟)把它代入O式,可得(),cr 1+ In 21F-=2 2nn n/(ftl,g) = -in(4n)-n2-ln (-) + (-l)Iiz4 、* C r /T72-1, n n ”, Ji 八n 12”、,小 11(4ht)In 2In J2 4In/?(一) + ( l)lnT() + In 212222 2222 n n 22 2= 1- + -Tn 22 n 21 1 1 12时,有E(X) = 0, D(X) = nZ 2为了证明,分布的一致渐近正态性,还需如下引理:引理2网 设X2),当2时,有2EIn(1 + )=nn +1 (22 + 12(97oo= J(I-OO2
30、+ lX2 2,H) clx.n而*) 证明由万J(3-)两边关于求导数,注意被积函数是处处连续的,所以可以在积分号下求导。经过 一些计算,不难得到我们的如果,证毕。定理2:若力(X)是自由度为的f分布的密度函数,则-2A(n-2)=N(O,1),58)证明 记随机变量XZ(),用g(x)表示N(O,一2)的密度函数。现在证明当8时,o首先本证明总假设 2 (因为讨论的是 8的情形,可以这样假设)。不难算出:/(力送)=;皿2幻+ ;皿n-2) + ln(l)-ln一/(町)一(等)Eln(l +争+ (4 XXi)()将引理1,引理2代入式O并化简,可得Y(Wl)-叫叫+型2 n 22进一步
31、引用引理1中关于R(%), T(X)的不等式且注意到,/、,八 + 2 、 + 2ln(-) = In(I + -) i-Ir n 2 n -n 2 nz -n 2可得:/(工,g)0/(X)= B(y,) nnx0如果随机变量X服从自由度为团和的尸分布,就用x-Rw)表示。和前 面的分布一样,仍需要有关引理:引理3 设XRm.),当4,有 E(X) =告RX) =2n2(n + n-2)m(n-2)2(n-4)(-) 1(-)Eln(X) =乙4In, En(mX + n) =n咛)9+ ln()定理3若/(xw,)是自由度为根,的F分布的密度函数,则n 12(/7 + /?-2)n n /2( +加 2)-J ;/(- + - J ;; m,n) = N (0,1),(加 8, 8) 一2Y rn(n-4)n-2 -2、m(n-4)有了以上定理,当自由度都很大时,便可以利用正态分布表