《实用标准偏差与相对实用标准偏差公式.doc》由会员分享,可在线阅读,更多相关《实用标准偏差与相对实用标准偏差公式.doc(14页珍藏版)》请在课桌文档上搜索。
1、标准偏差出自 MBA智库百科(wiki.mbalib./)数学表达式: S-标准偏差% n-试样总数或测量次数,一般n值不应少于20-30个 i-物料中某成分的各次测量值,1n; 标准偏差的使用方法六个计算标准偏差的公式1标准偏差的理论计算公式设对真值为X的某量进展一组等精度测量, 其测得值为l1、l2、ln。令测得值l与该量真值X之差为真差占, 如此有1 = liX2 = l2Xn = lnX我们定义标准偏差(也称标准差)为 1 由于真值X都是不可知的, 因此真差占也就无法求得, 故式只有理论意义而无实用价值。 标准偏差的常用估计贝塞尔公式由于真值是不可知的, 在实际应用中, 我们常用n次测
2、量的算术平均值来代表真值。理论上也证明, 随着测量次数的增多, 算术平均值最接近真值, 当时, 算术平均值就是真值。 于是我们用测得值li与算术平均值之差剩余误差也叫残差Vi来代替真差 , 即 设一组等精度测量值为l1、l2、ln如此通过数学推导可得真差与剩余误差V的关系为 将上式代入式(1)有 (2) 式(2)就是著名的贝塞尔公式(Bessel)。 它用于有限次测量次数时标准偏差的计算。由于当时,,可见贝塞尔公式与的定义式(1)是完全一致的。 应该指出, 在n有限时, 用贝塞尔公式所得到的是标准偏差的一个估计值。它不是总体标准偏差。因此, 我们称式(2)为标准偏差的常用估计。为了强调这一点,
3、 我们将的估计值用“S 表示。于是, 将式(2)改写为 (2) 在求S时, 为免去求算术平均值的麻烦, 经数学推导(过程从略)有 于是, 式(2)可写为 (2) 按式(2)求S时, 只需求出各测得值的平方和和各测得值之和的平方艺 , 即可。 标准偏差的无偏估计数理统计中定义S2为样本方差数学上已经证明S2是总体方差2的无偏估计。即在大量重复试验中, S2围绕2散布, 它们之间没有系统误差。而式(2)在n有限时,S并不是总体标准偏差的无偏估计, 也就是说S和之间存在系统误差。概率统计告诉我们, 对于服从正态分布的正态总体, 总体标准偏差的无偏估计值为 (3) 令如此 即S1和S仅相差一个系数K,
4、K是与样本个数测量次数有关的一个系数, K值见表。 计算K时用到 (n + 1) = n(n)(1) = 1由表1知, 当n30时, 。因此, 当n30时, 式(3)和式(2)之间的差异可略而不计。在n=3050时, 最宜用贝塞尔公式求标准偏差。当n50时的情况, 当n50时,n和(n-1)对计算结果的影响就很小了。 的极差估计由于以上几个标准偏差的计算公式计算量较大, 不宜现场采用, 而极差估计的方法如此有运算简便, 计算量小宜于现场采用的特点。 极差用R表示。所谓极差就是从正态总体中随机抽取的n个样本测得值中的最大值与最小值之差。 假如对某量作次等精度测量测得l1、,且它们服从正态分布,
5、如此 R = lmaxlmin概率统计告诉我们用极差来估计总体标准偏差的计算公式为 (5) S3称为标准偏差的无偏极差估计, d2为与样本个数n(测得值个数)有关的无偏极差系数, 其值见表2 由表2知, 当n15时, 因此, 标准偏差更粗略的估计值为 (5) 还可以看出, 当200n1000时,因而又有 (5) 显然, 不需查表利用式(5)和(5)了即可对标准偏差值作出快速估计, 用以对用贝塞尔公式与其他公式的计算结果进展校核。 应指出,式(5)的准确度比用其他公式的准确度要低, 但当5n15时,式(5)不仅大大提高了计算速度, 而且还颇为准确。当n10时, 由于舍去数据信息较多, 因此误差较
6、大, 为了提高准确度, 这时应将测得值分成四个或五个一组, 先求出各组的极差R1、, 再由各组极差求出极差平均值。 极差平均值和总体标准偏差的关系为 需指出, 此时d2大小要用每组的数据个数n而不是用数据总数N(=nK)去查表2。再如此, 分组时一定要按测得值的先后顺序排列,不能打乱或颠倒。 标准偏差的平均误差估计平均误差的定义为 误差理论给出 (A) 可以证明与的关系为 (证明从略) 于是(B) 由式(A)和式(B)得 从而有 式(6)就是佩特斯(C.A.F.Peters.1856)公式。用该公式估计值, 由于right|Vright|不需平方,故计算较为简便。但该式的准确度不如贝塞尔公式。
7、该式使用条件与贝塞尔公式相似。标准偏差的应用实例1对标称值Ra = 0.160 m m, 试求该样块Rn的平均值和标准偏差并判断其合格否。 解:1)先求平均值2)再求标准偏差S 假如用无偏极差估计公式式(5)计算, 首先将测得的, 15个数据按原顺序分为三组, 每组五个, 见表3。表3 组号l_1l_5R 10.19 20.31 30.24 因每组为5个数据, 按n=5由表2查得故 假如按常用估计即贝塞尔公式式(2) , 如此 假如按无偏估计公式即式(3)计算, 因n=15,由表1查得K, 如此 假如按最大似然估计公式即式(4)计算, 如此 = 0.09296( m )假如按平均误差估计公式即
8、式(6), 如此 现在用式(5)对以上计算进展校核 可见以上算得的S、S1、S2、S3和S4没有粗大误差。 由以上计算结果可知0.092960.09620.09790.10170.1062 即S2 S S1 S4 S3可见, 最大似然估计值最小, 常用估计值S稍大, 无偏估计值S1又大, 平均误差估计值S4再大, 极差估计值S3mm。可以相信, 随着的增大, S、S1、S2、S3和S4之间的差异会越来越小。 就本例而言, 无偏极差估计值S3和无偏估计值S1m, 这说明无偏极差估计是既可以保证一定准确度计算又简便的一种好方法。 JJG102-89外表粗糙度比拟样块规定Ra的平均值对其标称值的偏离
9、不应超过+12%17%, 标准偏差应在标称值的4%12%之间。已得本样块二产,产均在规定X围之内, 故该样块合格。 标准偏差与标准差的区别标准差(Standard Deviation)各数据偏离平均数的距离离均差的平均数,它是离差平方和平均后的方根。用表示。因此,标准差也是一种平均数。标准差是方差的算术平方根。标准差能反映一个数据集的离散程度。平均数一样的,标准差未必一样。 例如,A、B两组各有6位学生参加同一次语文测验,A组的分数为95、85、75、65、55、45,B组的分数为73、72、71、69、68、67。这两组的平均数都是70,但A组的标准差为17.08分,B组的标准差为2.16分
10、,说明A组学生之间的差距要比B组学生之间的差距大得多。 标准偏差(Std Dev,Standard Deviation) - 统计学名词。一种量度数据分布的分散程度之标准,用以衡量数据值偏离算术平均值的程度。标准偏差越小,这些值偏离平均值就越少,反之亦然。标准偏差的大小可通过标准偏差与平均值的倍率关系来衡量。 有人经常混用均方根误差RMSE与标准差Standard Deviation,实际上二者并不是一回事。均方根误差为了说明样本的离散程度。均方根误差root-mean-square error 亦称标准误差,其定义为,i1,2,3,n。在有限测量次数中,均方根误差常用下式表示:,式中,n为测
11、量次数;di为一组测量值与平均值的偏差。如果误差统计分布是正态分布,那么随机误差落在土以内的概率为68。标准差是方差的算术平方根。标准差能反映一个数据集的离散程度。平均数一样的,标准差未必一样。标准差也被称为标准偏差,或者实验标准差。均方根值也称作为效值,它的计算方法是先平方、再平均、然后开方。比如幅度为100V而占空比为0.5的方波信号,如果按平均值计算,它的电压只有50V,而按均方根值计算如此有70.71V。这是为什么呢?举一个例子,有一组100伏的电池组,每次供电10分钟之后停10分钟,也就是说占空比为一半。如果这组电池带动的是10电阻供电所产生的功率。而50V直流电压向10电阻供电只能
12、产生的250W的功率。对于电机与变压器而言,只要均方根电流不超过额定电流,即使在一定时间内过载,也不会烧坏。 PMTS1.0抽油机电能图测试仪对电流、电压与功率的测试计算都是按有效值进展的,不会因为电流电压波形畸变而测不准。这一点对于测试变频器拖动的电机特别有用。均方根误差为了说明样本的离散程度。对于N1,.Nm,设N=(N1+.+Nm)/m;如此均方根误差记作: t=sqrt(N2-N12)+.+(N2-Nm2)/(m(m-1);比如两组样本:第一组有以下三个样本:3,4,5第二组有一下三个样本:2,4,6这两组的平均值都是4,但是第一组的三个数值相对更靠近平均值,也就是离散程度小,均方差就
13、是表示这个的。同样,方差、标准差(方差开根,因为单位不统一)都是表示数据的离散程度的。几种典型平均值的求法 1算术平均值这种平均值最常用。设x1、x2、 、x n为各次的测量值,n代表测量次数,如此算术平均值为 2均方根平均值 3几何平均值 4对数平均值 5加权平均值相对标准方差的计算公式准确度:测定值与真实值符合的程度绝对误差:测量值或屡次测定的平均值与真实值之差称为绝对误差,用表示。相对误差:绝对误差与真值的比值称为相对误差。常用百分数表示。绝对误差可正可负,可以明确测量仪器的准确度,但不能反映误差在测量值中所占比例,相对误差反映测量误差在测量结果中所占的比例,衡量相对误差更有意义。例:用
14、刻度0.5cm的尺测量长度,可以读准到0.1cm,该尺测量的绝对误差为0.1cm;用刻度1mm的尺测量长度,可以读准到0.1mm,该尺测量的绝对误差为0.1mm。例:分析天平称量误差为0.1mg, 减重法需称2次,可能的最大误差为0.2mg, 为使称量相对误差小于0.1%,至少应称量多少样品?答:称量样品量应不小于0.2g。真值:真值是客观存在的,但任何测量都存在误差,故真值只能逼近而不可测知,实际工作中,往往用“标准值代替“真值。标准值:采用多种可靠的分析方法、由具有丰富经验的分析人员经过反复屡次测定得出的结果平均值。精细度:几次平行测定结果相互接近的程度。各次测定结果越接近,精细度越高,用
15、偏差衡量精细度。偏差:单次测量值与样本平均值之差:平均偏差:各次测量偏差绝对值的平均值。相对平均偏差:平均偏差与平均值的比值。标准偏差:各次测量偏差的平方和平均值再开方,比平均偏差更灵敏的反映较大偏差的存在,在统计学上更有意义。相对标准偏差变异系数例:分析铁矿石中铁的质量分数,得到如下数据:37.45,37.20,37.50,37.30,37.25%,计算测结果的平均值、平均偏差、相对平均偏差、标准偏差、变异系数。准确度与精细度的关系:1精细度是保证准确度的先决条件:精细度不符合要求,表示所测结果不可靠,失去衡量准确度的前提。2精细度高不能保证准确度高。换言之,准确的实验一定是精细的,精细的实验不一定是准确的。重复性试验 按拟定的含量测定方法,对同一批样品进展屡次测定(平行试验至少5次以上,即n>5),计算相对标准偏差(RSD),一般要求低于5%