《石大医学统计学讲义01绪论.docx》由会员分享,可在线阅读,更多相关《石大医学统计学讲义01绪论.docx(6页珍藏版)》请在课桌文档上搜索。
1、第一讲绪论一、医学统计学的理论基础和研究对象:a)问题的提出:在人们的实践活动中,常常会遇到类似下面的一些问题:一种新的疫苗,如何判断它是否有效?吸烟会不会使得肺癌的机会增加?如何抽检几百或几千人来估计某种病的流行程度?某批产品中合格品究竟有多少?该不该报废?如何消耗最少的资源和人力来得到我们所需要的某种信息?某种实验方法(或饲料配方)有没有明显改进?患者分组是否具有可比性?所观察对象的数量是否足够说明其结论?试验结果的误差有多大?研究结果是否适用于观察样本以外的同类对象?等等.其共同特点:只知道事情的不完全信息,或者是单个实验的结果有某种不确定性。例如:为了知道产品合格与否或它的使用寿命,我
2、们常常需要对它作破坏性检验,此时显然不能把所有的产品都检验一下,而只能满足于对少数几个作品的抽检,这样获得的信息显然是不完全的;要检验疫苗的有效性,就一般来说,接种过疫苗的动物也不一定全不发病,而未接种的也不会全发病.那么发病与不发病的差别究竟到多大时我们才能认为接种是有效的呢?这些均涉及了我们如何评价一些并不确定的实验结果的问题。要从这类问题中得出科学的、可靠的结论,就必须依靠统计学.有人干脆给统计学下了这样的定义:“统计学就是从不完全的信息里取得准确知识的一系列技巧”。另外,当必须根据有限的、完全的信息作出决策时(例如决定一批产品是出厂还是报废,某种新药是否有效等等),统计学可以提供一种方
3、法,使我们不仅能做出合理的决策,而且知道所冒风险的大小,并帮助我们把可能的损失减至最小。其次,如何花费最小代价取得所关心的信息,也是统计学的一大课题(实险设计).不注意这一点可能使辛辛苦苦的工作全成为一种浪费.2 .理论基础:“根据数理统计的原理、方法紧密结合医学实践,研究医药卫生领域中的资料收集、整理、分析和推断的一门应用学科,来分析和解释生物界各种现象和实验调查资料的科学”。随着生物医学研究的不断发展,运用统计学方法来认识、推断和解释生命过程中的各种现象也越来越广泛。运用统计学方法可以帮助人们分析占有信息,达到去伪存真,去粗取精,正确认识世界的目的。3 .研究对象:人体及与人体健康有关的各
4、种具有不确定性的医学数据(变异、数量、同质)。二、医学统计学的主要任务和作用:任务:1、结合专业知识和具体研究的要求进行统计设计2、对收集资料进行整理、做统计描述3、对资料进行统计分析和解释作用:1、保证调查或试验设计的科学性、完整性2、指标的确定应具有特异性、客观性,灵敏性和精密度高3、样本含量足够大,数据真实可靠4、选用统计分析方法正确三、医学统计学的主要内容:1统计设计(design)在进行统计工作和研究之前必须有一个周密的设计,设计的内容包括资料收集、整理和分析全过程总的设想和安排。统计设计可按照在研究过程中对研究对象是否进行干预分作调查研究设计和实验研究设计。调查研究设计:研究者旨在
5、客观地描述研究总体,未加任何干预措施,如:调查了解某地的学龄儿童缺铁性贫血的患病率,某地新生儿畸形的发生率,北京地区溃疡病患病率等,其目的在于了解某一医学现象的实际情况,疾病的危害程度,以便为防治和研究这些疾病提供依据,调查设计主要有抽样方法、调查技术、质量控制技术等。实验研究设计:研究者根据目的(研究假设),主动加以干预措施,并观察总结其结果,回答研究假设所提出的问题。如:研究脂健乳是否有降脂作用,首先建丝脂健乳可以降低血脂,再将条件相似的20只大鼠先用高脂饲料喂养做成高脂血症的模型,然后将动物随机分为实验组和对照组,实验组服用脂健乳和豆奶,对照组单纯服用豆奶,喂养一个月后观察比较两组之间各
6、项血脂指标的差别有无统计学意义,进而得出脂健乳是否具有降低血脂的保健作用的结论。实验设计主要有各种实验设计模型、分组方法、样本量估计等。由于统计设计的质量直接影响着试验结果的准确性、可靠性、严密性和代表性,一旦出现设计上的失误或缺陷,可能导致整个研究的失败。因此,专业设计是研究者对专业知识的把握能力,直接影响着实验的深度和水平,而统计设计是研究者对医学统计知识的正确运用,以保证统计描述和推断正确的基础。调查设计与实验研究设计专业设计统计设计要忒运用专业知识进行设计运用统计学知识进行设计沟客选题、调查(实验)、方法、材料确定设计方案、收集整理资料、确定统计指标、分析和推断方法方面探讨实验、观察结
7、果的适用性和创造性探讨实验、观察结果的可重复性、高效性回答和解决科研课题,验证假说,保证科研结果的先进性减少和控制误差。保证样本的代表性和可靠性,保证实验结果的精确性和可重复性2、收集资料(collectionofdata)方式:1、统计报表2、经常性工作记录3、专题调查或实验3、整理资料(sortingdata)将原始数据进行核对、整理,使其系统化、条理化,对数据进行逻辑检查,纠正错误,提供整理和描述数据资料的科学方法,确定数据的数量特征。4、分析资料(analysisofdata)根据不同的资料类型,选择不同的统计处理方法,计算有关指标,反映数据的综合特征,阐明事物的内在联系和规律。统计分
8、析包括: 统计描述(descriptivestatistics):用统计指标、统计表、统计图等方法,对资料的数量特征及分布规律进行测定和描述。 统计推断(inferentialstatistics):包括如何抽样,以及如何在随机变量的样本值基础上推断概率分布和总体值。统计推断中涉及的各种统计分析方法是本次授课的重点内容。四、 医学统计学在科研中的作用:1、积Jlu表达经跄临床经验的积累在于大量的临床实践。实际上这些经验都可以整理和表达为统计信息,掌握了一定的统计学知识,就可以将积累的经验,通过对资料的收集、整理和分析,转变为正规和系统的统计信息,用以报告或发表,使人类医学知识宝库不断充实和发展
9、。2、完成科研工作生物学是一门实验科学,不管你从事的是生物学的哪一个分支,都不可能完全脱离实验,只进行逻辑推理.而实验所得到的结果几乎无例外地都带有或多或少的不确定性,即实验误差.在这种情况下,不用统计学要想得到正确的结论是不可能的,可以毫不夸张地说,作为一个实验科学工作者,离开了统计学就寸步难行,希望通过这门课程的学习,能够掌握常用的统计方法,尤其是它们的条件,适用范围、优缺点等,从而能够应用它们去解决实践中遇到的问题。否则,他将无法知道其研究结果是否具有科学意义上的可重复性。要一一回答这些问题,要求研究者必须在整个研究过程中贯穿和运用统计学的理论和方法。3、图研究报告粕闽境书刊医学研究中往
10、往要涉及大量的数据,但在撰写研究报告和论文时,只能使用经过整理和归纳的统计指标,并且用规范的统计表和统计图表达。此外,在阅读国外期刊时,如果不具备统计学的基础知识,则不能判断别人研究结果的可信性和局限性,更谈不上吸收和借鉴。五、 医学统计学中几个重要的基本概念:(1)总体(PoPlIIatiOl1)、样本(SamPle)、个体(observedunit)a.总钵:根据研究目的所确定的性质相同的所有个体的某种变量值的集合。如:调查某地1999年正常成年男子的红细胞数,则*对上,该地1999年正常成年男子。阜修:统计研究中的最基本单位,如:一个人、一个家庭、一个地区等。本值(变值):每个人测得的红
11、细胞数。该地1999年正常成年男子的红细胞数就构成一个总体。同质基础:同一地区、同一年份、同为正常成人、同为男性有限总体(finitepopulation):有确定的时间、空间和有限个观察单位,如上例。无限总体(infinitepopulation):没有确定的时间和空间限制,观察单位数为无限。如研究用某药治疗缺铁性贫血的疗效,此时,总体的同质基础是贫血患者,同时用某药治疗,该总体应包括用该药治疗的所有贫血患者的治疗结果。b.样本:从总体中随机抽取部分个体所组成的集合。(随机化原则:总体中每一个观察单位均有同等机会被抽取)(2)参数(Parameter)、统计量(StatiStiCS)统计学中
12、把总体的指标称为参数,把所得样本的平均数称为统计量。(3)误差(error):抽样篌差(samplingerror)由于总体中的个体间往往存在着变异,随机抽取的样本仅是总体中的一部分个体,因而样本测得的指标(统计量)往往与总体指标(参数)存在着差异,这种由于随机抽样而造成的样本的统计量与总体参数之间的差异,称为抽样误差,它既不定量,也不定性。系统篌是:由于设计不严,测量仪器不准确,测量者水平的偏差而造成的,这种误差是定量的,可控的。(4)统计资料对每个观察单位的某项特征进行测量和观察,其特征称为变量,对变量的测值称为变量值,亦称为资料。计量资料(quantitativedata)统计资料类型Y
13、计数资料(qualitativedata)1等级资料(rankeddat)、定量釜料(quantitative(fata)只椰西针贵用专业仪器测量,具有计量单位的测量数据,表现为数值的大小,如身高(Cm)、体重(kg)、血压(kPa)等。特点;每个理家单假的晚察值同有量的区别、定嵯资料(qualitativedata):其观察值是定性的,表现为互不相容的类别或属性(即将观察单位按某种属性或类别分组,所得各组的观察单位数)。特百;每个理察单位的机察值向有质的区别分两种情况:1、无序分类(Uiiorderecfcategories)又称为计数资料a.二项分类检验结果可以是阳性或阴性、治疗结果可以是
14、治愈或未愈、性别属性等,表现为两类间互相对立。b.多项分类某种观察结果为互不相容的多个类别,如血型、职业等。2、有序分类(ordinacategories)乂称为等级资料介于定量测量和定性观察之间的半定量观察结果,如测定某人群血清反应,以人为观察单位,结果分为一、土、+、+四级,又如观察以某种药治疗某病患者的治疗结果,以每个患者为观察单位,结果分为治愈、显效、好转、无效四级,通常有两个以上等级。等级资料与计数资料的区别在于,等级资料虽然是多分类资料,但各个类别存在着大小和程度上的差别。特支,各类之间有程盛的差别资料的转化和分析:根据分析问题的需要,各类变量可以互相转化。如:观察某人群成年男子的
15、血红蛋白量(gL),属数值变量;若分析比较某种病人的血红蛋白水平与正常人有无差别,须按计量资料进行处理。序号正常人组病人组23456789若按血红蛋白正常与偏低分为两类,可按二项分类资料处理;正常人组病人函偏低合计若按贫血的诊断标准将血红蛋白含量分为五个等级:重度贫血、中度贫血、轻度贫血、正常、血红蛋白增高,可按等级资料处理。正常人组病人组重度贫血中度贫血轻度贫血正常血红蛋白增高合计(5)频率(frequency)、概率(probability)医学研究的大多薮现象是随机现象,丽如用同一种治疗方法治疗某病的一群患者,可以知道治疗的结果有四种,但对于一个病人其治疗后的结果是不确定的,此时的每一种
16、可能发生的结果都是一个随机事件(偶然事件、事件)。定义:在n次随机试验中,随机事件A发生了k次,记2)=L则称口)n为随机事件A在n次试验中出现的频率。实践证明,大量的试验中随机事件会呈现出频率稳定性。定义:描述随机事件A发生可能性大小的数值,称为A的概率,记作P(A),简记为P。假如临床观察中治疗200病人的样本,求得治愈率为75%,这只是一个频率。实际应用中,当概率不易求得时,常用nf8时的频率作为概率的估计值。但当n较少时,频率的波动性是很大的,用于估计概率是不可靠的。随机事件概率的大小在0与1之间。P值越接近1,表示某事件发生的可能性越大;P值越接近0,表示某事件发生的可能性越小。严格说,P=I表示事件必然发生,P=O表示事件不可能发生,他们是确定性的,不是随机事件,但可把他们看成随机事件的特例。统计分析中的很多结论都是带有概率性的。习惯上将PWO.05称为小概率事件,表示在一次实验或观察中该事件发生的可能性很小,可以视为很可能不发生。医学统计学的学习重点是:1、掌握其基本知识、基本技能、基本概念、基本方法。建立逻辑思维方法和提高分析问题的能力。2、掌握调查设计和试验设计的基本原则。培养收集、整理、分析统计资料的系统工作能力。3、掌握一套统计软件的使用方法(SAS、SPSS、STATA等)。能够达到在完成医学统计学课程后,独立完成科研论文和正确应用统计方法。