《疾病预后研究的设计与分析方法.ppt》由会员分享,可在线阅读,更多相关《疾病预后研究的设计与分析方法.ppt(80页珍藏版)》请在课桌文档上搜索。
1、疾病预后研究的 设计与分析方法,主要内容:,预后分析的基本概念疾病的临床过程与预后评定指标几个率的概念:累积发病率发病率密度患病率生存率疾病预后研究的基本方法选择恰当的研究策略 疾病预后因素分析的基本要素 队列研究的基本方法与相关强度计算 生存分析与多元回归分析在疾病预后研究的作用,预后分析(Prognostic Analysis),是对疾病发病后发展为各种不同结局的预测。是临床非常实用、对临床很有指导作用的临床研究。是临床医生最常用和最喜欢运用的临床研究之一。,预后分析实际上是一种特殊的因果关系的推导,病因学研究:无病 有病预后研究:有病 死亡(或康复等)治疗学研究:有病(治疗)康复,疾病的
2、预后是指对疾病的转归作出事先的估计。,疾病预后的研究至少包括两个方面:“率”的估计,它包括了发病率、生存率、治愈率、复发率、死亡率等等。研究探讨影响预后的因素,它根据疾病不同亚型和一些临床指标,判断疾病的预后,以及筛选影响预后的指标。,疾病预后因素的分析,实际上也是一种因果关系的推导。即在某一疾病中,寻找哪些因素会影响疾病的结局。,医生接诊病人,作治疗决策时,需要根据疾病的诊断和临床指标,判断其预后,以选择恰当的治疗方案。如狼疮性肾炎WHO病理分型为IV型者,肾脏预后比较差,提示需要积极治疗;狼疮性肾炎肾功能不全者,超声影像学显示肾脏缩小者肾功能恢复的几率甚微,提示保守治疗为主。,医生进行治疗
3、决策时,还需要了解哪些因素会影响疾病的预后,临床治疗可以设法消除这些因素,以改善疾病的预后。如高血压会影响狼疮性肾炎的远期预后,提示在治疗狼疮性肾炎时,如果合并有高血压,需要注意控制血压。,疾病预后因素的分析,实际上也是一种因果关系的推导。即在某一疾病中,寻找哪些因素会影响疾病的结局。,疾病的临床过程与预后评定指标,与流行病学研究不同,临床研究的对象是病人,主要是研究疾病的临床过程(clinical course)。社会进化到了今日,几乎所有疾病都或早或迟会得到不同程度的治疗。因此不同地区间时间生存率的比较,可以反映各地区间对该疾病的诊疗水平的;不同时期的比较,则反映对该疾病的诊治水平是否提高
4、。例如,四十年代以前,系统性红斑狼疮的5年生存率不足30%;肾上腺皮质激素应用与临床以后,六、七十年代上升至60%以上;免疫抑制剂又使疗效有了提高,而今其5年生存率已超过90%。,发病率(incidence)与患病率(prevalence),临床医生开始学习临床流行病学时,发病率与患病率是容易混淆两个概念。虽然发病率和患病率是流行病学研究中常用指标,但在临床研究中也常常用到。,发病率与患病率,患病率:是指在被观察的人群中,患某病的总人数(包括新发病者和已经诊断者)。患病率主要用于横断面的研究。例如,强直性脊柱炎的临床横断面研究发现,强直性脊柱炎患者中髋关节损害者占百分之几(患病率)。中山大学医
5、学院学生中近视眼的患病率:近视眼人数/总学生人数,发病率与患病率,发病率:指某一特定人群在某一特定时间内新发生该疾病的病人数,发病率的计算常常运用在临床随访研究,在临床研究中,复发率、病死率、病残率等的计算也多是用发病率的计算方法,只是名字不一样而已。临床研究中,发病率常涉及到两个的计算指标:累积发病率(cumulative incidence)发病率密度(incidence density),累积发病率(累积死亡率、累积发生率):,累积发病率是指在某一特定时间内,新发生该病的人数占所观察总人数的比率。在临床研究中常常称为累积发生率,如狼疮性肾炎患者10年内发生终末期肾病的累积发生率。累积发病
6、率的计算:累积发病率=某一特定时间内新发病的人数/该段时间内被观察的总人数5年近视眼累积发病率 5年内新发近视眼人数/入学时非近视眼人数生存率=1-累积死亡率,上述公式简单的计算累积发病率,要求每个被观察者都需要被随访相同的时间,这在流行病学研究中,有可能做到,但临床研究中几乎是不可行的。,因为临床研究的对象是病人,发病率在临床研究中多是某一事件或并发症的发生率。这样研究样本不可能同时进入研究组,入组时间有先有后,有些随访在中途失访了,到了结束研究,资料总结分析时,各个病例随访的时间长短不一。为了解决这一问题,发病率的另一个评价指标运用“发病率密度”。,发病率密度是按人和单位时间计算新发病的人
7、数。计算公式如下:,发病率密度:某一特定时间内新发病的人数/该段时间内未发病的总人-时数 注意:分母必须是未发病的,发病者的时间只是从随访起点到发病时止;人-时的“时”可以是年或月,如1个病例随访2年,计为24人月或2人年;发病率密度的单位常常用“/1000人月”、“/1000人年”或“/100人年”等。,例如(假设):,从1999年1月至2001年12月,随访100例关节炎病人口服非甾体抗炎药,有6例出现上消化道出血,这100例中最长的随访了24个月,最短的随访了2个月,加起来是1500人月(6例发病者的时间只计算到发病日为止),那么这组口服非甾体抗炎药的关节炎患者出现上消化道出血的发病率密
8、度为每1000人月4例,或者记录为4/1000人月。,再例如(假设):,中山医学院04级本科生近视眼的发病率:04级:400个无近视眼05年检查10个近视眼(10/400人年)06年检查30个近视眼(30/390人年)07年检查20个近视眼(20/360人年)08年检查30个近视眼(30/340人年)09年检查30个近视眼(30/310人年)04级近视眼发病率:120/1800人年63.8/1000人年,还例如(假设):,中山医学院在校本科生近视眼的发病率:06年9月查无近视眼:06级400个,05级340个,04级300个,03级260个,02级200个。共1500人07年9月检查50个近视
9、眼(其中20个是02级的)这样本年度的近视眼发病率为50/1500人年07级380个无近视眼入组,02级180个无近视眼的离校。这样研究组内无近视眼人数:1450180380165008年检查60个近视眼(60/1650人年)08级 09级,患病率的高低取决于两个因素:发病率和病程,发病率高和病程长均可使患病率增高。所以,如果用患病率作为临床评价指标时,需要慎重分析。例如,某病的防治水平提高了,发病率降低了,但由于生存期延长了,二者相互抵消,使十年前的患病率与十年后的患病率没有什么改变。,时间生存率(survival rate),时间生存率是从观察起点,至一段时间后存活的病例数占总观察病例数的
10、百分比。例如,系统性红斑狼疮的5年生存率、10年生存率等,生存率的计算在本章后面“生存分析”中详细介绍。实际上,(1-累积发病率)就是时间生存率。生存分析的原理是通过发病率密度,推导累积发病率。有兴趣者可以参考统计学教科书。,疾病预后研究的基本方法,选择恰当的研究策略 疾病预后因素分析的基本要素 队列研究的基本方法与相关强度计算 生存分析与多元回归分析在疾病预后研究的作用,几种临床研究策略的区别,横断面研究:顾名思义横断面,即一次性获取所需的资料,这种资料不适宜作预后研究。病例-对照研究:由结局(病例/对照)推导病因(暴露率),也不适宜于作预后研究。队列研究:由病因(暴露/非暴露)推导结局(发
11、病率),预后研究主要的研究策略。病例-对照研究和队列研究的区别在于:前者是由“果”至“因”,后者是由“因”至“果”;,选择恰当的研究策略,在临床流行病学的研究策略中,最常用于疾病预后研究的是队列研究(cohort study)。由于队列研究有一段足够长的随访时间,它可以清晰地显示疾病的时间生存率,如系统性红斑狼疮的1年、5年、10年生存率,狼疮性肾炎5年、10年肾脏存活率等;也可以较客观地确定研究因素对预后的影响。,时间对于预后因素的研究是重要的。,例如以死亡为研究结局,活1年后死亡与活10年后死亡,显然是不一样的结局。如果不考虑时间的话,1年也是阳性结局,10年也是阳性结局,就变成“一视同仁
12、”了。队列研究考虑到了时间的因素,所以更适合于疾病预后的研究;另外队列研究可以采用多元回归的方法进行统计分析,从多个研究因素中筛选出可以影响或预测疾病的转归和预后的因素,同时校正各因素之间相互混杂的影响。,疾病预后研究不可能采用随机临床试验。,因为影响预后的研究因素不可能按研究者的意愿进行随机分配。暴露因素存在与否是取决于自然,例如研究类风湿因子对类风湿关节炎预后的影响,类风湿因子存在与否,及浓度高低是病例入组时已存在的,研究者不可能将病人随机地分为阴性组和阳性组。,横断面研究策略难以胜任疾病预后研究。,因为它是一次性获取全部研究资料,不能计算时间生存率,一般来说也难以验证暴露因素与结局之间的
13、关系。只有当暴露因素一旦出现,长久不变者,如血型、基因位点、某些微生物感染后出现的终身抗体等,而且是以患某一不可治愈性疾病为结局的研究,方可以用横断面研究策略来推断暴露因素与结局之间的关系。否则患病死亡者无法被纳入研究样本,患病已痊愈者也难以准确归类。,病例-对照研究也不能计算时间生存率。,在推断研究因素与结局的关系时,不能顾及时间因素。因此,病例-对照研究在作疾病预后因素分析时,只能用在那些时间不重要的研究。例如危重病的预后因素分析,我们关心的是“全或无”,进入重症监护室的病人,10天后死亡者的预后并不一定就是优于2天后的死亡者,这种情况下大家关心的是结局,而不是时间。这种情况下所进行的病例
14、-对照研究,由于对照组也是在同一大组病人中的阴性结局者,因此这种研究称为“范围内的病例-对照研究(nested case-control study)。,疾病预后研究的基本方法,选择恰当的研究策略 疾病预后因素分析的基本要素 队列研究的基本方法与相关强度计算 生存分析与多元回归分析在疾病预后研究的作用,疾病预后因素分析的基本要素,运用队列研究进行疾病预后因素分析时,首先要确定病人是否存在某因素(暴露与否),然后随访一段时间,再确定病人是否出现阳性结局。因此,首先要确定研究因素和结局因素,并记录随访的时间,这是队列研究的三大基本要素:(随访时间)暴露与否 结局,确定研究的结局(outcome):
15、,即随访的终点(endpoint),又称阳性结局。根据具体的研究,确定结局的定义。最客观的结局是死亡,其它的结局可包括致残、脏器功能衰竭、疾病的缓解等。只要研究的结局与研究的主题相呼应就可以,关键在于阳性结局必须有一个明确和客观的定义,如果阳性结局的判断受主观因素的影响,必须采用盲法。,删失(censore):,在结束研究时,尚未达到随访终点者,称为删失。不称为阴性结局,因为我们不知道结束研究后病人的进展结果如何,要不是结束研究,再随访若干时间,可能就达到随访终点,出现阳性结局了。人总是要死的,如果以死亡为阳性结局,一项足够长时间的随访研究,100%地会出现阳性结局。删失代表不确定性结局,而不
16、是阴性。,失访病例:不能将失访简单地当作删失,队列研究难免会有失访病例,尤其是随访时间较长的研究。我们需要尽量减少失访,以减低研究的偏倚。如果失访的原因与结局无关,可以记录从随访起点到失访的时间,并将失访归入删失病例。但是如果失访与结局有关,如因疗效欠佳而失访者,住院病人因病重而放弃治疗者等等,不宜轻率地将其归入删失,否则会导致偏倚。,研究因素:,也称暴露因素,是预后因素研究的主要内容。可影响疾病预后的因素很多,不同的疾病不尽相同,应结合专业知识,尽可能将各种可能与预后有关的因素,均纳入研究因素,这样预后因素的分析才不会遗漏。一般来说,与疾病关系密切的临床指标,往往比较受研究者的重视。,预后因
17、素的研究须注意下列几个方面的因素:,人口学和社会学因素:如性别、年龄、种族、职业、受教育程度、经济状况;生活习惯与嗜好:如烟、酒、茶,饮食习惯等;疾病的亚型、症状、实验室检查和其它辅助检查结果;各种治疗措施;各种并发症等等。,随访时间:,预后研究需要随访时间,因为时间代表着预后。如果以死亡为研究结局,1年死亡者是阳性结局,10年死亡者也是阳性结局,但活1年与活10年显然是不同的预后。随访的时间必须足够长,使大部分可能会出现阳性结局的病人能够达到研究终点。,预后研究并非均以死亡为结局。,研究者根据研究的内容,还常常可以以“康复”为结局。如一项狼疮性肾炎肾功能不全的预后研究,我们想要研究哪些因素与
18、肾功能的可逆性有关,研究终点是肾功能恢复,需要记录从研究起点至终点的时间,未能恢复者记录由起点至删失的时间。还有一部分病人可能在随访中死亡了,我们不能将其简单地当作删失并记录从起点至死亡的时间,由于死亡者永远都不可能达到研究终点,所以这部分病人的资料应该作为删失,而时间必须是略超出本组最长随访者的时间。,当然,有时候时间并不重要。,例如:手术前对手术成功与否的预测,只是从术前到术后,时间不一定重要;进入MICU(重症监护病房)的病人,我们关心的是病人能不能活下来,如果以死亡为结局,我们很难说10天后死亡者的预后比2天后死亡者好,这种研究可能不一定需要时间。,队列研究的优点,为临床的因果关系提供
19、强有力的信息,该研究是研究因素和结局因素之间有一段连续的时间,使之建立清晰的因果关系;可以直接测量某暴露因素发展成疾病的危险性;可以避免暴露因素测量时偏倚,因为在测量时尚不知结局因素,也可以同时测量已知的混杂因素,以便在统计分析时加以避免;可以用于检测多个结局因素,也可以同时研究一系列的暴露因素;如果暴露因素比较少见,选用对列研究尤其合适,因为这种情况很难用病例-对照研究。,对列研究的缺点:,需要花费很大的人力、物力和时间,尤其对阳性结局的发生率较低者或从因至果的周期较长者。由于对列研究的的暴露与非暴露是按起自然,而不是人为干预,因此研究初期确定的暴露组和非暴露组可能经过一段时间后就变了,如有
20、些吸烟者戒了烟,而有些原来不吸烟者却开始吸烟了,这常常造成偏倚。对列研究中失访也常常导致研究结果的偏倚。,疾病预后研究的基本方法,选择恰当的研究策略 疾病预后因素分析的基本要素 队列研究的基本方法与相关强度计算 生存分析与多元回归分析在疾病预后研究的作用,队列研究的基本方法,队列研究又称为随访研究,对病人随访若干时间后,观察阳性结局的发生情况。为了便于理解,我们暂时不考虑时间和多因素,并以死亡和存活作为两种研究结局,进行相关强度的计算。暴露死亡、存活非暴露死亡、存活,队列研究的相关强度计算,暴露组死亡率:Ie=a/(a+b)非暴露组死亡率:Iu=c/(c+d)总体死亡率:It=(a+c)/(a
21、+b+c+d)相对危险度:RR=Ie/Iu=a/(a+b)c/(c+d)归因危险度:AR=a/(a+b)-c/(c+d)=Ie-Iu=RRIu-Iu=Iu(RR-1)归因危险度百分比:AR%=(Ie-Iu)/Ie=(RR-1)/RR,RR值AR%PAR%,.csi 97 200 307 1409|Exposed Unexposed|Total-+-+-Cases|97 200|297 Noncases|307 1409|1716-+-+-Total|404 1609|2013|Risk|.240099.1243008|.147541|Point estimate|95%Conf.Interva
22、l|-+-Risk difference|.1157982|.0711358.1604606 Risk ratio|1.931597|1.555428 2.398739 Attr.frac.ex.|.4822935|.3570901.5831143 Attr.frac.pop|.1575167|+-chi2(1)=34.43 Prchi2=0.0000,相对危险度(relative risk,RR):,是临床研究最重要的相关强度指标。RR值的含义是,如果研究因素为暴露和非暴露两种情况,则暴露于某因素的人发生阳性结局的概率为非暴露者的(RR)倍;如果研究因素为连续性数值(后面COX回归的方法计算
23、),则研究因素每增加1个单位,发生阳性结局的概率增加(RR-1)倍。如果RR值=1,提示暴露因素与阳性结局间没有相互关系;RR值,则暴露因素可以阻止阳性结局的发生,为保护性因素;RR值1,则暴露因素可以促进阳性结局的发生,为危险性因素。如果RR值的95%可信区间包含了1,提示在=0.05的水平上没有统计学意义,等同于P值0.05。,归因危险度(attributable risk,AR):归因危险度是指暴露组发生阳性结局与非暴露组发生阳性结局之差,它反映出由于暴露因素所致的阳性结局发生率。归因危险度百分比(attributable risk percent,AR%):归因危险度百分比是指在暴露组
24、发生阳性结局的病人中,有多大的比例是由于暴露因素所致的阳性结局。,例如:一项研究,要了解高血压对IV型狼疮性肾炎10年内发生终末期肾病(ESRD)的影响,随访了100例IV型狼疮性肾炎10年,30例高血压者20例出现了ESRD,70例无高血压者25例出现了ESRD。列四格表如下:,运算:RR=20/3025/70=1.87AR=20/30-25/70=0.31AR%=0.3120/30=0.46 提示合并高血压的IV型狼疮性肾炎10年内出现终末期肾病者中,有46%是由于高血压所致,或者说,如果能够消除高血压的影响,这部分中有46%可以避免发展为终末期肾病。,疾病预后研究的基本方法,选择恰当的研
25、究策略 疾病预后因素分析的基本要素 队列研究的基本方法与相关强度计算 生存分析与多元回归分析在疾病预后研究的作用,生存分析与多元回归分析在疾病预后研究的作用,生存分析是预后研究常用的统计学方法。研究结局可以是死亡、痊愈、完全缓解等。为计算时间生存率,每个研究病例均需要登记随访的时间。运算过程主要是借助于计算机软件,作为临床医生,关键在于清楚哪类型的研究用哪一种统计学方法,如何使你的研究资料满足该统计学方法的要求,以及明白计算机运算结果(output)各参数的意义。最好初步掌握一种常用的统计软件,临床医生学习统计学,在满足临床研究需要的同时,以简单实用为主。一般来说,STATA或SPSS已经足够
26、,对于大多数临床医生而言,没有必要去啃SAS统计软件包。,生存分析,生存分析主要用于队列研究的随访的资料。在临床研究中,随访的起点往往不在同一个时间,因为不可能所有研究病例约好同一天起病,研究对象是逐渐入组;同样随访终点(阳性结局)也不可能发生在同一个时间;对于结束研究时尚未达到阳性结局者称为删失。我们不能简单地将删失理解为阴性结局,因为我们不知道他会不会在结束研究后,马上出现阳性结局。,123+456+7+2001.1 2002.12开始 结束,这项研究从2001年1月开始至2002年12月结束,从例1到例7,病人是逐渐入组的,例7是在2001年10月入组,仅随访14个月就结束研究了。例1随
27、访8个月终点,例2随访14个月删失,例3随访20个月终点,例4。,123+456+7+时间,1.0 0 时 间,由于各个病例随访的时间长短不一,删失病例可能由于随访时间不够长而未达到阳性结局。,例如例7仅随访了14个月,说不定16个月就会出现阳性结局。因此,这类资料不能简单地将结局按阳性和阴性进行计算,而必须采用生存分析的方法。在计算时间生存率、半数生存期等时,由于删失病例包含有不确定性的结局,所以生存分析的原理是将整个随访期分成许多小的时段,根据每个时段内总的人数、终点人数和删失人数等,推算删失资料中有多大的比例归入终点,以校正该时段内的死亡率。,生存分析围绕着这样一个精神,有多种计算方法,
28、如寿命表法、Kaplan-Meier法、指数模型法等可以计算生存率,并可画出生存曲线,一目了然地估计不同时间的生存率。除了计算生存率,临床研究更重要的是比较各组间的差异,生存分析在此有独到之处。国内许多临床研究论文只运用t检验或X2检验比较前后或某个点上两组间的区别。对于随访资料,这显然是不科学的。生存分析可以比较两条或多条生存曲线间的区别,如采用Log-rank检验等。,计算生存率和生存期,寿命表法(方积乾P335)乘积极限估计法(Kaplan-Meier)生存曲线指数模型(Exponential Model)生存曲线中位数生存期,预后因素分析,为了有效地指导临床决策,我们需要知道,某个因素
29、是否存在,对预后有什么影响。这就是预后因素分析,这个因素就是研究因素。例如:你要研究高血压是否为发生再次发生心肌梗死的危险因素。,研究因素:高血压(有或无)起点:首次心肌梗死出院日。研究结局:再发急性心肌梗死(阳性结局);未再发急性心肌梗死(删失或未截尾)。随访时间:从起点 阳性结局或删失的时间,数 据,1.0无高血压有高血压0,对两条曲线作假设检验,零假设(H0):两组生存曲线相同。如果检验结果 P值0.05,接受拒绝H0非参数检验方法:近似时序检验(Log-rank)、广义秩和检验等。Cox回归模型:单因素分析、多因素分析。,多元回归分析,在预后因素分析的研究中,往往涉及到多个因素,结局的
30、产生不是孤立的,各因素之间往往相互影响,可以相互协同或拮抗。我们需要从许多的临床指标中筛选出若干个真正与预后相关的因素来。虽然运用上述的方法,可以将各个因素的存在与否分组,逐个进行单因素的分析。但是预后因素分析的研究,如果只用单因素分析,往往会产生混杂偏倚。所以需要采用多因素分析的方法,以校正各因素之间的相互混杂。,不少已发表的论文,只用X2 检验进行单因素分析,虽然不能说有原则性的错误,但如果能增加多因素分析的方法进行筛选,校正混杂因素的影响,结果将会可靠得多。由于多因素之间的相互混杂,在单因素分析中,一些有意义的因素可能被埋没了,而另一些没有意义的因素又被夸大了。,混杂(Confoundi
31、ng)因素:,在确定研究因素时,需注意混杂因素。在临床研究中,常常存在一些非研究因素,它们与研究因素和研究结局之间有一定的关联,使真正的因果关系被其“修正”。这些非研究因素就是混杂因素。,混杂因素有两个条件:,1.可影响结局:如可能促进或阻止阳性结局的发生;2.不均匀地分布于暴露组和非暴露组之间.必须具备这两个条件才能构成混杂,危及研究结果。,我们要研究某因素A是否为某疾病B的致病因子,在这个研究中,我们必须警惕是否存在另一个因素C。这个C也可能影响B,而且不均匀地分布在暴露于和不暴露于A的人群中。研究因素A 结局B 混杂因素C,例:研究吸烟是否导致消化性溃疡,研究因素:吸烟研究结局:消化性溃
32、疡混杂因素:需要考虑饮酒和喝茶等。不均等分布:吸烟人群中嗜茶和酗酒者的比率较高,影响研究结局:饮酒和喝茶均可能促进消化性溃疡的发生。所以如果忽略这些混杂因素,研究结果可能导致过分地估计吸烟对消化性溃疡的危险性。,COX比例危险率回归模型,与生存分析相呼应的回归分析是COX比例危险率回归模型(简称COX回归)。如果时间因素不重要,也可以建立Logistic回归模型。COX回归与Logistic回归的主要区别在于前者与时间有关,后者与时间无关。前者计算RR值,后者计算OR值。,在建立回归模型时:,要先对各个研究因素进行单因素分析。对于连续性的数值变量(如年龄)和有明确等级关系的有序分类变量(如尿蛋
33、白半定量),可以直接进行回归分析;无序分类变量(如血型)和等级关系不太明确的有序分类变量(如狼疮性肾炎的WHO病理分型),则须采用分层回归分析的方法。,协同或拮抗作用,有时我们可能想要证实某两个或多个因素合在一起时,对结局的影响有无协同或拮抗作用。如某多元回归分析初步显示,高血压和顽固性蛋白尿是狼疮性肾炎预后的危险因素。如果你想了解二者有无协同作用,可以将二者相乘合并为一个变量,与原来的两个变量一起放入回归方程中去筛选,如果方程能接受这个新的变量,则提示这两个变量具有协同作用。,建立多元回归模型,单因素分析一方面可初步筛选出可能与预后有关的因素;另一方面去除那些根本不可能相关的因素,以减少建立
34、多元回归模型时的“压力”。习惯上,人们多将单因素分析中P值0.2的因素,以及虽然P值0.2,但结合专业知识可能有关的因素,均作为待选变量引入到回归方程中去筛选。在建立多元回归方程时,待选变量的标准应该放宽一些,以免遗漏那些由于混杂的影响,导致在单因素分析中被“埋没”的有意义的因素。,某期刊2001年初发表的一篇有关狼疮脑病发生的相关因素分析,只对单因素分析中P值0.05者进行多因素回归分析,结果只有血白细胞,尿红细胞和A/G比值3个因子进入Logistic回归方程,被认为是与红斑狼疮脑病发生的相关因素。从风湿病专业的角度,估计很少有风湿科医生能接受这一研究结果。分析其原因,可能是在建立多元回归
35、方程时,待选变量的标准太严,导致真正有意义的因素被“埋没”。类似这样,只取单因素分析中有意义的变量,进行多元回归分析的错误不是个别现象,在国内医学期刊中常常见到。,RR值和回归系数,在建立了COX回归模型后,我们需要将相关强度的计算值从计算机上选到研究论文中去。COX回归模型有两种表示方法,RR值(也称HR值)和回归系数。二者任选一个都没错,翻阅国内期刊,见不少学者喜欢用回归系数,列一条数学方程式。但是,数学方程式并不能清晰地告诉人们其因果关系的程度,而且留意一下国际上重要医学期刊的论文,多是选用RR值,很少人用回归系数,因为RR值可以使临床医生更一目了然地清楚该因素的存在与否,阳性结局的危险
36、性增加几倍。,95%可信区间,值得一提的是,别忘了将RR值的95%可信区间写在论文里头,因为范围的估计往往比统计学意义更重要。早在1986年,BMJ就有文章强调可信区间的重要性(Gardner MJ,Altmen DG.Confidence intervals rether than P values:estimation rather than hypothesis testing.BMJ,1986,292:746-750)国际上重要期刊的论文均有注意标明95%可信区间。可是在国内医学期刊中,仅少数的临床研究论文对相关强度的运算结果时,给出了95%可信区间。,预后研究所需要的资料和数据库的建
37、立,在对预后研究的方法有初步了解之后,还有一个关键的问题就是预后研究需要哪些资料和如何建立可研究的数据库。预后因素分析的研究资料需要三大要素:研究因素、时间和结局。研究因素应根据专业知识确定,计算机统计软件和回归分析筛选的方法,为资料分析提供了许多的便利,因此研究变量可以多一些,以免遗漏重要的因素。,时 间,是指从研究起点至研究终点(出现阳性结局)或删失的时间。由于队列研究的病例,入组时间不一致,各个病例到达研究终点的时间也不一致,尽管结束研究的日期是固定的,但由于入组时间不一致,使各个病例从起点到达删失的时间也就不同。因此在队列研究,各研究病例间的时间是不一致的。也正因为如此,才需要运用生存
38、分析的方法。,结局(OUTCOME),结局包括研究终点和删失。研究终点也称为阳性结局,如死亡、痊愈、缓解等。研究终点必须有一个明确的定义或标准,不能模凌两可,以免出现测量偏倚。删失原因必须与阳性结局无关,多数情况是在结束研究时还未出现阳性结局者为删失,不要盲目地将临床失访的病例归入删失。如果失访的原因与结局无关,如病人搬迁或移民,可以纳入删失。但如果失访的原因与结局有关,如病情加重或疗效欠佳,转到其他医院就诊而失访,则不能归入删失。,建立数据库举例,最后以“再次发生急性心肌梗死的危险因素分析”为例,讨论数据库的建立。研究起点是首次心肌梗死后,从CCU出院日,研究终点是再次发生急性心肌梗死。这样
39、在数据库中,第一列为“结局”(OUTCOME),再次发生急性心肌梗死者为阳性结局,用1表示;到停止研究时尚未再出现心肌梗死者为删失,用0表示。第二列为时间(TIME),几从起点至阳性结局或删失的时间,用月(或年)表示。第三列以后,则是研究研究因素,如年龄(岁)、性别(男为1,女为0)、高血压(有为1,无为0)。,建立数据库如下:,建立数据库以后,根据研究的需要和你所掌握的统计软件,在计算机上进行统计学运算,以获取所需要的运算结果。,如:1年、3年、5年、10年再次出现急性心肌梗死的发生率;筛选出与再次发生急性心肌梗死相关的危险因素,及其RR值和95%可信区间;可以用生存曲线描绘该研究样本总体再次急性心肌梗死的发生率;也可以针对某个研究因素,用生存曲线描绘是否存在该研究因素(如有高血压和无高血压)的两条或多条曲线,可以对曲线进行假设检验,以了解这些曲线之间是否存在显著性差异;等等。,具体的运算方法,可以请教统计学的老师,或参考有关的统计学和统计软件的教科书。但是,作为临床医生搞科研,至少必须知道该研究需要记录哪些资料,和如何建立数据库。,