第十二章治疗证据的评价与应用.docx

资源描述

《第十二章治疗证据的评价与应用.docx》由会员分享，可在线阅读，更多相关《第十二章治疗证据的评价与应用.docx（21页珍藏版）》请在课桌文档上搜索。

1、第十二章治疗证据的评价与应用学习目的1. 掌握如何评价治疗证据的真实性和正确解释治疗证据的结果2. 熟悉如何应用治疗证据解决临床具体问题3. 了解治疗性研究的常用研究设计方案临床实践的过程从某种意义上说就是回答一系列问题并作出决策的过程。患者罹患什么疾病？应该安排什么检查？是否需要治疗？还是等待和观察？应给予怎样的治疗？某药物治疗是否比其他药物治疗效果更好循证临床实践正是检索、评价和应用临床证据解决这一系列问题的过程。临床面临最多的问题是关于疾病治疗的问题，而治疗证据也是目前数量最多的循证证据。治疗在循证医学中另一更确切的表述叫“干预”（intervention）。因“干预”不仅包括药物或手术

2、治疗，还包括生活方式（如：戒烟、运动、饮食等）和社会活动（如：健康教育计划）；“干预”不仅指针对个体的医疗活动，还包括针对群体的医疗行为（如：疾病筛查）；“干预”既包括治疗，也包括预防。本章按传统习惯称为“治疗证据”，实际上既包括治疗证据也包括预防证据。第一节治疗性研究概述治疗疾病和预防疾病恶化是临床医学的基本目标。考察防治性措施的疗效和安全性的研究称为治疗性研究，由治疗性研究提供的临床证据称为治疗证据。治疗性研究是临床研究中最活跃的领域，也是存在问题较多的领域。许多已发表的治疗性研究自称具有重要的临床意义，但实际上忽视了大量主、客观因素对研究结果的影响，在研究设计、结果衡量及统计分析等方面都

3、存在缺陷，导致研究结果缺乏真实性。因此有必要了解治疗性研究的常用设计方案和影响治疗性研究结果的因素。一、治疗性研究常用的设计方案许多研究设计方案均可用于治疗性研究，包括：描述性研究、病例-对照研究、队列研究、自身前后对照研究、交叉试验、非随机同期对照试验、随机对照试验（randomizedcontroltrial,RCT）等。RCT是国际公认治疗性研究的最佳设计方案，因为设计良好的RCT有明确的纳入和排除标准；有测试客观效应的指标和方法；有具体的执行条件和考核标准，允许研究者主动控制各类偏倚对研究结果的干扰，从而最大程度地保证研究结果的真实性。RCT采用随机分配方法将符合要求的研究对象分配到试

4、验组或对照组，分别接受相应的试验措施和对照措施，在一致的条件或环境里同步进行研究并观察试验效应，并用客观的效应指标测量和评价试验结果的试验设计。RCT最重要的特点是随机分配（randomizedallocation）,即研究对象有同等机会进入试验组或对照组。随机分配不是“随意分配”，更不是“随便分配常用的随机分配方法包括简单随机法（如：抛硬币法、随机数字表、计算机随机分组）、分层随机法、区组随机法等。RCT的另一重要特点是设定对照组。所谓对照（Control）是指设立条件相同的一组对象，接受某种与试验组不同的治疗措施。其目的是与试验组的结果进行对比，以证明两者间是否存在差异和差异的程度。对照可

5、分为同期对照、自身对照、历史性对照及配对对照等。RCT的优点在于有效防止选择性偏倚，试验组和对照组的基线可比性好，有标准化的治疗措施和判效标准，因此研究结果真实可靠；缺点是研究费时费力，同时由于其严格的纳入和排除标准导致研究对象的代表性和外延性存在局限。除RCT外，队列研究、病例对照研究等设计方案都可以用于治疗性研究。请参阅相关的临床流行病学书籍。选择研究设计方案需要遵循以下两条基本原则：1 .设计方案的科学性即设计方案获得的研究结果应该真实可靠，并有可重复性，科学论证强度高。各种研究设计方案的论证强度请参阅第三章。2 .设计方案的可行性不同设计方案需要的人力、财力和物力不尽相同。通常论证强度

6、高的设计方案（如：RCT）对研究人员和研究经费的要求也较高，在选择设计方案时要充分考虑研究的可行性。二、影响治疗性研究结果的因素和对策（一）机遇和偏倚机遇(chance),可导致随机误差(randomerror),指由概率造成的试验结果与真实值的差异。其大小可以用统计学方法进行估计，但没有方向性，即这种误差表现为研究结果随机地高于或低于真值。随机误差在抽样研究时不可避免，我们只能将其发生控制在一定的范围内。偏倚(bias),即系统误差(SySlemaliCerror),指由于研究人员、设备或研究方法等因素导致研究结果系统地偏离了真实值。与机遇不同，偏倚的存在总是造成研究结果或高于真值或低于真值

7、，因而具有方向性。在研究工作中定量估计偏倚大小很困难，而确定偏倚方向相对较容易。当偏倚使研究结果高于真值时，称之为正偏倚；反之称为负偏倚。偏倚可发生于研究的各个阶段。临床研究中的偏倚一般分为3类，即选择性偏倚(SeleCtionbias)、测量性偏倚(measurementbias)和混杂性偏倚(ConfoUndingbias)。3者分别存在于研究的设计阶段、实施阶段和分析阶段。偏倚主要通过严格的设计加以避免，随机分配就能最大限度地避免选择性偏倚。(二)样本大小样本大小直接反应受机遇影响的程度。小样本研究容易受机遇影响，出现假阳性和假阴性的可能性较大。样本量越大，受机遇的影响越小，研究结果越接

8、近于真实。(H)依从性依从性(COmPlianCe)指研究对象按研究要求执行医嘱的客观应答程度。在新药临床试验中依从性可定义为受试者按照规定的药物剂量和疗程服用试验药物的程度。按试验设计接受治疗者为依从性好，反之为依从性不好。受试者的依从性与试验结果的质量密切相关，不依从或依从性差是导致治疗无效的最常见原因，在新药临床试验中不依从的情况非常普遍。据统计，完全依从、依从性差和完全不依从的受试者各占约1/3o治疗过程中患者的依从性问题常常被忽视，目前测量和评价依从性的研究还很缺乏。提高患者依从性的措施包括：加强患者依从性的教育；尽量选择简单、易行的治疗方案；提高医务人员的服务态度和医疗技术水平；及

9、时处理药物不良反应等。(四)向均数回归现象向均数Irll归现象(regressiontothemean)指某些具zfi异常测量指标的患者即使不接受治疗，在其后的连续测量中，这些指标也有向正常值接近的趋势。这种现象可能因测量值围绕均值上下波动引起，也可能是测量指标的生理波动，而并非干预所致。向均数回归现象可以造成治疗有效的假象。对同一个体的相关测量指标在相同条件下，不同时间多次测量后取其均值可以减小其对结果的影响。(五)沾染和干扰沾染(COntamination)指对照组研究对象有意或无意接受了试验组的治疗。沾染会使试验组和对照组之间可能存在的差异减小。而干扰(coinlervenlion)指试

10、验组或对照组的研究对象额外接受了类似试验措施的其他处理，从而人为地影响试验措施的疗效。沾染和干扰可以通过双盲或三盲设计加以避免(参见本章第四节)。(六)霍桑效应霍桑效应(HaWthorneefTeCt)指研究过程中研究者可能对自己感兴趣的研究对象关注更多，当研究对象成为被关注的目标时往往有意或无意地夸大治疗效果。避免霍桑效应的方法是设立对照组，并采用双盲或三盲设计。第二节提出需要解决的临床问题临床病案：患者，男性，36岁，中国人，因“突发左侧腰部疼痛伴血尿1天”就诊。入院前1天活动后突发左侧腰部疼痛，伴全程肉眼血尿，无尿频、尿急、尿病、发热、寒战等症状。查体：左中榆尿管点压痛。腹部彩超提示左侧

11、输尿管结石，无尿路畸形和前列腺长大。临床诊断：左侧输尿管结石。药物排石治疗(medicalexpulsivetherapy,MET)是常用的治疗尿路结石的手段，其中受体阻滞剂和钙离子拮抗剂都是常用的药物，两者孰优孰劣？一、提出初始临床问题治疗性研究的问题可由患者提出，也可由医生根据患者的临床情况提出。关于如何在临床实践中发现和提出问题请参阅第二章。针对这一临床病例，我们首先提出初始临床问题“对患输尿管结石的成年患者，受体阻滞剂与钙离子拮抗剂比较，疗效和安全性如何？”显然，这一初始临床问题不适合查找证据,需要将其转换为便于回答和检索的形式。二、根据PlCO原则分解临床问题为便于快速有效地检索到与

12、临床问题密切相关的证据，需要根据PICO原则（参阅第二章）转换和分解临床问题（表表12-1治疗性问题构建结果患者（Patien3P）患输尿管结石的成年患者干预措施（intervention,I）受体阻滞剂对照措施（ComPariSon,C）钙离子拮抗剂结局指标（outcome,O）疗效（排石率、排石时间）、安全性（副作用及发生率）第三节检索相关研究证据明确回答对治疗证据按质量和可靠性应先检索Summaries类数据库，如UPTODate等。如果无法在SUmmarieS类数据库获得需要的结果，再考虑检索非SUmmarieS类数据库。治疗证据的原始研究证据分级依次为RCT、队列研究、病例对照研究、

13、系列病例观察和专家意见。治疗证据分级的具体内容请参阅第三章。目前国际上公认基于RCT的系统评价和设计良好的RCT是证明某种疗法有效性和安全性最可靠的证据（金标准）。如果检索不到这两种证据，则可依次检索其他类型的研究，但证据的可靠性逐级降低。一、选择数据库（一）首先选择Summaries类数据库 ClinicalEvidence EssentialEvidencePlus DynaMed BestEvidence UpToDate（）如上述数据库未检索到相应的证据，可考虑检索非Sumnaries类数据库 PubMed:clinicalqueries EMbase CochraneLibrary/

14、OvidEBMReviews二、确定检索词在治疗性研究中通常选择PICO中的“P”和“I”作为关键词，两者用“AND”进行逻辑组配。如果检索结果太多再考虑使用“0”和“C”对检索结果进行限制以缩小检索范围。有时一个关键词可能有不同的拼写方式或同义词，可将这些词汇用“OR”进行逻辑组配。本案例的检索词包括：alphaantagonistaalphablockertamsulosisflomaxalfuzosindoxazosin、terazosinsilodosincalciumantagonistscalciumchannelblockernifedipinenimodipineamlodip

15、inefelodipinerenalurinarykidney、urologicalstones、CalCUl等。三、检索相关数据库本病例中，我们首先以检索词“nephrolithiasis”检索UptoDate,找到文献44Diagnosisandacutemanagementofsuspectednephrolithiasisinadults”,原文作者认为tamsulosin比nifedipine疗效略好，建议首选tamsulosino我们再以以OVlDEBMReviews(包括ACPJournalClub和CochraneLibrary)数据库为例进行检索(OVIDEBMReviews

16、为收费数据库，若所在单位没有购买，可替代使用PubMed进行检索),检索策略为：(alpha.ORalphablocker$.mp.OR.OR.OR.OR.OR.OR.)AND(calciumantagonists.mp.ORcalciumchannel.OR.OR.OR.OR.)AND(.OR.ORkidney$.mp.OR.)AND(orcalcul$.mp)OR.OR.未能找到相关的系统评价，但检索到3篇密切相关的RCTo本章以其中发表时间最近且样本量最大的一篇文献(YeZ,YangH,LiH,ZhangX,etal.Amulticentre,prospective,randomized

17、trial:comparativeefficacyoftamsulosinandnifedipineinmedicalexpulsivetherapyfordistaluretericstoneswithrenalcolic.BJUInt,2011,108(2):276-279.)为例，进一步阐述。将这篇RCT的结果应用于具体患者之前，我们需要评价其真实性、重要性和适用性。第四节治疗性研究证据的评价与应用表12-2评价治疗性研究证据的原则治疗性研究证据的真实性评价1 .研究对象是否进行随机化分组？2 .分组方案是否进行了隐匿？3 .试验开始时试验组和对照组的基线可比性如何？4 .对研究对象的随

18、访是否完整？随访时间是否足够？5 .统计分析是否按照最初的分组进行？6 .对研究对象、研究执行者和资料分析者是否采用盲法？7 .除试验措施外，不同组间接受的其他处理是否一致？治疗性研究证据的重要性评价1 .如何评估治疗效果的大小？2 .如何评估疗效的准确度？治疗性研究证据的适用性评价1 .自己患者的情况是否与研究中的患者相似？2 .治疗性证据的可行性如何？3 .治疗措施对患者的潜在利弊如何？4 .对欲采用治疗措施，患者的价值取向和意愿如何？一、单项治疗性研究的真实性评价生物统计学家和临床流行病学家已经制定出一套“严格评价标准”(criticalappraisal)来评估临床研究的真实性。通常需

19、要从以下7个方面考察治疗证据的真实性(表12-2)o(-)研究对象是否进行随机化分组？随机化(randomization)是临床科研的重要方法和基本原则之一，包括随机抽样和随机分组。前者为了避免选择性偏倚，使抽样的样本能代表总体特征；后者是保证研究对象进入试验组或对照组的机会相等，以防止选择研究对象或对研究对象分组时受主观人为因素(包括研究者和被研究者)干扰。治疗性研究中研究对象对治疗的反应不仅受治疗因素影响，还受许多其他因素的影响，如：年龄、性别、病情严重程度、合并症等，此外许多未知因素也可能影响疗效。这些已知或未知的因素统称为“混杂因素”(confounders).为考察治疗措施的真实疗效

20、，要求试验组和对照组除研究的治疗因素外，混杂因素应该尽可能一致。有很多方法可以控制混杂因素，如：分层配比抽样、分层分析、多因素统计分析等，但这些方法均要求先识别出欲加控制的混杂因素。对未知的混杂因素上述方法无能为力。随机分组因使研究对象有同等机会进入试验组或对照组，从而最大程度地保证组间可比性。在非随机对照试验中，患者进入治疗组或对照组受研究者主观因素，预后较差的患者往往被分配至对照组，而预后较好的患者则分配至试验组，从而夸大试验药物的疗效。采用了随机分配方法的研究通常会被清楚地标示在文章的题目或摘要里，因为这是该研究引以为豪的地方，但某些文献虽然冠以“随机”之名，却并未采用真正的随机分组方法

21、。因此，单凭“采用随机对照”几个字判断某文献为RCT是草率的。应阅读文章的方法学部分，详细了解作者采用的是何种随机化分组方式，如：随机数字表法、抛硬币法、计算机随机法、随机密封抽签法等。值得注意的是：按就诊的先后顺序交替分组、按身份证号（或出生日期、门诊号等）的单双数分组等方法不是真正的随机分配，而是半随机分配（quasi-randomizedallocation）o因为研究者清楚地知道患者分配到哪个组，甚至可能知道下一个患者将被分配到哪个组，有发生选择性偏倚的风险。在Ye等的文章中，题目即明确标示为RCTo为了判断是否为真正的随机，阅读“PatientsandMethods一节，遗憾的是方法

22、学部分虽然明确说明采用了随机分配方法，但并未具体描述随机的方法，因此难以判断研究是不是真正的随机分组。（-）分配方案是否进行了隐藏？分配方案隐藏（allocationconcealment）是指研究者按随机化设计的序号纳入患者，研究对象和参与分组的研究人员均不能预先知道分配方案，以防止研究人员在纳入患者时产生选择性偏倚。如果分配方窠没有隐藏，研究者为了得出预期的研究结果可能会选择性的纳入病情较重或较轻的患者分别进入研究组或对照组，这种行为会导致研究结果出现偏倚。1项纳入250个RCT的研究显示，分配方案隐藏不充分导致干预措施的治疗效果被夸大41%。另1项研究显示，分组方案隐藏不充分或不清楚的R

23、CT与充分隐藏分配方案的RCT比较，干预措施的治疗效果被夸大了37%o判断某研究是否进行了分配方案隐藏极富挑战性，因为现有ReT在文章中很少详细描述研究过程中如何进行分配方案隐藏。国外研究显示，医学专业期刊中仅9%的RCT在文章中充分描述了隐匿分组方案的具体方法；在医学综合期刊中也仅15%o隐藏分配方案的常用方法包括：使用编号的容器、研究中心控制的电话或传真、序列编号的密封且不透光的信封等。在Ye等的文章中未明确说明是否实施了分配方案隐藏，因此难以判断。（三）试验开始时试验组和对照组的基线可比性如何？基线可比性是考察在试验前，除干预措施外，其他已知影响预后的因素在试验组和对照组是否一致。理论上

24、讲，通过随机分配后试验组和对照组影响预后的因素应该一致，但由于机遇的影响，实际情况不一定如此，尤其是样本量较小时。为了提高基线可比性，可考虑使用分层随机法（Stratifiedrandomization）,选择影响预后的重要因素作为分层因素（例如：年龄、病情严重程度等），将研究对象分层，再将分层后的研究对象随机分组，以维持这些因素在组间的平衡。通常1篇合格的文献应该在结果部分详细地报告试验组和对照组的基线情况。如果组间基线不相同，需进一步了解是否对这些影响预后的重要因素进行了相应的统计学调整。如果调整后的分析结果与未调整时相似，则结果较可信。在Ye等的文章中，试验组和对照组患者在年龄、性别、结

25、石平均大小等方面基线具有可比性。（四）对研究对象的随访是否完整？随访时间是否足够？随机入组后的研究对象，无论接受试验组还是对照组的治疗措施，都有机会表现出不同的治疗反应或发生不同的事件。为了真实反映研究情况，在理想状态下，所有研究对象均应完成试验并取得相关数据。但实际上研究对象的迁徙、流动或死亡等可能导致部分研究对象不能完成试验或研究者不能获得相关数据，这种情况叫失访（Withdraw）。失访人数越多，研究结果的真实性受到的影响越大。失访率（WithdraWrale）是指失访病例数占入组病例数的百分比。其计算公式为：失访率=（入组病例数-最终纳入分析的病例数）/入组病例数xlOO%。通常认为失

26、访率应控制在10%以内，特殊情况下失访率不能超过20%。失访的允许范围与样本量和事件发生频率有关，失访率相同的条件下，事件发生率越高而样本量越小的研究，研究结果越容易被夸大。如研究中出现失访的情况，首先应说明失访的具体原因。对失访率10%的研究还应对失访进行必要的统计学处理，如“最差效应分析”，即将试验组失访的研究对象全部当作无效处理，对照组失访的研究对象全部当作有效处理，这样两组的疗效差异将人为地缩小，此时再进行统计分析。如果这种统计学处理不改变研究的结论，则说明失访不足以影响研究的真实性。但对失访率20%的研究，这种统计学处理的意义不大。由于研究需要观察的目标事件总是在给予干预措施后一定时

27、间才可能发生，因此确保随访时间足够长对观察到目标事件十分必要。以观察抗血吸虫药物的疗效为例，如果仅随访1个月，观察到大便孵化毛拗阴转就判断为治疗有效不恰当,因为这可能只是药物对血吸虫排卵的暂时抑制，而并未真正治愈。因此至少需要随访26个月持续阴性，才能判定为治愈。随访时间的长短取决于目标疾病的病程和干预措施的起效时间。不同的疾病、病情严重程度及药物性质和特点，需要不同的随访时间。如随访时间过短，容易出现假阴性结果；但如果随访时间过长又可能导致患者的依从性下降，失访率增加及研究费用过高等问题，因此随访时间过长或过短都会影响研究结果的真实性。判断随访时间是否足够需要评估者具有相关的临床背景和专业知

28、识。在Ye等的文章中，纳入的3189例患者未出现失访情况。随访时间为4周，符合临床常用治疗规范。(五)统计分析是否按照最初的分组进行？随机化分组后的任何事件都可能影响研究的结果。如研究对象退出研究或转移到其他治疗组均会导致各组基线不再像试验开始时那样具有可比性。另外，即使研究药物只是安慰剂，研究对象服用或不服用药物的结果也存在显著差异。因此，为了保证随机化，必须确定所有研究对象(包括中途停药或接受了其他组治疗的研究对象)均按照原始分组进入分析过程，这就是意向治疗(intentiontotreatment,ITT)分析意向治疗分析是指在统计分析中包括所有纳入随机分配的研究对象，而且不论研究对象最

29、终是否接受研究开始时分配给他的治疗，都按原来的分组进行结果分析，也称为“意愿治疗分析”、“既定治疗分析“、意图治疗分析或TT分析”。意向治疗分析能保留随机化分配的优点，防止预后较差的患者在最后分析中被排除出去，保持试验组和对照组具有较好的可比性，结论更可靠。其缺点在于如果治疗措施确实有效，该方法可能低估其疗效。与之相对的是符合方案(Per-ProtoCol,PP)分析或效力分析(efficacyanalysis),只分析那些实际完成整个治疗的人，即放弃那些失访或脱组的人。PP分析能反映实际按方案完成治疗的结果，减少因沾染或干扰造成的影响。失访者越少，两种分析方法的研究结果越接近，结果越可靠。Y

30、e等的研究中，作者采用PP分析，但根据作者报道，并无失访、干扰或沾染的情况发生，因此PP分析的结果与ITT分析的结果应该一致。(六)对研究对象、研究执行者和资料分析者是否采用盲法？临床试验要求研究者对每个研究对象给予尽可能准确可靠的评价，这要求研究执行者根据研究对象的客观反应作实事求是的记录、判断和分析数据，不受双方主观因素的影响。研究对象如果自己知道接受了可能有效的治疗，自我感觉可能比那些没有接受该治疗的患者好。尽管这种治疗可能是没有生物学作用的。研究执行者如果知道分组情况，可能会过度关注治疗组患者，从而导致偏倚结果出现。资料分析者也可能因为知道患者的分组情况而歪曲研究结果。为了避免这种情况

31、，要求参与临床试验的研究执行者、资料分析者或研究对象均不知道研究对象所在的组，也不知道接受的是试验措施还是对照措施，这种方法称为盲法（blind）0盲法可以分为3种，如果在研究对象、研究执行者和资料分析者三者中，一般研究对象不知道分组和干预措施的情况称为单盲（Single-blind）；研究对象和研究执行者（干预措施执行者和结果测量者）均不知分组和干预措施的情况称为双盲（doubleblind）;3者均不知分组和干预措施的情况称为三宣（triple-blind）Q盲法（尤其是双盲和三盲）可以减少或避免研究者的测量性偏倚及沾染和干扰对研究真实性的影响。判断某研究是否为盲法试验或盲法实施是否合理，

32、应注意其报告的具体方法和内容，特别是具体对谁实施了盲法，而不能仅根据“双盲试验”几个字。盲法与分配方案隐藏是两个容易混淆的概念。盲法在随机分组后实施，目的是避免测量性偏倚、沾染和干扰，盲法有时不一定能实现（如当治疗措施为手术，而对照措施为药物时，不可能对研究执行者和研究对象实施盲法）；分配方案隐藏发生在随机分组前，目的是避免选择性偏倚，且总是可以实现的。Ye等的文章并未采用盲法，因此其结果有可能受到测量偏倚的影响。（七）除试验措施外，不同组间接受的其他处理是否一致？为了保证试验组和对照组结果的差异单纯由试验措施所致，理论上要求除试验措施和对照措施外研究对象不接受其他任何治疗，以避免其他治疗措施

33、的干扰。但由于治疗性研究的对象是患者，如其病情复杂则常需除试验措施外加用一些其他治疗措施。此时，就需要评估试验组和对照组接受的额外治疗措施是否一致，如果不一致则可能对研究结果的真实性产生影响。Ye等的研究中，试验组接受Cl受体阻滞剂（坦索罗辛）治疗，对照组接受钙离子拮抗剂（硝苯地平）治疗，除上述试验措施外，所有患者都接受左氧氟沙星治疗，并大量饮水（22.5Ld）这些额外的治疗措施在组间分布一致。二、治疗性研究证据的重要性评价经上述真实性评价，确认研究证据真实可靠后，还需要评价其临床重要性。治疗措施的重要性是指其治疗效果的临床价值。既包括其有利一面，亦应评价其可能引起的有害一面，如药物不良反应等

34、。证据重要性的评价应在确定其真实性的基础上进行。治疗性研究的重要性评价包括评估治疗效果的大小和精确度。(一)如何评估治疗效果的大小？循证医学评估治疗效果的大小常用两类统计学指标：一类用于分析计数资料(如：疾病发生率、死亡率、病死率等)，另一类用于分析计量资料(如：血压、血糖、身高、体重等)。分析计数资料的常用统计学指标如下：1 .试验组事件发生率(CXDerimentalevemrate,EER)即试验组中某事件的发生率，如对冠心病患者采用试验措施治疗后心肌梗死的发生率。2 .对照组事件发牛.率(ControlCVemrate,CER)即对照组中某事件的发生率，如对冠心病患者采用对照措施治疗后

35、心肌梗死的发生率。3 .相对危险度减少(relativeriskreduction,RRR)指与对照组相比，治疗组不良结局事件减少的百分比，RRR=(CER-EER)CER,通常RRR在25%50%或更大时才有临床意义，说明治疗组经治疗后其不良事件的发生可降低25%50%或更多。RRR是一个相对指标，其最大缺点是不能告诉我们临床相关的风险究竟有多大。如当CER=20%,EER=I5%时，RRR=(CER-EER)CER=(20%15%)20%=25%;如果对照组和试验组事件发生率同时下降100倍，CER=0.2%,EER=O.15%,此时计算RRR仍为25%。4 .相对效益增高率(relaIi

36、VebellefilinCrease,RBl)有时研究考察的指标可能是有益的结局事件，此时需要计算RBI,其含义与RRR类似。RBI指与对照组相比，治疗组有益结局事件增加的百分比，RBI=(EER-CER)CER0通常RBl在25%50%或更大时才有临床意义，说明治疗组经治疗后其有益事件的发生可增加25%50%或更多。RBI的缺点与RRR类似。5 .相对危险度增加(relativeriskincrease,RRl)治疗措施不一定总是带来有益的临床效果，有时也可能出现不良反应，此时治疗组的不良结局事件反而增加。RRI指与对照组相比，治疗组不良结局事件增加的百分比，RRI=(EER-CER)CER

37、oRRI的缺点也与RRR类彳以。6 .绝对危险度减少（absoluteriskreduction,ARR）是指对照组和治疗组不良结局事件发生概率的绝对差值，ARR=CER-EERo此值愈大，临床意义亦愈大。当反映试验组与对照组某病发生率增减的绝对量时，ARR较RRR更明确，更具有临床意义。但是，当其值很小时，ARR的倒数在临床上更易于解释。7 .绝对效益增加（absolutebenefitincrease,ABI）是指治疗组和对照组有益结局事件发生概率的绝对差值，ARR=EER-CERo此值愈大，临床意义亦愈大。8 .绝对危险度增加（absoluteriskincrease,ARD治疗措施不一

38、定总是带来有益的临床效果，有时也可能出现不良反应，此时治疗组的不良结局事件反而增加。ARI是指治疗组和对照组不良结局事件发生概率的绝对差值，ARI=EER-CERo9 .多减少1例不良结局需要治疗的人数（numberneedtotreat,NNT）对患者采用某种治疗措施，经过一定的治疗时间，与对照组比较，多减少1例不良结局需要治疗的病例数。NNT=lARRo当计算出的NNT为小数时，按惯例将所有小数进位取整（而不是四舍五入）。NNT为多少才能说明治疗措施具有重要的临床意义呢？回答这个问题需要结合自身的临床经验或其他专家的意见，并与其他不同治疗措施的NNT比较，NNT愈小说明治疗对患者愈有利。同

39、时，目标结局事件的严重程度、疾病种类和严重程度也是需要考虑的问题，如对高血压患者需要治疗100人才能预防1例死亡（NNT=IOO）,而使用抗生素治疗3例尿路感染患者可缓解1例患者的症状（NNT=3）,但并不能说明前者的临床意义小于后者，因为前者的目标结局事件显然更严重。又如：某药物治疗不伴有靶器官损害的轻度高血压病随访1年预防脑卒中的NNT为120,另一药物治疗伴有严重靶器官损害的重度高血压病随访1年预防脑卒中的NNT为5,这并不能说明前者的临床意义小于后者，因为两者的研究人群虽然都是高血压病，但疾病的严重程度不同。NNT还与随访时间有关。比较观察时间不同的治疗措施的NNT时，需要作时间上的校

40、正。其方法是假定在观察期内，单位时间内治疗产生的效益相等，调整需要比较的NNT,其公式为：NNT（假定观察期）=NNT（原观察期）X（原观察期/假定观察期）如：A药治疗轻度高血压病随访2年预防脑卒中的NNT为100,B药治疗轻度高血压病随访1.5年预防脑卒中的NNT为120,如果不调整随访时间，而直接比较NNT,可能认为A药的疗效更好。但欲比较两者的临床效果，实际上需要将其中一个研究的随访时间调整为与另一个相同。假设B药随访2年，其NNT可根据公式计算：NNT(2f=120(1.52)=90,可见B药疗效更佳。10 .多发生1例不良结局需要观察的人数(numberneedtoharm,NNH)

41、对患者采用某种治疗措施，经过一定的治疗时间，与对照组比较，多发生1例不良结局需要观察的人数。NNH=1ARLNNH用于描述治疗带来的副作用。其临床意义类似于NNT。在不良结果相同且随访时间相近的前提下，NNH越大，对患者越有利。11 .防治性措施获益与危害似然比(IikeIihOodOfbninghelpedVSharmed,LHH)LHH=(lNNT)(lNNH)o该指标反映了治疗措施给受试者带来的受益与危害的比例。LHH1,利大于弊，反之，LHH1时，弊大于利。以Ye等的研究为例，试验组和对照组分别接受坦索罗辛和硝苯地平治疗，自行排出结石的情况见表12-3o12-3试验组和对照组接受治疗后

42、自行排石率比较组别自行排石病例数未能自行排石病例数总例数试验组1530661596对照组11714221593根据上述公式，可分别计算如下指标：EER=1530/1596=96%CER=I171/1593=74%RRR=(CER-EER)CER=(96%-74%)74%=30%ARR=CER-EER=96%-74%=22%NNT=1ARR=l0.22=4.555由上面的计算可以看出，与硝苯地平比较，对5例患有输尿管结石的成人使用坦索罗辛治疗，可多使1例患者自行排出结石。分析计量资料的常用统计学指标如下：1 .均数(mean)对服从正态分布的计量资料，均数是最常用反映数据集中趋势的统计学指标。均

43、数等于一组数据之和除以该组数据的个数。许多临床常用指标(如：血压、体温、血糖等)的集中趋势都可用均数反映。比较两组数据均数的大小是比较两组计量资料的最常用方法。注意：均数本身的大小并无临床意义，必须结合对应的临床指标和研究背景才有临床意义。如某研究发现：经过相应治疗后，试验组血压均数高于对照组，这一结果本身并不具有任何临床价值。若假定试验开始前，两组血压基线具有可比性，试验目的是考察升压药物的疗效(如：多巴胺与去甲肾上腺素比较)，则这一结果提示试验组药物疗效可能优于对照组；反之，如果试验目的是考察降压药物的疗效(如：硝苯地平与氨氯地平比较)，则这一结果提示试验组药物疗效可能劣于对照组。判断某组

44、数据是否服从正态分布可以通过正态性检验等方法实现。对不服从正态分布的数据，其集中趋势可以通过中位数或几何均数等指标反映，可查阅相关统计学书籍。2 .均数差(meandifference)在治疗性研究中均数差是指某结局指标干预前后均数的差值。以前述研究为例，在试验开始前，试验组和对照组血压的均值通常不会完全相同，给予干预措施后，两组间的血压差异有可能是由于基线血压不同所致。为了排除基线情况对研究结果的干扰，可用治疗后的血压均数减去治疗前血压均数，再比较两组间血压的均数差，使结果更准确可信。3 .加权均数差(Weightedmeandifference,WMD)该指标通常用于基于RCT的Meta分

45、析。使用Meta分析合并来自不同研究的效应量时，通常按不同研究的样本量大小给予其对应的研究结果一个权重系数，样本量越大权重系数越大，该研究对合并后结果的影响也越大，这一过程称为“加权”，最终合并后的均数差则称为加权均数差。具体计算过程请参阅相关统计学书籍。4 .标准化均数差(Standadizedmeandifference,SMD)该指标通常也用于基于RCT的Meta分析。有时不同的研究测量同一结局指标时采用了不同的测量方法。如不同RCT评估抑郁时可能采用了不同的量表，此时就不能简单地将不同研究的得分合并，而需先将不同研究的得分“标准化”，其方法是用均数差除以对应的标准差，再进行合并。具体计

46、算过程请查阅相关统计学书籍。WMD和SMD通常都在基于RCT的系统评价或meta分析中使用，当不同研究评估某个结局指标采用的方法和计量单位相同时，通常使用WMD表示合并后的效应量；反之则用SMD表示合并后的效应量。以Ye等的研究为例，试验组和对照组分别接受坦索罗辛和硝苯地平治疗，考察自行排出结石的时间，试脸组均数为78h,对照组为138h,试脸组结石排出时间明显短于对照组，组间差异有统计学意义（尸=0.001）。（-）如何评估疗效的精确度？无论研究的样本量有多大，也只是从总体中抽取的样本，这就需要通过统计学方法以样本统计量推断总体参数。疗效的精确度反映由样本推断总体的可信程度，常用置信区间（c

47、onfidenceinterval,CD表示，用以评价治疗试验结果的精确度。CI是按一定的概率去估计总体参数（如总体均数或率）所在的范围。按预先给定的概率（通常为95%或99%）确定总体参数的可能范围，这个范围被称为所估计总体参数的置信区间。如：95%CI就是该区间有95%的概率包含了被估计的总体参数。样本含量愈大，抽样误差愈小，置信区间愈窄，精确度愈高。CI的具体计算方法请参考相关的统计学书籍，还可以使用SPSS或STATA等统计学软件计算。以Ye等的研究为例，ARR的95%Cl为（16%,28%）,NNT的95%Cl为（4,7）o三、治疗性研究证据的适用性评价当确定治疗性研究证据的真实性和

48、重要性后，还需要考察其是否适用于自己的患者。我们需根据患者的具体临床情况，将当前所获最佳证据与我们的临床技能和经验相结合，并尊重患者及其亲属对拟用治疗措施的选择和意愿，最终做出临床决策。通常需要考虑以下几个问题：（一）自己患者的情况与研究中的患者是否相似？应用研究结果时要充分考虑患者的社会人口学特征（如：种族、性别、年龄等）和疾病特征是否与研究中的研究对象相似。注意：个体患者的临床特征极少与研究人群的特征完全相似，总会存在或多或少的差异，因此需要重点考察的不是两者的差异，而是考察两者在某些重要临床特征上是否相似。如果某些重要特征（如：免疫缺陷、遗传性药物反应差异、特殊合并症等）与证据中的研究对象存在显著差异时，不宜将研究结果应用于自己的患者。有时疗效在试验组的不同亚组之间可能存在量的差异，有时可能是质的差异，甚至只在某些亚组有效，此时需要鉴别亚组间的差异是真实情况还是由于混杂因素的影响。如早期一些关于阿司匹林预防短暂性脑缺血发作的研究显示它只对男性患者有效，而对女性患者无效。但后来的研究表明阿司匹林对女性

展开阅读全文