《回顾性临床研究的设计和分析.pptx》由会员分享,可在线阅读,更多相关《回顾性临床研究的设计和分析.pptx(51页珍藏版)》请在课桌文档上搜索。
1、回顾性临床研究的设计与数据分析,1,NP-OBC-2015.11-002 Valid Until 2017.11,声明,本资料为仅用于学术会议或活动的专业资料,旨在促进医药信息的沟通和交流,仅供医药卫生专业人士参考。内容可能含有未在中国批准的临床适应症。处方请参考国家食品药品监督管理总局批准的药品说明书,2,前瞻性 vs.回顾性,时间顺序性研究问题 vs.数据收集暴露因素 vs.研究结局数据的分析永远是回顾性的数据的产生永远是前瞻性的,3,常见的回顾性研究设计,一般为观察性研究回顾性队列研究(因 果)病例对照研究(果 因)横断面研究,4,队列研究,暴露,一组人,前进,5,队列研究,暴露,一组人
2、,前进,现在,回顾性,现在,前瞻性,6,因 果,队列研究可以回答哪些问题?,疾病(事件)的发生情况:发生率疾病(状态)的流行或分布:百分数疾病(事件、状态)发生、流行和分布的影响因素:比(Hazard Ratio,Rate Ratio),7,确定研究终点,确定暴露因素,随访起止点,确定研究人群,队列研究的设计要素,一组人,8,前进,确定研究问题,随访,起点:暴露或者风险发生的起点过去的某个时间点终点:事件发生失访或脱落研究结束,9,过去的某个时间点,现在 or 过去的某个时间点,确定研究人群,目标人群源人群研究人群,10,目标人群,源人群,研究人群,实际入组的研究人群,进行研究对象招募的人群,
3、希望进行结果推广的人群,从研究起点(过去)进行选择,确定暴露状态,根据研究对象在研究起点(过去)的暴露状态而确定的暴露组对照组根据研究问题清晰定义有/无(治疗方案)按暴露程度(剂量)按暴露的Pattern(顺序),11,对照组的选择,除了暴露因素外,应与暴露组相似内部对照从同一地点,同一时间内选择。如从同一家医院,在同一个时间段内选择外部对照不同地点,不同时间需要更强的相似性假设,12,暴露组与对照组的可比性,观察性研究的特性决定了暴露组与对照组是不可比的基线的背景风险不同(选择性入组)脱落者与在访者的背景风险不同(选择性脱落)忽略这种不同会影响我们对结果的解读“选择性偏倚”,13,随机(Ra
4、ndomization),举例:死亡率指标,“二、三级综合医院医疗服务能力标准”征求意见稿,14,“差异”的校正和控制,研究设计上研究实施上数据分析上结果解读上,15,队列研究的终点/结局,事件的发生(已知)Time-to-event(OS,PFS)Disease incidence随访终点(已知)一个队列研究可观察多个研究结局,16,结局和暴露状态的测量,基本原则:独立与客观研究结局不应影响暴露状态的判断暴露状态不应影响研究结局的判断观察性研究中不存在完全的独立与客观测量的误差会影响研究结果,无法校正“信息偏倚”,盲法(Blinding),17,回顾性队列研究中的选择性偏移与信息偏移,选择性
5、偏移选择性入组和脱落回顾性数据的完整性信息偏移回顾性数据的准确性回忆的准确性暴露状态对结局的影响相对较小,18,关于失访,观察性研究的失访无法避免对临床研究的影响减少了样本量,降低研究的效力造成选择性偏倚应对措施补充数据,减少失访造成的信息缺失接受现实、评估可能的影响、谨慎解读结果,19,病例对照研究,研究结局(果)暴露状态(因)Step 1:根据结局确定“病例”与“对照”Step 2:确定各自的暴露状态Step 3:计算,20,病例对照研究,21,病例对照研究,22,病例,病例对照研究,23,病例,对照,结局 暴露,24,病例:对照:,Odds Ratio(OR),25,OR=,病例对照研究
6、可以回答哪些问题?,疾病或状态的影响因素(比较性问题)保护因素风险因素唯一的产出:OR,26,病例对照研究的设计要素,确定研究问题确定研究人群病例的选择对照的选择判断暴露状态,27,病例的选择,理论上,人群中所有病例均应作为case实际中,选择部分病例作为case一般选择新发病例而非既往病例不同时期的诊断水平存在差异,28,对照的选择,在选择时没有发生研究结局与病例来自同一人群如果发生了研究结局,那么对照符合病例的入选标准对照的选择不受暴露因素的影响除了暴露因素外,对照应与病例类似病例对照比例:1:11:4,29,判断暴露状态,往往是回顾性的基于已有病例档案(完整性?)基于回忆(准确性?),3
7、0,病例对照研究中的偏倚与混杂,选择性偏倚不恰当的选择对照(受暴露状态的影响)病例与对照来自不同人群信息偏倚(暴露信息不准确)回顾性的数据收集方式回忆偏倚研究者引入的偏倚混杂风险因素数据不完整或缺失,31,病例对照研究中的偏倚与混杂的控制,较队列研究更难控制可用的方法配对尽可能收集风险因素使用客观测量结果分析:分层、多因素分析承认其存在以及研究的局限性,32,研究问题:MKK4基因多态性与结直肠癌的相关性研究设计:病例对照,33,病例与对照的选择,病例2002年6月2008年12月广州地区6所医院706名组织病理学确诊CRC患者对照相同时间段广州地区健康体检人群随机选择723名无CRC研究对象
8、年龄、性别配对,34,Yisheng Wei,et al.Int.J.Cancer:125,18761883(2009),暴露因素测量,问卷:吸烟、饮酒、家族史采集血样进行基因分析,35,Yisheng Wei,et al.Int.J.Cancer:125,18761883(2009),36,横断面研究,37,了解某种疾病或状态在特定时间、某个人群中的分布状态(流行率),流行率,横断面研究,特殊的病例对照研究所有的non-case均选为control相关因素分析(OR),38,横断面研究的设计要素,确定研究人群在哪个人群切?确定数据收集/产生时间在什么时候切?结局与暴露的测量数据收集,39,人
9、群的切面,数据收集/产生时间,日历时间(calendar time)X年X月X年X月事件时间(event time)就诊、诊断、治疗、死亡,40,数据收集,同时收集暴露与结局信息(一次性收集)收集方式:面对面访谈邮寄调查问卷电话访谈自我填写的调查问卷医学检查(实验室检查)已有档案回顾,41,横断面研究的偏倚与混杂,选择性偏倚:研究对象不具代表性信息偏倚:基于回忆或自我报告混杂:风险因素缺失或未收集,42,研究人群:2010/7-2012/7就诊乳腺癌患者,数据收集:病理科档案,43,常用的分析方法,描述性分析(Descriptive analysis)描述研究人群的基本特征组间比较(Subgr
10、oup comparison)了解可能存在的组间差异回归分析(Regression analysis)偏倚与混杂的校正,分析影响因素,44,描述性分析,根据变量类型选择分析方法,45,组间比较,比较组间基线特征差异t检验(连续变量)卡方检验(分类变量)“我该使用哪种检验方法?”,http:/www.ats.ucla.edu/stat/mult_pkg/whatstat/default.htm,46,Dependent Variable:因变量(年龄)Independent Variable:自变量(治疗方案)Nature of Depend VariableIntervalNormalOrdi
11、nalCategorical,47,使用的检验方法,四种统计软件的操作方法,回归分析,根据研究设计和因变量(结果变量)种类选择回归分析方法生存分析(Cox回归):time-to-event变量Logistic回归:0,1结果变量线性回归:连续性结果变量Poisson回归:非负的计数性结果变量单变量 vs.多变量,48,单因素与多因素分析,单因素分析:Y=+X1生存状态=+*治疗方案粗估,未考虑其他因素对Y的影响多因素分析:Y=+1X1+2X2+3X3+nXn生存状态=+1*治疗方案+2*年龄+3*并发疾病校正后估计,考虑其他因素对Y的影响,49,多变量分析中变量的选择,统计学方法Backward,Forward,StepwiseAIC,BIC,Adjusted-R2临床意义风险因素“All models are wrong,but some are useful”,50,总结,根据研究问题选择研究设计是否需要前瞻性的收集数据(数据积累)省时高效正确认识回顾性研究的局限性,51,