《流行病学第三章 描述性研究.ppt》由会员分享,可在线阅读,更多相关《流行病学第三章 描述性研究.ppt(92页珍藏版)》请在课桌文档上搜索。
1、第三章 描述性研究,Descriptive Study,流行病学教学工作室,1.如何了解江苏省自然人群糖尿病的分布特点?2.如何了解江苏省人群丙型肝炎的流行特点?3.如何了解男男性行为(MSM)人群艾滋病流行情况?4.如何研究空气污染和人群健康的关系?,概述,第一节 现况研究,第二节 生态学研究,总结,讲课提纲,描述性研究,又称描述流行病学(descriptive epide-miology),指利用已有的资料或对特殊调查的资料包括实验室检查结果,按不同地区、不同时间及不同人群特征分组,把疾病或健康状态的分布情况真实地展现出来。属观察性研究,是流行病学研究的基础步骤。,概 述,概念,历史或常规
2、资料的收集和分析 现况研究(横断面研究)生态学研究(相关性研究)随访研究 个案调查和病例分析,分类,描述性研究,第一节 现况研究,Prevalence Study,在某一特定时点或时期对某一定范围的人群,以个人为单位收集和描述人群的特征以及疾病或健康状态的分布,又称现况研究或横断面研究(cross-sectional study)。,现况研究的概念,现况调查 现患研究 患病率研究,横断面研究设计原理示意图,描述疾病或健康状况的三间分布情况,进行社区诊断(community diagnosis)。描述某些因素或特征与疾病或健康状态的联系,提出病因假设或提供病因线索。评价防制措施的效果。确定高危人
3、群、筛查出患有研究疾病的人群,从而达到早发现、早诊断和早治疗的目的。二级预防 为进一步流行病学研究提供基础。,现况研究的应用,1、不太适用于病程比较短的急性病研究。2、无法区分暴露和疾病之间的时间先后。3、一般不能获得发病率资料;只有定期重复可获得。,现况研究的特点,优点,1、最常用的流行病学调查方法;一般不设对照。2、适用于暴露因素不易发生变化的研究。3、适用于暴露因素后期累积作用的观察。,局限性,现况调查的种类,普查(census)抽样调查(sampling survey),普查(census)是指在特定的时点或时期、特定范围内的全部人群均为研究对象的调查。,普 查,概念,目的,早期发现和
4、诊断病人。了解疾病或健康状况的分布。,优点 能发现普查人群中全部病例,并给予及时的治疗 能对该地区某病的全貌有一个了解 通过普查可进行一次广泛的医学科普宣传局限性 不适于患病率低和检查方法复杂的疾病调查 普查对象多,难免漏诊、误诊 工作量大,很难进行深入细致的调查,应用原则要明确普查的主要目的,是为了早期发现病例并给予 及时治疗。二级预防(secondary prevention)普查的疾病最好是患病率比较高的,以便短时间内调 查能得到足够的病例。普查应具备灵敏度高、特异性强且易于在现场实施的 检验或检查的方法。筛检(screening)要有足够的人力、物力和财力支持进行普查。,一种以小测大,
5、以局部估计总体的调查方法 基本原理 代表性 取决于 随机化样本大小,抽样调查,优点 用样本来代表和说明总体节省人力、物力和时间调查的精确度高局限性 非全面的调查方法设计、实施与资料分析比较复杂不适用于变异过大的材料和患病率太低的疾病,抽样调查的优缺点,设计模式,现况研究的设计与实施,一、明确调查目的 此次调查要回答什么问题?,现况调查设计与实施要点,描述分布,进行社区诊断?提出病因假设?评价防治效果?二级预防(早发现?早诊断?早治疗?)提供基线资料?,二、掌握有关背景资料 对该问题已了解多少?,有三种途径:既往经验总结 征询有关专家意见 查阅国内外文献,才能阐明该研究的科学性、可行性、创新性
6、才能估价其社会效益和经济效益,三、确定调查类型和调查对象,研究总体是什么?范围有多大?如何抽样?样本量大小?,调查类型:是普查?还是抽查?调查对象:,四、明确抽样方法,估算样本含量,概率抽样(probability sampling)非概率抽样(nonprobability sampling),抽样技术,非概率抽样,概率抽样,方便抽样,判断抽样,配额抽样,滚雪球抽样,单纯随机抽样,系统抽样,分层抽样,整群抽样,多级抽样,其他抽样技术,按比例,不按比例,单纯随机抽样(simple random sampling)系统抽样(systematic sampling)分层抽样(stratified s
7、ampling)整群抽样(cluster sampling),多级抽样,概率抽样,抽样方法,单纯随机抽样(simple random sampling),EpiCalc 2000,研究人群累计单位数,从1200人(户)中随机抽取12人(户),等分为12个抽样间隔,从第一个抽样间隔中的随机起点开始,系统抽样(systematic sampling),总体,层,层,层,可按地区、年龄、性别、种族、教育水平等分层,在各层内再单纯随机抽样,分层抽样(stratified sampling),整群抽样(cluster sampling),社区、班组、班级等,不同的抽样方法从同一总体中抽取含量相等的样本。
8、一般来说,四种方法的抽样误差大小如何排序?,各种概率抽样方法比较,样本含量的估算,研究单位之间的变异(一般用标准差s 表示)调查人群中欲调查特征或疾病的个体所占的比例(也即 暴露比例或患病比例)调查要求的精确度“容许误差”,即实际值和预期值差异 的大小把握度的大小,由和1-来表示,决定因素,率的抽样(单纯随机抽样,符合二项分布),估算公式,P:预期现患率,Q1Pd:样本率与总体率之差,均数的抽样(单纯随机抽样,符合或近似正态分布),如果是整群抽样,样本量一般在此基础上增加50%。如果率符合Possion分布,可参考期望值可信限表。,s:标准差d:容许误差,即精确度,单纯随机抽样预期患病率10%
9、,允许误差10%,单纯随机抽样预期s3.38,允许误差0.5,非概率抽样,通常用于下列情况:样本量规模很小时 探索性研究或研究的初始阶段 目标总体成员很少或很难寻找 无法采用概率样本时,就近抽样(偶遇抽样、方便抽样、自然抽样)指研究者根据现实情况,以自己方便的形式抽取偶然遇到的人作为调查对象,或者仅仅选择那些离得最近的、最容易找到的人作为调查对象。,目标式和判断式抽样(主观抽样、立意抽样)研究者依据主观判断选取可以代表总体的个体作为样本。样本的代表性取决于研究者对总体的了解程度和判断能力。它是“有目的的”选择样本。比如,在问卷涉计阶段,为检验问题设计的是否得当,常有意的选择一些观点差异悬殊的人
10、作为调查对象。又如,研究者专找那些偏离总体平均水平者作为调查对象,其目的是研究什么使他们发生偏离,发现问题,提出假设,而不在于对总体作出概括。,滚雪球抽样 同伴推动抽样法(RDS)当无法了解总体情况时,可以从总体中的少数成员入手,对其进行调查,询问还知道哪些符合条件的人;再去找那些人并询问他们知道的人。如同滚雪球一样,可以找到越来越多具有相同性质的群体成员。配额抽样(定额抽样)与分层抽样中的比例抽样相似,也是按调查对象的某种属性或特征将总体中所有个体分成若干类或层,然后在各层中抽样,样本中各层(类)所占比例与他们在总体中所占比例一样。,要获取哪些数据?指标是什么?体现在调查表上 测量的方法、标
11、准如何?疾病的测量 暴露的测量,五、测量的指标和方法的确定,通过测定或检查方法感染情况、血压等直接用调查表的方法确定调查变量调查表的编制选择和培训调查员预调查,疾病的测量 尽量采用简单、易行,灵敏度、特异度均高的诊断方 法(技术)。诊断标准要提前建立,要严格、统一。诊断标准可进行评价,可比。暴露的测量 必须有明确的定义和测量尺度。灵敏度、特异度均高。,“调查问卷”(Questionnaire)是流行病学调查最主要工具。,六、调查表的设计,如何设计?取决于研究目的和分析手段的需要 格式:把拟收集的数据项目用恰当措词构成一系列问题 内容:包括 一般项目(一般情况、识别项目)研究项目(研究变量)类型
12、:自填表问卷表 开放式 封闭式 混合式,导言知情同意书(ICF)调查表的题目、编号 一般项目社会人口学特征资料 研究项目 流行病学项目疾病史、遗传史、行为暴露史等。临床体格检查项目 实验室检测项目 核查项目调查员签名、调查日期等 填表说明,调查表的基本结构,调查表编写的基本原则,调查项目的确定 调查项目顺序的编制 调查问题的设计 问题设计的形式,根据研究目的和手段确定变量的数目和具体内容。各项目指标的定义要明确;尽量采用客观、定量或半定量的指标;指标的测量从技术上、经费上必须可行。项目要精选,有针对性且重点明确;需要的项目一个也不能少,不需要的项目一个也不能多。研究中的主要变量,不仅需要定性而
13、且需要定量测量。可成对设置一些高度相关或内容完全相同而形式不同的问题,检验调查表的信度。,调查项目的确定,“五不问”原则,可问可不问的项目不问。复杂问题项目不问。查找资料才能回答的项目不问。被调查者不愿意回答的项目不问。通过其他手段才能解决的问题不问。,调查项目按逻辑顺序与心理反应分类排列,符合调查对象的交流习惯。可根据人们的思维方式,按事物的内容和相互关系以及事情发生、发展的先后顺序排列。先设定容易回答的,后设定敏感的、不容易回答的问题。先排列封闭式问题,后排列开放式问题。检查信度的问题须分隔开来。采用不同调查方式,调查表项目的顺序应有所区别。,调查项目顺序的编制,问题应简单明了,所用的语言
14、通俗易懂,语句精练准确。问题设计应避免诱导性,避免出现暗示或有固定倾向的问题。调查指标尽可能地用等级划分或定量化,不能量化的指标应留出空间以便详细记录。封闭式设问的选项设计必须具有科学性和严密的逻辑性。对一些抽象性的概念或问题,最好给出一些具体的看法,让被调查者仅回答赞成与否。对一些敏感性问题,可采用专门设计的调查表并采用特殊的调查技术进行调查。,调查问题设计的原则,问题设计的形式,二项式 是1,否0 多项式 文盲=1,小学=2,初中=3,高中/中专=4,大专以上=5填空式 出生日期:年 月 日图画式 请画出一个三角形:矩阵式尺度式 用药后你的疼痛程度:不痛 0|1|2|3|4|5|6|7|8
15、|9|10 很痛,调查表使用注意事项,调查表的使用必须伴有操作指南或使用手册,明确具体的质控措施。正式实施前,可通过预调查或培训会对调查员进行统一的培训和考核。填写调查表时,字迹要工整、清楚,不能缺项。调查员和质控人员要签名,并注明调查和质控日期。,样本选取必须随机化 应答率一般应高于80%-90%进行预调查 统一培训调查员 调查和检查方法标准化,且前后一致 调查后复检,七、现况调查的质量控制,1.数据整理 录入计算机前的检查、双轨录入计算机时的检查和统计分析前的检查 某些变量需要分组、分级、编码等2.数据分析(1)计算有关统计指标(2)描述疾病或健康状态的分布 患病率(3)分析性描述 相关或
16、关联分析、多因素分析3.结果解释,八、数据资料分析和结果解释,九、现况研究中常见的偏倚及其控制,抽样误差 随机误差(random error)偏倚(bias)系统误差(systematic error),1.选择性偏倚(selection bias)是指在研究对象选择 过程中所产生的系统误差。通常包括以下几种:,现况研究中的偏倚及其控制,选择性偏倚 无应答偏倚(no-response bias)选择幸存者偏性,2.信息偏倚(information bias)是指在收集资 料过程中所产生的各种系统误差,使所获得的资 料缺乏真实性和可靠性。通常有以下几种:,调查对象所引起的偏倚 调查人员所引起的偏
17、倚 测量偏倚 调查环境所引起的偏倚,某省糖尿病流行特征的抽样调查,案例讨论,了解现况调查的特点和应用。掌握抽样调查的基本原理、设计、实施和资料分析。,目的,研究背景,糖尿病(Diabetes Mellitus,DM)是一种由多种环境因素和遗传因素联合作用而导致的一种高血糖状态的疾病,病变累及心、肾、肝、眼等器官,其分布遍及世界各地,已成为一种全球性的慢性非传染性疾病,严重威胁人类健康。某省是我国经济和社会发展水平相对较发达的地区之一,随着经济的发展,人民生活水平有了很大的提高,平均寿命已接近发达国家水平,传染性疾病在全省范围内已得到较好的控制,而恶性肿瘤、心脑血管疾病和糖尿病等慢性非传染性疾病
18、已成为影响居民健康的主要疾病。作为“中国糖尿病流行特征的研究”的协作省份之一,为了解该省20岁及以上社区居民糖尿病的分布情况、主要影响因素,于1996年10月至1997年1月开展了本项研究。,【问题1】这是一种什么性质的流行病学研究?是描述性 的还是分析性的?本次调查回答什么问题?【问题2】该种研究有何特点?应用范围有哪些?【问题3】临床上糖尿病主要分为1型和2型,此次只调查 2型糖尿病的流行特征,为什么?,调查设计,按“中国糖尿病流行特征的研究”操作指南的统一要求,进行分层整群抽样调查。根据该省省情,首先选择省会城市,再按经济社会发展水平随机抽取一个中等城市、一个小城市、两个相对发达县、一个
19、相对不发达县作为地区样本。省会城市和小城市再按照经济社会发展水平的高低,各随机选择两个区,每个区各随机选择一个社区居民委员会;中等城市选择两个区,每个区各随机选择两个社区居民委员会作为调查现场。一个相对发达县选择四个行政村,另两个县各随机选择两个镇(乡),每个镇(乡)选择镇(乡)政府所在地并随机选择一个行政村作为调查点。共计20个社区居民委员会、镇(乡)政府所在地和行政村。调查对象为所有在调查点居住5年以上的20岁及以上社区居民。每个调查点调查480人,共计9600人。,调查方法和对象,【问题4】抽样调查的基本原理是什么?如何保证样本 具有足够的代表性?【问题5】抽样调查的方法有几种?各有何优
20、缺点?【问题6】为什么本次调查采用分层整群抽样?【问题7】决定抽样调查样本大小的因素有哪些?【问题8】查阅文献,假定我国20岁以上人群2型糖尿病 的患病率为5,采用单纯随机抽样,则约需 调查多大样本?,采用“糖尿病流行病学调查表”进行调查,内容包括一般情况、糖尿病史、糖尿病症状、其它疾病史、糖尿病家族史、吸烟情况、饮酒情况、体力活动、月经生育史、体格检查和血糖测定等。血糖测定采用葡萄糖氧化酶法。糖尿病诊断依据糖尿病病史和口服糖耐量试验(OGTT),按照1985年WHO标准,即空腹口服75克葡萄糖后2小时血糖值200mg/L为糖尿病(DM),血糖140-200mg/L之间为糖耐量低减(IGT)。
21、肥胖程度的划分以体质指数(BMI)为依据,BMI=体重(kg)/身高(m)2,BMI18kg/m2为低体重,18kg/m225kg/m2为正常体重,25kg/m227kg/m2为超重,27kg/m2为肥胖。,调查内容及诊断标准,【问题9】试述现况调查的内容如何确定?调查项目如何选择?【问题10】试述诊断标准制定对抽样调查结果的影响?,依据“中国糖尿病流行特征的研究”操作指南,由负责总课题的流行病学专家对该省省级课题研究人员进行调查培训,再省级调查负责人对现场调查员、组织者等参加人员进行二级培训,达到统一方法,统一标准,统一操作规程,统一质量控制措施。,调查培训和质量控制,【问题11】为何统一质
22、量控制措施?如何保证措施的落实?,首先根据派出所的户籍登记表,对每个抽样点20岁及以上的社区居民全部登记,然后通知被登记居民按要求在指定时间到指定的地点接受调查。在调查过程中出现了下列几种情况:1、在农村地区由于一些男性青壮年外出打工,导致他们虽被登记但无法接受调查;2、个别地区由于事先宣传动员工作比较到位,加上所有的检查都免费,一些没有被登记的居民也主动接受了调查;3、某个地区提出,到社区进行调查难度较大,建议是否可以选择某些厂矿,调查全体职工及其家属。,调查实施,【问题12】第1和第2种情况对调查结果有何影响?如何解决这个问题?【问题13】对第3种情况,负责人不同意上述建议,为什么?【问题
23、14】在调查实施过程中可能还会出现哪些偏倚?如何控制?,所有调查表经校对无误后,通过软件SPSS/DE录入微机,建立数据库,通过SAS6.11软件包逻辑检查修改无误后,采用Epi Info 6.0软件进行统计分析,分析指标包括患病率及其差异的显著性检验、标化患病率、趋势性2检验等。,统计分析方法,【问题15】用哪些计算机软件可以建立数据库?【问题16】在录入数据过程中可能出现哪些偏倚?如何控制?,此次调查共得有效样本8734人,应答率90.98(8734/9600),其中男性3679人,女性5055人,男女性别比1:1.37;平均年龄45.49岁。共确诊糖尿病患者508人,男性患者170人,女
24、性患者338人。其中既往有糖尿病史者261人,新诊断糖尿病患者247人,也即48.62%的患者已有明显的血糖升高而未能被及时诊断。IGT患者共513人,其中男195人,女318人。该省20岁及以上社区居民糖尿病和IGT的粗患病率分别为5.82%、5.87%,按1982年全国人口年龄构成标化患病率分别为4.63%和 5.07%。,结果分析,【问题17】上述糖尿病和IGT粗患病率如何计算?【问题18】按全国人口年龄构成计算标化患病率的意 义何在?【问题19】完成表1的计算,并对结果进行解释。,【问题20】对体质指数和糖尿病的关系进行关联分析,结果如表2,根据该数据得出糖尿病和肥胖之间统计学关联显著
25、,并存在剂量反应关系,能否据此得出肥胖和糖尿病之间存在因果关系?为什么?,第三节 生态学研究,Ecological Study,以群体为基本单位收集和分析资料,研究暴露与疾病或健康状况的关系,即用代表群体特征的量度来描述暴露与疾病或健康状况的关系。,概述,生态学(ecology)人类生态学(human ecology),生态学研究的定义,生态学研究设计与分析模式,收集疾病或健康状态以及某些因素的资料时,以群体为单位,而不是以个体为单位。描述某疾病或健康状态在各人群中所占的百分比或比数,以及有各特征者在各人群中所占的百分比或比数。缺乏在人群中既有某病或某健康状态、又有某项特征的个体数据。,生态学
26、研究的特点,生态学研究只是一种粗线条的描述性研究。,1.生态比较研究(ecological comparison study),生态学研究的方法,2.生态趋势研究(ecological trend study),发病率或死亡率的比较 相关因素的分布(暴露率),患病率或死亡率的变动趋势某因素的变动趋势,南方12省市血吸虫病发病率和大肠癌调整死亡率,r0.706,P0.01,r0.903,P0.001,浙江省嘉兴地区血吸虫病发病率和大肠癌调整死亡率,1.提供病因线索,尤其对某病或健康状态不很解时。2.间接验证已存在的病因假设。3.评价干预实验或现场实验的效果。4.人群中变异较小和难以测定的暴露研究
27、。5.疾病监测工作中的应用。,生态学研究的应用,由于生态学研究是以由各不同情况的个体“集合”而成的群体为观察、分析单位,因而只能对暴露和疾病的关系进行粗线条的描述和分析,容易产生生态学谬误(ecological fallacy)。生态学研究显示某疾病与某暴露分布的一致性,可能是该疾病与某暴露间真正有联系,也可能毫无联系。当生态学上的联系与事实不相符时称为生态学谬误或生态学偏倚(ecological bias),它主要是由生态学研究的局限性所造成的。,生态学研究的偏倚,优点1.生态学研究最显著的优点是在所研究的疾病病因不明、方向尚不清楚时,它能提出病因线索供进一步深入研究。2.生态学研究常常可以利用历史和常规资料进行研究,因而节省时间、人力和物力,可较快得到结果。3.尤其适用于人群中变异较小和难以测定的暴露研究。4.比较适合对人群干预措施效果的评价。在某些情况下,不一定需要作出个体水平的评价,而是需要作出群体水平的评价。此时应用生态学研究更为适宜。,生态学研究的优缺点,1.缺乏暴露和疾病联合分布的资料 2.缺乏控制可能的混杂因素的能力 3.相关资料中的暴露水平不是个体的实际值 4.暴露和疾病间的时间顺序难以确定,局限性,粗线条的描述性研究,容易产生生态学谬误。,总 结,描述性研究即是描述疾病三间分布的研究。,