本文是流行病学学习笔记的第一篇,上课时间为 2019 年 2 月 20 日。
概述
概念
描述性研究是利用常规检测记录或通过专门调查获得数据资料,按不同地区、不同时间及不同人群特征分组, 描述人群中疾病或健康状态分布状况或暴露因素的分布情况,在此基础上进行比较分析,获得疾病三间分布特征, 进而提出病因假设和线索。
种类
描述性研究主要有以下 7 种类型:
- 现况研究
- 病例报告
- 病例系列分析
- 个案研究
- 历史(常规)资料分析
- 随访研究
- 生态学研究
现况研究和生态学研究会在之后重点介绍。
病例报告(case report)是针对临床实践中某种函件疾病的单个病例或少数病例,重点关注个案特征,探究疾病背后产生的原因, 无需描述食物的集中趋势或离散程度,属于定性研究的范畴。
病例系列分析(case series analsis)是对一组病例相同疾病的临床资料进行整理、统计、分析、总结并得出结论, 一般分析临床表现特征,评价预防、治疗措施的效果,为进一步研究提供线索,并能显示某些疾病的自然进程的规律性。
个案研究(case study)运用流行病学的原理和方法,到疾病现场对新发病例的接触史、家属及周围人群的发病或健康状况 以及与发病有关的环境因素进行调查,以达到查明所研究病例的发病原因和条件,防止再发生类似疾病,控制疫情扩散及消灭疫源地的目的。个案研究的对象常为传染病病人。
历史资料分析通过回顾性调查,提取和利用历史既有资料,研究疾病的三间分布、疾病危险因素和评价疾病防治措施效果, 包括相关机构的日常工作记录、登记、各类日常报告、统计表格、疾病记录档案等等。
随访研究可分为纵向研究(longitudinal study)和前瞻性研究(prospective study)。 通过定期随访,观察疾病、健康状况或某卫生事件在一个固定人群中随着时间推移的动态变化情况。 随访研究常用于疾病自然史的研究,为该疾病的病因研究提供线索,提出或验证某些病因学假设。
特点
描述性研究的主要特点是,以观察为主要研究手段,不对研究向采取任何干预措施,仅通过观察、收集和分析相关数据, 分析和总结研究对象或事件的特点。 暴露因素不是随机分配,不设立对照组,暴露和结局的时序也无法确定,对病因推断存在一定的局限。
用途
描述性研究描述疾病或某种健康状况的分布及发生发展的规律, 包括疾病危险因素的发现、高危人群的确定、疾病患者的早发现、早诊断和早治疗、人群疾病防治策略与措施的提出、卫生政策和医疗卫生计划的制定。
另外描述性研究可以通过比较三间分布的差异,获得病因线索,提出病因假设。
现况研究
概述
概念
现况研究是对一个特定时点或时期内特定范围的人群中,对某种疾病或健康状况以及相关因素进行调查, 提供建立病因假设的依据。 调查包括描述疾病或健康状况以及相关因素在调查人群中的分布, 或按照不同因素的暴露特征或疾病状态进行比较分析。
现况研究根据观察时间为横断面研究(cross-sectional study),根据分析指标为患病率研究(prevalence study)。
研究目的与应用范围
- 掌握目标群体中疾病或健康状况的分布(患病率)
- 提供疾病病因研究的线索
- 确定高危人群
- 评价疾病监测、预防接种等防治措施的效果
研究特点与研究类型
现况研究的研究特点:
- 开始时不设立对照组
- 研究的特定时间或时期
- 在确定因果联系时受到限制
- 不能确定时间顺序
- 研究对象更多的是存活期长的病人
- 对不会发生改变的暴露因素,可以提示因果联系
- 定期重复进行可以获得发病率资料
现况研究有两种类型:普查(census)和抽样调查(sampling survey)。
普查(census)面向特定时点或时期、特定范围内的全部人群, 优点包括不存在抽样误差,可以同时调查多种疾病或健康状况,能发现目标人群中的全部病例; 缺点是不适用于患病率低的疾病,工作量大,存在漏查,调查工作人员水平参差不齐,耗时耗力。
抽样调查(sampling survey)是通过随机抽样的方法,对特定时点、特定范围内人群的一个代表性样本进行调查,通过对样本中的研究对象的调查研究,来推论其所在总体情况。 抽样调查省时省力,工作比较细致;但缺点包括设计、实施和资料分析比普查复杂,资料的重复或遗漏不易发现, 不适用于变异过大的研究对象或因素,不适用于需要普查普治的疾病,不适用于患病率太低的疾病。
研究设计与实施
研究设计与实施分为以下步骤:
- 明确调查目的与类型
- 确定研究对象
- 确定样本量和抽样方法
- 资料的收集、整理和分析
- 获得结果与结论(三间分布)
确定研究对象
- 以研究目的为依据
- 明确规定调查对象的人群分布特征、地域范围及时间点
- 考虑可行性问题
确定样本量和抽样方法
计算样本量(1):计数资料
$$ n = \frac{t_\alpha^2 * p * q}{d^2} $$
各个参数含义:
- n:样本量
- p:预期现患率
- q:1-p
- d:容许误差
- t_\alpha:显著性检验统计量
计算样本量(2):计量资料
$$ n = \frac{t^2_\alpha S^2}{d^2} $$
各个参数含义:
- n:样本量
- s:总体标准差的估计值
- d:容许误差
- t_\alpha:显著性检验统计量
抽样方法:
- 非随机抽样
- 随机抽样
- 单纯随机抽样
- 系统抽样
- 分层抽样
- 整群抽样
- 多阶段抽样
不同抽样方法的误差大小排序:整群 ≥ 单纯随机 ≥ 系统 ≥ 分层抽样
质量控制
质量控制方法无非以下几种: 严格遵照抽样方法的要求,确保随机化原则 提高研究对象的依从性,正确选择测量工具和检测方法。 对调查员进行培训,统一标准。做好资料复查、复核工作。选择正确的统计分析方法。
优缺点
优点:
- 来自于人群,有较强的推广意义
- 同期对照组,结果具有可比性
- 一次调查可同时观察多种因素
缺点:
- 难以确定先因后果的时序关系
- 不能获得发病率资料
- 误判潜伏期和临床前期的调查对象,低估研究群体的患病水平
实例
生态学研究
概述
在群体水平研究某种暴露因素与疾病之间的关系,以群体为观察和分析单位, 描述不同人群某因素的暴露状况与疾病的频率,分析该暴露因素与疾病之间的关系。
研究指标有三类:
- 群体本身的属性 (aggregate measures)
- 环境相关的变量 (environmental measures)
- 全局属性 (global measures)
用途:
- 提供病因线索,产生病因假设
- 慢性病病因研究、环境因素
- 评估人群干预措施的效果
- 估计监测疾病的趋势
类型
生态比较研究 (ecological comparison study)
这种类型较为常用。主要可以分为两种:
- 「结局 → 病因」:观察不同人群或地区中某种疾病的分布,根据疾病分布的差异,提出病因假设;
- 「病因 → 结局」:比较不同暴露水平的人群中疾病的发病率和死亡率,为病因探索提供线索。
举例:PM2.5 和糖尿病的关系
研究结果发现,糖尿病患病率随大气中 PM2.5 的浓度升高而增加,PM2.5 每升高 10μg/m^3,患病率升高1%; 即使是在EPA安全范围内,这种两小关系依然存在。
生态趋势研究 (ecological trend study)
生态趋势研究连续观察人群中某因素平均暴露水平的改变与某种疾病的发病率、死亡率变化的关系,了解其变动趋势。 通过比较暴露识别卡变化前后疾病频率的变化情况,来判断某因素与某疾病的联系。
与生态比较研究的区别是,生态趋势研究注重时间维度上的区别。
生态趋势研究有几种分析角度:
- 个体层面(individual-level)
- 群体(completely ecologic analysis)
- 部分(partially ecologic analysis)
优缺点
生态学研究具有以下优点:
- 省时省力
- 对病因未明的疾病提供病因线索
- 个体暴露剂量无法测量
- 当研究的暴露因素在一个人群中变异范围很小时,宜采用多个人群比较的生态学研究
- 适合于对人群干预措施的评价
- 在疾病监测中,可以估计某种疾病发展的趋势
生态学研究的局限性:
- 生态学谬误(ecological fallacy):由于生态学研究以各个不同情况的个体「集合」而成的群体为观察和分析的单位,以及存在的混杂因素等原因而造成研究结果与真实情况不符
- 混杂因素难以控制
- 变量多重共线性问题
- 难以确定因果关系