投稿问答最小化  关闭

大型人群队列研究随访监测设计研究进展

2022/5/12 15:05:01  阅读:752 发布者:

摘要

随着人们对复杂性疾病病因研究需求的日益提升,大型队列研究逐渐替代传统小样本队列研究,成为流行病学研究的热点。随访作为队列研究中的获取疾病发病、死亡以及迁移或失访资料的重要环节,其质量对队列研究的结论有着直接影响。因此,制定合理的随访监测方案成为大型队列研究成功的关键。本文主要针对目前国内外大型队列研究随访监测的内容和方法进行综述,旨在为新建队列研究的随访方案设计和现有队列随访方案改进提供建议和思路。

 

随着社会经济的快速发展和人们生活方式的转变,以慢性非传染性疾病为主的复杂性疾病逐渐成为当代人类的主要死因[]。队列研究是重要的流行病学研究设计方法,常用于重大疾病病因以及暴露与效应的因果关系研究[]。但是,复杂性疾病尤其是慢性非传染性疾病的发生往往是在基因与环境交互作用下形成的,并且具有较长的潜隐期[],而传统队列研究存在样本量较小、随访期较短、代表性不足、耗资较大以及共享性较差等局限,使其无法满足发病率较低疾病研究的需求[]。

 

大型队列研究是指在扩大传统队列研究样本量(5~50万)、延长随访期的同时,基于不同的方法减少耗资、提高研究效率及队列设计的科学性,伴随生物样本库的建立以及各组学、大数据科学、分子影像等现代科学技术的纳入,深入探寻多种暴露因素与多种复杂性疾病之间关联的研究,为疾病的精准预防、诊断和治疗提供重要流行病学依据[]。

 

随访是队列研究获取暴露因素的长期变化和结局事件发生信息的重要手段,也是建设大型队列研究过程中难度较大的环节。随访期的延长虽然能够获取更多疾病发病、死亡等健康结局,但是同时也对失访率控制、现场组织以及成本控制提出了更高的要求。高效敏感的随访监测方法是大规模队列研究最终取得成功的关键,制定高应答率和低失访率的随访方案有利于保证随访资料的完整性,更有助于统计分析和结果推断[]。因此,基于具体的研究条件和研究目的,对不同的随访内容采用合适的随访监测方法,是大型队列长期随访数据的准确性和完整性,以及疾病病因准确推断的重要保障[]。本文主要针对目前国内外大型队列研究随访监测的内容和方法进行综述,旨在为国内其他大型队列研究随访方案设计提供思路。

 

01大型队列研究随访内容

 

随访的主要目的是准确获取队列人群暴露因素的变化、疾病发病、死亡等结局事件,以及人群迁移和失访相关的资料,为探讨多种暴露因素与不同健康相关结局之间的关联提供保障。

 

1. 暴露因素:指与研究目的密切相关且研究对象接触到的某种物质、特征(性别、年龄等)或行为,是研究项目需探讨的因素[]。队列研究通过观察多种防治举措或不同危险因素暴露下人群的健康相关结局,探讨防治举措及危险因素与疾病发生发展和死亡的因果关系[]。

 

随着医学的发展,暴露的研究范围逐渐由具体到宏观,从生物因素到社会、心理因素;暴露的测量水平重心逐渐由群体转向个体及分子层面[]。如美国护士健康队列研究(Nurses' Health StudyⅠ,NHSⅠ)最初关注的暴露因素为避孕方式、吸烟等,而后拓展到生活因素、行为习惯、个人特征等,并在队列的第二阶段(NHSⅡ)和第三阶段(NHSⅢ)新增了少数族裔和年轻研究对象,补充了体育锻炼和饮食情况等信息的收集;NHS还收集研究对象的血液、尿液、面颊细胞等以研究多种生物标志物与疾病的关系[]。

 

在队列研究的随访阶段,部分暴露因素可能会随时间而发生变化,因此在队列研究的设计阶段,应明确地定义所要研究的暴露因素,并尽量采用定量或半定量的测量方法,从而有效分析暴露和疾病之间的量效关系[]。

 

2. 结局:结局变量的简称,是队列研究预期发生的结果,也是观察的自然终点,如死亡、发病或住院,某些指标的改变也可以作为结局。大型队列研究可同时收集多种结局指标,因而可进行“多因多果”的关联研究[]。如英国“百万女性队列研究”(Million Women StudyMWS),共纳入了130余万名英国女性,该队列主要结局指标为乳腺癌,但同时也关注不同因素长期或短期暴露对妇女多种癌症、冠心病、中风、糖尿病、痴呆、精神疾病、骨折等多种疾病结局的影响[]。

 

3. 迁移和失访:迁移是指研究对象虽然户口迁离调查区域,但仍能监测到相关健康资料的情况;失访是指研究对象及其户口都迁出调查区域,且在12个月内≥3个不同月份的不同日期,通过电话、入户、问询邻里亲友、居委会等人员均无法得知其下落,或者有下落却无法长期随访的情况[]。原则上,队列研究的失访率应尽量控制在<20%,以降低失访偏倚。

 

辅助常规迁移失访监测、维持队列人群的稳定可通过社区定向监测进行。社区确认调查对象后,会进行死亡或发病事件的核对;对于无法匹配、失访、迁移的调查对象通过医保、公安部门的资料确认情况。

 

02随访监测方法

 

随着大型队列研究的兴起,随访数据的获取在传统电话随访、信件随访、家庭访视、门诊随访等方法的基础上[],发展出了与现代医疗系统、社会保障体系、公共安全体系、疾病监测体系等数据平台相互整合的方式]。随访监测方法的发展为获取健康结局事件提供了机会,研究者应根据研究目的和研究条件,针对不同的结局事件,选择合适的监测方法以准确高效地获取相关信息。

 

1. 暴露因素监测方法:暴露的测量同时考虑定性和定量两个方面,并尽量采取定量或半定量和客观的测量方式,包括问卷调查、体格检查、实验室检测等方法[]。常见暴露因素如个人基本人口学特征、生活习惯、疾病史和家族史等信息可通过电话、门诊等途径进行问卷调查。随着网络的应用和普及,网络问卷和移动设备成为获取此类信息的新方式。如瑞典生命基因研究(LifeGene)通过网络问卷收集了社会人口学资料、生活方式、自我护理、疾病史和家庭史等多种信息[];NHSⅢ利用基于网络的问卷调查和移动设备获取研究对象孕期等关键生命历程的“实时”数据[]。

 

2. 死亡结局监测方法:死亡登记包括研究对象因各类疾病或意外伤害造成的死亡,有医疗机构死亡、家庭死亡、其他场所死亡和非正常死亡。常规死因登记报告系统主要包括全国疾病监测点(Disease Surveillance PointsDSP)系统、卫生部死因登记系统以及部分省市的死因登记系统[]。

 

进行常规监测时,利用死因登记报告系统获取死因登记数据,并与队列中的随访名单匹配,筛选出队列人群中的死亡事件,再核对匹配死亡医学证明书中的信息并做好随访名单的记录[]。在进行定向监测时,由指定工作人员核对随访名单,登记、查对已上报的死亡医学证明书。对未通过常规途径上报者,派随访人员进入社区或医院调查死因并填写推断量表,由专家统一推断死因,记录死因编码等相关死因信息。

 

3. 发病结局监测方法:随访新发或复发疾病情况,包括疾病诊断、诊断依据、发病时间、确诊单位和死亡等信息。在常规监测中,常常利用卫生健康部门的疾病发病登记系统获取发病信息。在获取较为完整的发病登记数据库后,与队列随访名单进行匹配,以获得较为完整的发病事件情况表,匹配的方法与死亡结局匹配相同。在定向监测时,项目工作人员对发病随访对象的信息进行核查,不匹配或者有疑问者进行入户随访,通过问询家属、获取医疗诊断或相关资料,获得确切发病结局[]。

 

4. 迁移失访监测方法:公安部门的户籍系统是获取随访对象的住所变迁的主要途径,随访工作人员可以通过定期从户籍管理部门的搬迁记录核对调查对象的迁移情况,并详细记录姓名、新旧住址、新旧通讯方式等信息,将确定的迁移、失访对象进行记录。调查点上报的迁移对象需要统计迁移时间、新地址、联系方式等信息[]。

 

03随访周期

 

大型队列研究的基线工作持续时间长,随访不应在基线任务完全结束后才开始。在考虑疾病潜隐期、随访人年数且综合资源条件的情况下,根据基线调查开始的不同时间设置阶段性随访开始时间。

 

1. 随访期:指第一次随访至最后一次随访结束所需的时间。随访期的长短一方面受到疾病和暴露之间的关联强度、疾病潜伏期长短的影响;另一方面也受到项目人力、物力和财力等因素影响,因此研究者应综合考虑上述因素,合理设置随访期长短。通常情况下,暴露因素越强出现的病例数可能越多,随访期可以缩短;潜伏期越长需要随访时间越长,才能获得足够发病人数[]。德国国家队列研究(German National CohortGNC)、美国弗明汉心脏队列研究(Framingham Heart StudyFHS)和中国泰州健康人群跟踪调查队列(Taizhou Longitudinal StudyTZL)均为慢性病队列,其随访期可以长达数十年甚至无限期[]。

 

2. 随访间隔:指进行多次随访时所需要的时间间隔,疾病进程越快,随访间隔越短[]。如LifeGene每年进行一次网络问卷随访,每五年进行一次问卷随访及身体检查[]。中国广州出生队列(The Born in Guangzhou Cohort StudyBIGCS)则在儿童重要生长节点设置随访,因此随访间隔以周或者月为单位[]。

 

随着各个医疗机构之间信息关联的建立,通过已有系统或者直报网络获取结局信息已成为部分有条件地区的主要结局跟踪方式,如英国生物银行和美国全民健康研究项目[]。此时,队列的随访间隔可以较短,甚至是实时的,但是获取信息的准确度可能不如主动随访[]。

 

3. 重复测量:是按一定的时间间隔对现存队列成员进行横断面调查,即抽取一定比例成员或者全员重复调查,其主要目的是得到暴露随时间的变化情况以及对回归稀释偏倚(regression dilution bias)的校正[]。调查方法与基线测量一致,并参照基线调查的内容进行精简或补充。如欧洲癌症与营养前瞻性调查(European Prospective Investigation into Cancer and NutritionEPIC)研究在初次注册后,每3~4年定期进行重复测量,收集研究对象相关信息,如饮食习惯、吸烟、饮酒、体力活动、体重、月经、妊娠、绝经状态等[]。

 

04大型队列研究随访监测方式

 

1. 中国慢性病前瞻性研究(China Kadoorie BiobankCKB):利用中国疾病预防控制中心(Center for Disease Control and PreventionCDC)监测系统,于2004-2008年间收集中国10个地区50余万名成年人的人口学特征、生活习惯、室内空气污染物暴露、患病情况、运动、睡眠、心理状态和生育史等基本信息,身高、体重、腰臀围、体脂成分、肺功能、一氧化碳、血压和心率等体格检查信息,以及随机血糖和乙型肝炎表面抗原检测信息。利用DSP系统发病监测系统和全民医疗保险数据库收集包括死亡、发病和诊疗记录等信息,不同地区CDC每隔6个月进行一次现场质控。参与者与数据库间使用身份证号码进行匹配,以保证匹配的唯一性[]。

 

2. 英国生物银行:建立50万人队列,通过医疗记录详细收集并跟踪参与者人口学特征、生活习惯、工作环境、心理健康、认知功能、体格检查信息、影像学检查结果、生物样本采集、基因组学和环境暴露等信息。利用死亡登记、肿瘤登记、医院记录、初级保健记录(Primary care record)以及调查对象自主上报(Self-reporting by participants)等方式收集包括死亡、各类疾病发病和预后、住院等结局事件[]。由于近年来新型冠状病毒肺炎(Coronavirus disease 2019COVID-19)的流行,该数据库新增了关于COVID-19测试结果、临床事件和处方记录等信息[]。该队列使用英格兰和威尔士地区的国家医疗服务系统(National Health ServiceNHS)的追踪系统(NHS tracing service)编码,苏格兰地区的社区健康编码(Community Health NumberCHNo),姓名和出生日期等其他标识符,追踪研究对象并获得迁移信息[]。

 

3. 美国全民健康研究项目:通过健康调查获取人口学特征、健康状况、生活方式、药物使用情况、个人和家庭病史以及医保情况体格检查获取血压、心率和体质指数等信息,采集血液、尿液和唾液等生物标本;通过关联参与者的电子健康记录获得疾病诊断、检查报告和心电图等信息;通过社会保障死亡主档案、药房系统数据、理赔数据、健康注册登记数据获得疾病发病、用药或治疗疗效相关信息。随访期间,通过参与者佩戴的智能传感器可以长期收集参与者的生理指标信息,利用场景中设置的环境监测器可以获得长期环境暴露信息。通过对参与者提供的居住地或工作地址进行“地理编码”,关联到其所在空间的人口概况和环境污染等相关信息;利用美国环境保护局(U.S. Environmental Protection Agency)获取室外空气质量和空气污染数据,通过国家海洋和大气管理局获得气候数据,评估每位参与者的环境污染暴露情况,同时利用医疗保健设施信息,对每一位参与者进行追踪随访[]。

 

4. 中国京津冀区域自然人群队列(Cohort Study of General Population in BeijingTianjin and Hebei Province):覆盖北京市、天津市和河北省,全生命周期的超过10万人的自然人群队列研究,队列涵盖了婴幼儿及儿童青少年、生活社区自然人群、体检中心自然人群和职业人群,主要关注该地区人群重大慢性疾病的疾病负担以及环境和遗传危险因素[]。队列通过统一编码追溯0~6岁的儿童从孕前开始到入组时的信息;通过学籍信息系统,依托学校卫生常规体检工作对7~18岁的儿童青少年进行监测;通过国家慢性病及行为危险因素监测系统、国家死因监测系统、高血压和糖尿病患者健康管理系统获取社区自然人群的结局事件信息;运用基于网络的健康队列随访报告系统及时追踪体检中心自然人群的结局事件信息;利用已建立的监测系统获取职业健康体检和各相关单位内的职业人群健康状态和相关影响因素[]。该队列计划每2~3年进行一次随访,对失访的对象采用多次、多渠道、多时点的重复追踪方法,以尽可能降低失访率,保障结局事件报告的准确性,同时也便于疾病事件的长期追踪。

 

05国内大型队列研究的挑战

 

虽然大型队列研究可以为多种暴露因素对复杂性疾病发生发展的关联提供重要的流行病学线索,但是大型人群队列研究仍需进行有效的成本控制、依从性保障、质量控制以及研究对象多样化,以建立更具流行病学价值的大型队列研究。如研究者可根据队列研究的目的,选择成本较低的随访方式收集信息以实现成本控制的目的;在依从性保障方面,选取合适的随访监测方法、建立绿色通道补助等方法提高研究对象依从性;通过制定统一的随访方案,进行统一培训,设定专人核查各结局事件以保证随访的有效性;在综合考虑研究成本、质控和结局收集等问题的基础上,增加有特色的小样本队列以观察不同群体的结局事件等[]。

 

综上所述,随着精准医学和大数据的不断兴起,大型人群队列研究逐渐成为流行病学研究的热点。电子病历的普及、健康档案的建档和可穿戴设备的兴起,都为大型队列研究的长期随访提供了前所未有的机遇。在大型人群队列研究随访工作中,准确掌握暴露因素、结局事件以及迁移和失访的情况关乎研究的成败。本文详细介绍了国内外大型队列研究及其随访监测的内容和方法,为未来队列研究随访方案设计和已有队列研究改进提供思路。

转自:医学科研与管理空间 2022-05-11 15:10

来源:中华流行病学杂志, 2022,43(1) 祁子凡, 温馥源, 曹寒, .

 

如有侵权,请联系本站删除!


  • 万维QQ投稿交流群    招募志愿者

    版权所有 Copyright@2009-2015豫ICP证合字09037080号

     纯自助论文投稿平台    E-mail:eshukan@163.com