北京富玛特生物科技有限公司
搜索

北京协和医院结肠癌专病数据库的建立:单中心数据库经验

发表时间:2023-09-05 10:26

2017年8月中国临床肿瘤学会(CSCO)成立的结直肠癌大数据中心(BACC)和2017年9月中华医学会外科学分会结直肠外科学组所建立的中国结直肠癌手术病例登记数据库(CCCD)是我****结直肠癌数据库建设的初步尝试,但其临床管理和信息登记仍需完善。


除***数据库外,国内单中心数据库的建设也处于蓬勃发展状态。四川大学华西医院于1995年建立了来源于区域性医疗中心的华西肠癌数据库(DACCA)。为适应学科发展需求,北京协和医院结直肠专业组2016年1月正式建立北京协和医院结肠癌专病数据库,该数据库可与全院的医院信息系统(HIS)相关联,并由专职科研助理进行管理。


截至目前,北京协和医院结肠癌专病数据库已运行6年余,完成近2000例行手术治疗结肠癌患者的数据录入及随访工作,本研究基于该数据库中结肠癌患者的基础特征和生存信息,首次对该数据库进行介绍和展示,并计算相关条目的缺失率及随访率,以期为我国结直肠癌数据库的建设与发展提供借鉴。

研究对象


本研究数据来源于北京协和医院结肠癌专病数据库中2016年1月5日—2022年5月11日行手术治疗的结肠癌患者。该数据库为前瞻性登记的临床数据库,其基于全院HIS系统,可于病历录入界面设置提取字段(如外院辅助检查报告提示的病变部位等),并自动同步录入临床科研数据管理系统,最终由全职科研助理进行信息的二次核对及随访信息录入,数据库相关操作界面见图1。

zs1.jpg

图1 北京协和医院结肠癌专病数据库操作界面


A.登录页界面;B.数据录入界面;C.数据模块界面示例


数据库准确性


真实的数据分析是相关部门制订卫生决策的重要依据,而真实的数据分析需以数据准确性为前提。在数据库准确性方面,主要有以下3种可评估的方式:

(1)人工复核数据库条目与病历登记信息,以查验其准确性;

(2)与国家保险等其他客观数据来源进行数据比对;

(3)通过该数据库中某些关键特征信息与高质量研究进行比对,以间接判断数据库数据准确性。


**种方式实际操作存在较大难度。以本中心数据库为例,研究期间共登记250 980个单独的数据字段,一次性进行人工复核可行性差。通过与其他客观数据来源进行核验是一种潜在的数据验证方式,如Mallin等[6]通过比对NCDB数据库与俄亥俄州保险赔付的信息,认为NCDB数据库手术信息登记具备的准确性为中等(k=0.64)。但其他客观数据可及性差,可行性仍不高。


因此,本数据中心一方面通过数据库与病历系统的链接实现条目直接导入,减少人工录入或重复录入导致的失误;另一方面,在日常研究统计分析时注意数据的核对,若发现登记有误则及时反馈科研助理,从而不断提高数据质量。


在数据库关键信息方面,本中心数据库体现出了北京协和医院就诊患者的特点。患者平均年龄为(62.75±11.97)岁,BMI为(23.68±3.46)kg/m2,与华西医院DACCA数据库较为一致[年龄:(59±13)岁,BMI:(22.77±3.30)kg/m2],且本中心数据库患者年龄、BMI分布未随手术时间改变而发生显著变化,与DACCA数据库中患者年龄、BMI随时间变化趋势的拟合结果亦不具有显著性相符合。


在患者病理分期信息方面,DACCA数据库中患者的TNM分期分布为Ⅰ期11.7%、Ⅱ期31.4%、Ⅲ期31.1%、Ⅳ期22.5%,而本中心数据库TNM分期Ⅰ~Ⅳ期患者占比分别为16.1%、40.3%、36.6%和7.0%,该数据库中Ⅳ期患者的占比较DACCA数据库明显减少,可能与二者的数据来源存在差异有关,DACCA数据库建设初期包含了由肿瘤内科申请进行多学科协作诊疗的患者,此部分病例病情复杂、病理分期较晚[7]。


在其他一些关键标志性数据方面,北京协和医院结肠癌专病数据库与既往高质量前瞻性研究亦具有一致性,如本中心数据库显示结肠癌术后吻合口漏发生率为1.3%,与COLOR随机对照临床试验中吻合口漏发生率相近(2.5%)[8]。


与SEER数据库中按照美国癌症联合委员会(AJCC)分期的患者相比,本中心数据库中不同TNM分期结肠癌患者的5年生存率均增高[9],推测可能的原因:(1)本中心数据库建立时间晚于SEER数据库,随着医疗水平的提高,肿瘤患者预后得到了改善;(2)SEER数据库反映了美国各医疗机构整体的结肠癌流行病学数据,而单中心数据则与本中心的医疗水平和患者依从性相关。


相较于既往数据库,本中心数据库存在如下优势:(1)与全院HIS系统相关联,可高效获取标准化的信息,保障了数据条目的统一性、完整性,减少了统计分析过程中的数据损失;(2)由专人负责数据维护与核对并对患者定期随访,发现登记错误能及时更正,保障了数据的真实性、连续性。


该数据库亦存在需完善之处:

(1)进一步细化登记条目手册,明确定义条目的分类规则,并根据临床指南的更新及时迭代登记分类条目;

(2)与肿瘤内科、消化内科开展多学科协作联合登记;

(3)与国外一些数据库相比,随访率仍有待提高,如梅奥诊所建立的结直肠癌登记数据库中1972—2017年登记患者的完全失访比例仅为0.16%(44/26 908)[10]。此外,本数据库中完全按照要求进行随访的患者比例亦较低,而连续随访是保障生存结局准确性的关键,因此进一步提升随访率是下一步亟待改善的目标。


小结


肿瘤专病数据库包含大量真实的临床数据,不仅可为基础研究和临床科研提供思路和素材,同时是数据挖掘、人工智能与机器学习、卫生经济学研究溯源的基础。本研究对北京协和医院结肠癌专病数据库建立以来连续6年余的数据进行了分析,结果显示该数据库条目缺失率较低,几乎所有的患者均具有随访信息,整体数据质量较高,具有一定的参考价值,但连续随访率仍存在较大的提升空间。单中心数据库是未来建设多中心联合专病数据库的基础,通过总结本中心结肠癌数据库相关经验,相信可为其他专业医疗数据库的建立提供参考。




北京富玛特生物科技有限公司

官方合作热线:400-870-0515
邮箱:fmt@fmtbio.com
地址:北京市丰台区花乡高立庄616号新华国际中心B座4层428室

官方微信订阅号
官方微信服务号