2022/3/28 14:42:18 阅读:704 发布者:chichi77
这两年很多医院在建立CDR科研数据平台,CDR简单来说就是一个数据仓库,是为了解决医院系统“数据不相通”的问题,建立一个类似“八爪鱼”一样的数据库,把不同的平台整合到一起,方便数据的提取。
很多医院已经建完了科研一体化平台,或者正在建设当中,因此也有很多医生朋友问我,一体化平台建完之后是不是就可以直接把数据导出来,然后由统计师挖掘挖掘,就可以发表SCI文章了?
一开始我也是这么认为的,因此,我们也开发了上述的CDR数据库平台,希望能够低成本的帮助医院产出科研成果,但是当真正落地几家医院之后才发现,这个想法还是有点理想化了。
这是为什么呢?
经过我们的观察总结,原因主要有以下几点:
1. 医院信息系统的设计目的是记录医疗行为,帮助医生、护士、患者完成诊疗过程,而不是科研。因此,HIS系统中包含很多非结构化的数据,比如大病历、住院病程、主诉等。这些非结构化的数据无法直接进行分析,需要通过NLP自然语言处理转换为标准字段,但以现在的AI技术,很难达到科研级别的要求。
2. 医院信息系统缺失了关键的院外随访数据。大部分临床研究需要院内数据+个性化数据+院外随访数据,而医院信息系统只记录了院内数据,个性化数据和院外随访数据是缺失的,而这部分对研究至关重要,只能通过其他途径来解决。
3. 医院系统是面向全院成员,很难根据研究目的个性化定制。这也是非常重要的一点,因为所有的临床研究都是不同的,不存在一个模板打天下,同一个疾病的不同研究方向,需要的变量也不完全相同,以现在的架构和人力资源配置,很难实现针对每位医生做定制化服务。
4. 海量重复、同质化数据会让研究者迷失,很难挖掘有价值结论。这一点是作为一个统计师的体会,因为医院信息化系统中导出最多的就是实验室检查,每个人可能有几十张化验单,这些指标虽然是结构化的,但是内容过于重复、同质化,这些内容在我们数据分析的时候不会有太大的帮助,反而容易让大家迷失,因此我们在做研究的时候反而建议大家只保留最核心的几次数据。
以上是我认为的4点核心原因。现在来回答我们最开始提出的问题:只用医院信息系统的数据导出来可以发文章吗?
回答是:很难。
那么,这个问题该如何解决呢?
我的答案是:以研究为导向,建立定制化数据库,同时纳入院内标准数据+定制化数据+院外随访数据。
因为在过去的合作经验中,最容易执行落地,最容易出成果的方法,还是以某项研究,或者某个病种为单位,定制出研究需要的变量数据。
举例来说,某位教授最拿手的是“甲状腺相关眼病”,那么他手上肯定有大批同类的患者,他可以建立一个“甲状腺相关眼病”的专病数据库,这个数据库里面会收集和疾病最相关的内容,比如术前CAS评分、眼球突出度、甲状腺治疗情况、手术方式、其他干预、术后CAS评分、几个月后突出缓解程度、眼压、视力等等,这些内容需要教授和统计师讨论确定,最后形成字段标准。
经过定制和研讨之后,这个数据库记录的数据才有挖掘和研究的价值,也往往可以产出科研文章。
那么CDR一体化平台就没用了吗?
当然不是,在上面的例子当中,如果实验室检查的数据可以通过平台来对接,就可以大大节约研究者的时间,这也是CDR数据平台的价值所在。
因此,在拥有一体化平台的单位,反而更可以体现专病数据库的价值。但是仅仅靠依靠医院导出的海量同质化数据是很难有高质量科研产出的。
因此,基于上述的理解,我们团队也设计开发了以研究为导向,基于专病数据库的科研平台解决方案。这套方案就是结合了专病数据库、CDR数据仓库、微信随访、数据挖掘,将完整的链条打通,方便研究者提炼高价值数据,真正发挥医疗数据的价值。
当然,这套方案的缺点就是比较贵,尤其是CDR数据仓库部分,需要信息科、第三方信息化系统的配合,一个课题组的自有经费很难支持,因此,对于大部分研究者,使用专病数据库+微信随访+数据挖掘是更加可行的方案。
对于无法使用CDR提取的数据,也可以使用我们开发的外部Excel导入+化验单OCR+补录的方式来解决。
以上就是这两年观察总结出来的一点体会,我们团队作为专病数据库的搭建方,在内部做了很多技术储备和尝试,但是这些都是实现目的的手段,抛开这些“高大上”的手段,最终目标还是要能够落地,这样才能带来扎扎实实的科研价值。
好啦,最后还是要自卖自夸一下,我们团队最近6年一直致力于帮助研究者做好临床研究,踩过很多坑,也积累了很多的经验,如果您的团队正在准备开展临床研究,或者想把自己的临床资料充分利用起来,欢迎和我们团队联系,我们愿意为大家提供帮助。
如有侵权,请联系本站删除!