一文读懂!大数据在国内外疾病监测与预防应用现状与差异

发表时间:2020-08-14 16:21

2020年,一场新冠疫情使多个国家公共卫生系统不堪重负,暴露出应急处置能力的薄弱等问题,改革和加强公共卫生事件应急处置已成为全球关注焦点。今年2月,习总书记来到北京市朝阳区CDC进行调研指导时指出:“这场疫情对全国各级疾控中心的应急处置能力是一次大考。这次抗击疫情斗争既展示了良好精神状态和显著制度优势,也暴露出许多不足。要把全国疾控体系建设作为一项根本性建设来抓,加强各级防控人才、科研力量、立法等建设,推进疾控体系现代化”。

现代化的疾控体系离不开大数据、人工智能等新兴技术的加持。对于公共卫生部门,可以通过覆盖全国的患者电子病例数据库,快速监测传染病,进行全面的疫情监测,并通过集成疾病监测与响应程序,快速进行响应。大数据在常态化监测、疫情预警处置、趋势预测研判、传染源追本溯源、资源调配和防控救治方面都能起到至关作用。

如今,全世界各国都深刻认识到健康医疗大数据作为国家基础性战略资源重要性,争相建设国家健康医疗数据库,抢占医学研究、精准诊疗和尖端移动设备前沿阵地。2016年,在原国家卫生和计划生育委员会牵头下,逐步建设国家基因库,落实1个国家数据中心、5个区域数据中心、X个应用发展中心(即“1+5+X”)健康医疗大数据规划,催生新业态、促进新经济。

47811596610232595.jpg

一、大数据在我国疾病监测领域中的应用现状

2003年SARS爆发,暴露了我国传染病监测报告信息严重滞后的问题,畅通的疾病监测信息网络成为疾病预防控制信息建设的当务之急。因此,自2003年后,我国启动了应急管理体系建设,其核心是围绕“一案三制”,建立“国家统一领导、综合协调、分类管理、分级负责、属地管理为主的应急管理体制”。其中,“一案三制”是指国家突发公共事件应急预案体系及国家应急管理的体制、机制和法制。2004年初,以现代网络传输技术为依托,以“横向到边、纵向到底”连接全国各地为原则,以统一、高速、快速、准确传递信息为目标的中国疾病预防控制信息系统初具雏形。

2020年新冠疫情爆发,很多人质疑为什么从2004年开始运行、当时耗资7.3亿元巨资建设的国家传染病与突发公共卫生事件网络直报系统没有发挥预警作用。事实上,疾控直报专网并非没有发生作用。据媒体报道,疾控直报专网的数据来源完全取决于上报数据,由于种种因素,疾控直报专网无法与医院内部网络进行直接连通。由于采集不到数据,这一系统自然无从发挥功能。2月3日,卫健委发布了《关于加强信息化支撑新型冠状病毒感染的肺炎疫情防控工作的通知》。各地卫健委根据通知不断改进采集方式,多数医院开始采用网络直报的方式,总算逐渐发挥了专网的作用。由此可见,对于大数据来说,真实的数据来源是极其重要的一步。

在医疗健康数据库方面,2006年我国开始建设国家医疗健康数据库,整合区域范围内医院、基层卫生机构及公共卫生机构的各类数据,形成以个人为中心的全生命周期电子健康档案库。2015年,原国家卫计委启动了十省互联互通项目,我国约50%的委属医院,42%的省属医院和38%的市属医院已启动医院信息平台建设。2016年,原国家卫计委启动“1+5+X”健康医疗大数据发展规划,建设江苏省(东)、贵州省(西)、福建省(南)、山东省(北)以及安徽省(中)五大数据中心。2017年,原国家卫计委牵头组建医疗健康数据三大集团,包括中国健康医疗大数据产业发展有限公司、中国健康医疗大数据科技发展集团公司及中国健康医疗大数据股份有限公司,以承担国家健康医疗大数据中心、区域中心、应用发展中心和产业园建设任务。

在生物数据库方面,国家基因库2016年正式建成,该基因库集生物资源样本库、生物信息数据库和生物资源信息网络为一体。福建省和江苏省作为国家健康医疗大数据中心的“先行者”,立足自身优势,逐步建立了政策保障体系和数据平台。

总体来说,在传染病防控工作中让AI+大数据技术发挥作用,既需要打通行业内“部-省-市-区县”自上而下的垂直领域数据,又要横向打通跨行业部门“信息孤岛”。从顶层设计就要实时结构化信息互联互通,业务联防联动。在今年防疫过程中,有几个企业助力疾控中心、医院建设疾病与监测预警系统值得参考。

比如,北京大数医达为南京市疾控中心建设的疾病与监测预警系统便直接打通连接了当地医院的电子病历系统(EMR)。这一疾控监测预警系统应用了大数医达最先进的大数据和人工智能技术,对医学知识图谱建立模型,再直接提取EMR进行语义结构化,由人工智能匹配知识库判断EMR中是否包含新冠肺炎等传染病的关键词。一旦被人工智能判断为疑似或者是高度疑似则上报疾控部门,避免医院因故遗漏或者迟报。

系统直接打通并连接到医院的EMR,作为省市疾控中心的上报分析、数据汇总及预警分析系统。它具有很细的颗粒度,除了40种法定传染病,也支持各地区自己补充当地认定的多发性传染病。同时,系统结合历史疾控数据进行学习,并结合区域密度和人口流动率等大数据,可以对疑似数据对传染病的发展速度及分布区域等进行预测,从而为疾控决策给出参考数据。

大数医达为江苏省承建的这套系统原本是为春季流感高峰而准备,没想在这次更加严重的新冠疫情中发挥了作用。根据统计,如果以疫情爆发的中心城市武汉为原点,沿着高铁线路画一条半径约为2小时的圆圈,可以清晰地看到各个地区疾控水平并不一样。相对而言,江苏省的新冠疫情控制的就比周边要好很多。

另外,也有企业试图解决医生在当下传染病报卡中的痛点。目前医院的传染病监测报卡系统不够智能、对医生的干预方案不够有效、医院传染病疫情管理部门对传染病迟报漏报筛查耗时耗力,长沙双数科技经过熟练的实践,认为这些痛点可以利用大数据解决。在长沙双数科技的传染病疾病智能监测解决方案中,首先汇集EMR、实验室信息管理系统(LIS)、医学影像存档和通讯系统(PACS)及医院信息系统(HIS)四大系统诊疗数据,再运用双数传染病专家知识库、语义分析技术,对诊疗数据进行传染病疾病相关特征提取、标记。其后,使用传染病疾病分析模型对特征进行分析比对,从而认知传染病。一旦认知到传染病病例,系统即时推送或延迟推送到具体医生电脑前端,并可强制锁死系统要求医生必须完成重要的传染病报告。

这一传染病智能监测解决方案还实现了关口前移,把疾控直报专网上报的校验逻辑全面前移到医生填写传染病报告的阶段。校验不过就完成不了上报,这样就有效解决了报卡完整性和准确性问题。医生完成报告传染病报卡后,数据完整准确的传染病报卡经医院传染病疫情报告人员审核后再上报至疾控直报专网,也解决了及时性的问题。在解决医生传染病报卡的基础上,双数科技进一步实现了从医院内网至疾控直报专网的一键直报功能。2017年5月,中南大学湘雅医院利用该系统实现了传染病报卡医院内网一键直报功能,耗时不到3秒。这在当时也是极个别可以实现内网直报的案例。目前除了湖南省的中南大学湘雅医院外,重庆医科大学附属儿童医院和贵州遵义医科大学附属医院均已采用内网一键直报的方案。根据统计,利用大数据和人工智能的双数传染病监测方案可以将杜绝迟报漏报的有效率做到95%以上;将医生的平均传染病报卡所耗时间从以往的5-8分钟大幅降低到40秒以内;疾控直报专网上报所耗时间也从2-3分钟缩短至几秒钟。

事实上,武汉大学中南医院也刚刚在去年采用双数传染病监测方案,并在后续的疫情报告效率上体现出了优势。不过,在突发性的未知传染病早期预警上,双数科技认为对单个医院的数据分析的结果、在说服力还是相对不足。相对而言,双数科技认为区域一体化传染病疫情预警监测方案是应对区域重大传染病最好的建设方案。目前,双数科技已经完成了区域一体化传染病疫情预警监测方案的研发,已经在其他省市加快部署计划,希望能为中国整体的传染病信息化进程探索新模式。

继这次新冠肺炎疫情之后,我国开始意识到建立突发公共卫生事件的全国性长效管理机制的重要性,多个省份纷纷出台疾控体系改革措施,强调要充分利用大数据、人工智能等新兴技术。


991596610037568.jpg

比如今年7月,湖北省卫健委牵头起草了《关于改革完善疾病预防控制体系的实施意见》等4个配套文件。文件提出,湖北将建立以网络直报、舆情监测、医疗卫生人员报告、可疑病例讨论报告、科研发现报告、零售药店药物销售等信息为基础的多渠道监测预警机制。并且,下一步将实现健康相关数据的自动抓取,利用“大数据+网格化”等手段,开展精准流调,实施精准防控。探索健康相关信息与医保、农业、生态环境等部门相关信息的协同共享,运用人工智能、大数据、云计算等,在监测预警、病毒溯源、趋势预测研判、资源调配等方面发挥支撑作用。



分享到:

版权所有:医知道(北京)健康科技有限公司