数据流编排技术在绩效考核数据质控中的应用研究

对于医院绩效的科学评价有重要的现实意义。

在国家大力加强医疗服务质量和安全监管的背景下,医院绩效考核工作逐步深入,考核指标数据质量高低直接影响考核工作成效。本研究利用数据流编排技术,按照数据质控规则要求,对医院绩效考核指标数据进行自动匹配运算,有效实现并行高效、灵活扩展、易于复用的质控,为医院绩效考核提供了可信的数据质量保障,对于医院绩效的科学评价有重要的现实意义。

随着我国进一步加强对医疗服务质量和安全、医疗卫生机构运行和医疗卫生从业人员的监管,各地区卫生健康主管机构积极响应,切实开展公立医院绩效考核工作,部分区域也已建立符合区域特色的公立医院绩效考核指标体系。绩效考核工作涉及大量指标数据的采集与分析,数据质量的高低决定了考核结论的正确性和可用性质控。目前,部分区域在开展质控数据质控工作时,不同程度存在人工工作负担重、效率低;个人经验差异化评价,缺乏规范的质控标准;人为失误频发且难以避免,数据准确性问题;质控流程存在滞后、管理薄弱,难以实时追踪、反馈等问题。各医院上报数据质量参差不齐,降低了评估结果的可信度,影响了考核工作的科学指导意义。因此,建立全量填报数据的可信可靠高效的自动化质控尤为必要。

1.需求分析

医院绩效考核系统辅助下的工作流程,先由系统管理员配置考核项目基本信息,包括被考核医院、考核时间、考核指标、评分方法及质控专家等。医院开始填报数据,系统按设定好的评分方法,对源数据进行评价打分。为保障考核结果,将从源数据开始实施质控工作,先由系统质控,再通过专家二次质控,确保数据质量可信。系统流程如图1所示,展示了医院绩效考核全过程。

图1  医院绩效考核系统流程图

在上述流程中,数据质控为本次研究的主要内容。数据质控的目的是保障数据的完整性、有效性、一致性、及时性和准确性,能够辅助科学决策。通过实际调研了解,结合医院医疗卫生业务特点,要求相应质控规则能够满足处理复杂的数据逻辑运算需要;质控规则本身要易于维护,并灵活适配不同考核指标体系;同时,质控结果要能够及时反馈、明确指明问题所在,指导医院填报。

2.数据质控相关技术概述

知识图谱质控

基于知识图谱的数据质控主要是利用自然语言处理、机器学习等技术,通过结构化、语义化方式,在大量的标签数据训练基础上,刻画和揭示医院考核相关数据(实体)与质控规则(语义)的关系,进而模仿人类的思维方式进行逻辑推理。知识图谱技术已成功应用于搜索引擎、大数据分析等方面。它的优势在于自动化生成语义关系,能够避免人为制定规则上的偏见;具有更丰富直观的知识表达和多样化的知识推理。结合实际,目前缺乏可用于医院绩效考核数据质量的统一知识图谱,相关实现方法复杂并缺乏统一标准,构建面向特定领域的此类知识图谱难度大、周期长,因此不适合本研究项目的要求。

规则引擎质控

规则引擎则是嵌入在应用程序中独立运行,实现业务决策。它根据给定的规则,让输入的事实数据与规则条件进行模式匹配,得出真假的事实判断。目前,该方法已经广泛应用于法律法规、竞争策略等复杂业务系统设计中。它的优势在于能够处理复杂规则运算,执行效率较高;独立于主应用程序,便于维护,有利于保障系统稳定。结合实际,规则引擎更加强调面向业务流程和管理过程,以及相关独立变量的判定,而非面向数据模型和数据的关联关系、内在逻辑的相关计算和检验。此外,还存在自身运行所需资源较多,规则加载较慢等缺点。

综上所述,在对主流的数据质控方式进行分析后,结合本项目实际,发现规则引擎的方式更合适,但仍然存在不足,特别是缺乏对数据处理过程的引导。因此,提出采用数据流编排技术、结合规则判断和相关工具实现数据质控。

3.基于数据流编排技术的数据质控系统设计

数据流编排技术

数据流处理提供了一种模式引导的设计体验,可以根据从源到目的地的一组指令编排、组合和排序数据,数据在一个虚拟的管道中流动,分别在不同管道之间的结合处增加处理器,用于对数据进行不同的处理。大多数数据解决方案都包含重复的数据处理操作,并封装在处理流程中。数据流编排是一种工具,从数据传递、加工的角度,帮助实现对结构化数据的自动逻辑处理。

质控流程设计

本研究设计将数据质控活动视为一个有向无环的数据流编排。使用常见的简单脚本语言编写数据质控规则逻辑,相应的数据流处理器加载运行此类规则脚本代码,从而实现数据质控。此种方式可以保证数据质控流程与数据解耦,实现关注点分离,降低系统复杂度和耦合度,便于主应用程序的维护,借助分布式集群技术,可以实现低延迟和与高吞吐量,满足本研究项目轻量、支持多种数据库、高效开发的需求。利用数据流编排技术,数据质控的抽象处理流程模型如图2所示,简单明了,规则发生变化时,只需调整质控部分即可。

图 2  数据质控的抽象处理流程模型

Apache NiFi一个开源数据流工具,是数据流编排技术的一个实现,它支持可扩展有向图数据的路由、转换和系统的中介逻辑,使数据可以在多系统建自动“流动”。它基于Web的用户界面展示设计、控制、反馈和监控全过程,且高度可配置、安全可扩展,非常符合本研究实际。因此选用Apache NiFi进行设计,按照数据质控的抽象处理流程模型,结合NiFi提供的处理器功能和本项目实际需求,细化数据质控流程图如图 3所示,包含了接受Web请求、拆分数据、执行质控、控制结果合并和Web请求响应几个步骤。其中执行质控依赖的质控规则库,以脚本形式存储了国家、医疗卫生行业、地方关于医院绩效考核的数据质控规则。用户将待进行质控的数据提交到Web请求后,流程先将数据进行拆分,形成单行数据,然后自动流向执行质控环节,相关数据处理器将使用质控规则逻辑校验每条数据,接着相关数据处理器将对所有校验结果进行整合,最后向用户返回Web请求,完成数据质控流程。

图 3  数据质控数据流程设计

4.实践方案

Apache NiFi数据流模型的核心包括传输的最小数据单元流文件(FlowFlie),用于记录数据内容,处理器(Processor)用于封装数据流处理的逻辑,连接器(Connection)用于提供处理器之间的数据连接,控制数据流动速率、优先级和负载等。本研究实现方案的数据流编排共分3部分,见图4。

第一阶段,接收待质控的填报数据阶段。第一步,用HandleHttpRequest数据处理器启动HTTP监听服务功能,接收JSON格式的待进行质控的数据。第二步,获取到数据后,用SplitJson数据拆分处理器将JSON格式的多行数据数组拆分成单行数据,并分别形成新的FlowFile。

第二阶段,将数据项匹配到相应质控规则下,并运算质控结果阶段。第三步,选用多个ExecuteScript处理器分别加载相应的质控规则,并行对流入的每行数据进行质控。第四步,选用EnforceOrder数据处理器对流入的质控结果按照OldestFirst原则进行分组排序,确保质控结果有序响应。第五步,选用MergeRecord数据处理对分组排序后的质控结果进行合并,确保一次响应所有质控结果。在强制排序和数据合并过程中,将相关日志记录在LogAttribute中。

第三阶段,反馈数据质控结果阶段。第六步,用HandleHttpResponse数据处理器将质控结果返回给请求发起方。第七步,使用了JsonRecordSetWriter、JsonTreeReader等ControllerService,保障数据的正确解析和持久化文件缓存,保证可靠交付。

图4   数据流编排实现

自2020年3月项目实施以来,共收集整理了26条质控规则。如“总收入=医疗收入+财政补助收入+科教项目收入+其他收入”、“医疗收入=门诊收入+住院收入”、“门诊收入>医保基金收入”、“总支出=医疗业务成本+财政项目补助支出+科教项目支出+管理费用+其他支出”、“特需医疗服务量<总诊疗人次数+出院人数”等,对照代码模板编写规则,并增加相应的检验处理器,从而将质控规则配置入系统。

以重庆市内26家三级公立医院2019年度上报的6 800余条数据作为测试数据,利用数据流编排技术,运行医院绩效考核数据的质控,全部质控完成用时约5 s。绩效考核系统数据质控结果展示见图5,从左到右分别展示了数据项名称、该数据项所涉及的质控规则名称、质控规则的运算公式、以及该规则的质控结果。经质控自查和专家验证,表示质控结果可信可靠。

图5  绩效考核系统数据质控结果截图

4.结语

全量填报数据的自动化智能质控的实现,能够发现以往仅靠人工难以察觉的问题,真正提高医院绩效考核的质量。它的优势主要有三点:一是质控并行高效,该质控方法将多个质控规则节点化地聚类在一起,允许并行执行,提供了足够大的吞吐量,提高了质控效率。二是扩展灵活,由于每个质控规则对应一个脚本程序,所有脚本程序之间并行执行、互不影响;规则脚本使用通用的JavaScript编写,学习成本低;脚本规则的差异主要体现在核心的代码段,编写可以模板化,扩展时只需调整核心段;由于数据流处理过程维护简单,质控规则的调整只需在数据流处理流程中增加、删除、修改数据处理节点,或者调整数据流向即可。因此,质控规则易于增加、修改、删除等维护操作,满足质控规则的多变性、复杂性,具备良好的人机交互GUI,方便调整使用。三是可复用性强,借鉴微服务架构和“将应用程序作为服务使用”思想,独立服务封装,不影响绩效考核主程序运行,可以方便地升级为HTTPS,保障了数据流转过程的安全性;使用相同的数据流处理流程和同类处理器,变更规则脚本,即可复用到不同领域的数据质控项目中。

      中国网是国务院新闻办公室领导,中国外文出版发行事业局管理的国家重点新闻网站。本网通过10个语种11个文版,24小时对外发布信息,是中国进行国际传播、信息交流的重要窗口。

      凡本网注明“来源:中国网”的所有作品,均为中国互联网新闻中心合法拥有版权或有权使用的作品,未经本网授权不得转载、摘编或利用其它方式使用上述作品。

电话:0086-10-88828000

传真:0086-10-88828231

媒体合作:0086-10-88828175

品牌活动合作:0086-10-88828063

广告合作:0086-10-88825964