数据质量:90%医院都要面对的问题
在如今火爆的数智化时代,很多行业利用大数据和人工智能创新了业务、获得了价值。然而,医疗行业的大数据能否赋能医疗业务、科研、医院管理,很大程度取决于医疗数据质量的高低。
01 数据质量概念
数据质量是指在一定业务环境下,数据符合用户的使用目的,能满足业务场景具体需求的程度。在不同的业务场景中,用户对数据质量的需求不尽相同,有些人主要关注数据的准确性和一致性,另外一些人则关注数据的实时性和相关性。医疗数据生态模式,不再单纯是录入数据、获取数据,而是录入和获取正确数据经正确的加工后,在正确的时间把正确的数据推送给正确的人。正确的数据是医疗信息化的起点,医疗信息化除了要保证数据信息准确、有效、快捷的传递以外,还必须保证数据的真实性、可用性和适用性,满足业务、管理、科研等使用目的,才可以说数据质量符合要求。
02 影响数据质量的环节
从医疗数据的整个生命周期来看,任何一个环节都有可能产生数据问题。
1.数据输入阶段
输入缺失或不全:如同一个病人,在一个数据库表中姓名存储为“张三”,在另一个数据库表中变成了“张三丰”,实际是重复录入时的输入性错误。
数据逻辑性错误:如身份证号中的性别标识、年龄与输入字段内容不一致。
常识性问题:如出生日期写错( 把1990年录入为1890 年,年龄成了131岁);误把病人住院号填入用药数量中等。
2.数据维护阶段
每个系统在维护数据过程中,都可能因为数据的修改,导致其他问题。如数据字典中某项代码更新了,结账时可能会结错;若删除了基本表中的数据(如科室),或把该科室代码挪作他用,则历史数据中病历可能再也无法对应原科室了。因此,基本库的变动,会导致无法预知的结果。
3.数据共享阶段
业务系统之间通过数据接口实现数据共享。随着错误数据的输入,它可能扩散到多个系统中,从而影响到整个医院的数据质量。即使相对简单的数据错误也会迅速升级为复杂问题,降低整个医院的数据质量。
4.更新迭代阶段
新旧系统更新中,如果旧系统中的数据没能很好的衔接(若为二套完全不同架构的系统,平滑衔接有一定难度),旧系统中数据能查,但难以应用。
5.数据应用阶段
不同职能科室针对同一个数据会有不同的口径,如医保数据分析,分析“城保”病人、分析“城保+大病”病人、分析全部参保病人等;如门诊人次统计,可以是根据病人挂号统计,也可以根据医生所在科室统计。
归纳起来,医疗数据一直存在常识性错误、不符合业务逻辑和规定 、数据不完整、数据缺乏实效性、数据统计口径差异等问题,造成这些问题的原因有人为因素、医院管理因素、信息系统因素等,针对这些薄弱环节对症下药、各个击破,构建一整套行之有效的医疗大数据质量治理体系,提高医疗数据的质量和价值。
03 数据质量治理方案
有质量的数据才有价值。医疗数据质量问题,必须引起医院领导层的重视和参与。不能认为数据质量就是信息部门自己的事情,需要由领导层牵头,落实各业务部门之间的协调配合,从数据源头抓起,按照事前预防、事中监控、事后完善的方法论,构建覆盖数据全生命周期的医疗大数据质量治理体系。
1.建立保证数据质量的工作流程,建立奖惩制度。如关键数据的录入及审核制度、关键数据发布的核对及审核制度等。
2.对提高数据录入的环境和系统进行投资。如更新现有系统,降低界面录入的出错率,培训录入人员,增加新的技术和设备提高录入效率。
3.制定主数据、元数据和标准化规范化的术语库。提高数据的准确性、统一性,便于检索和统计。
4.建立数据质量监控指标。数据质量监控指标由数据项目和质量属性两个部分组成。其中,数据项目是指医院信息系统中需要进行数据质量监控和管理的项目,并非所有数据项目都涉及质量问题,需要选择。质量属性是指每个数据项目的质量描述,包括准确性、完整性、一致性、关联性、有效性、唯一性和自定义七个维度的监控规则。
数据完整性和准确性监控指标,可以针对常识性错误、不符合业务逻辑和规定 、数据不完整等问题实时作出提醒预警,在数据输入阶段规避数据录入错误。
医疗大数据质量评价维度
5.数据清洗维护。数据清洗是对数据进行重新审查和校验的过程,目的在于删除重复信息、纠正存在的错误,并保障数据一致性,主要关注重复对象检测、缺失数据处理、异常数据检测、逻辑错误检测、不一致数据处理等方向。如果在源头系统不能很好的控制输入的数据质量,又想有高质量的数据,只能靠数据清洗,数据清洗是存量数据质量提升的关键步骤,数据清洗后的数据可以更好地支持数据分析,数据洞见。
数据质量提高是一个持续改进、不断完善的过程。不是靠几个人上几个系统就可以解决的,不可能“毕其功于一役”,需要医院管理人员、各业务部门相互协作,还需要医疗信息化公司不断创新的技术支撑。医疗数据质量提升行动,只有起点,没有终点。
-科技重塑医疗 赋能业务生态-
更多内容请查看www.gih.cn,关注“高灵智腾”公众号