数字化医院智能决策系统的主题分析与实现

2013-01-18 16:21:10来源: 方正国际

1.前言

    目前,全球每天产生高达100,000T字节源自医疗信息(2010年)的数据,且在近几年来的所有数据中就有90%的数据是在过去两年间产生的。我国信息化医院的建设从80年代初期起步,经过了近30年的发展已经日趋成熟,医院系统的数据库中都存有大量的数据。在数据量爆炸式增长的今天,如何管理这些历史数据,让信息发挥最大作用、并易于理解和处理为决策者提供有价值的信息服务,就变得尤为重要。这信息服务中需要满足医院不但要知道过去发生的事情,还要知道现在发生什么,未来可能会发生什么,以及应采取哪些措施的各种信息需求。

    通过数据仓库技术,可以实现对医院数据的整合,为决策者提供决策的数据基础。目前,我国医院的数字化平台都是由多个子系统组成,各个子系统功能独立,子系统之间通过接口进行信息交互。由于子系统之间的供应厂商不尽相同,在数据库软件的选择和数据内容的定义也会是不同的,因此需要选择一个公共的平台作为基础数据的基础,在此平台之上构建数据仓库。例如,可以选择HIS(医院管理信息)系统作为数据仓库的平台是医院信息化的基础,其提供药房药库管理、财务管理、人事管理、住院门诊收费等众多医院运营的基础管理功能。医院其余子系统都有HIS系统接口,并通过接口传输信息。

2.医院主题与重点绩效指标(KPI)

    在医院信息化管理中,为了更加深入、全面地掌握医院各业务的运营状况,我们采用分主题制定的医院管理模式。医院主题是指面向医院各业务的一组业务指标的集合。它可以针对不同的医院业务设定其KPI(重点绩效指标)予以衡量,并自主地选择该业务下的多个维度进行分析与比较。比如对人员构成的分析就可以从编制、职级、工作性质、部门等多个不同维度,对医院的人员构成,如在职员工数、平均年龄以及离职率进行多维分析;多维分析是指按照预先设定的分析角度,对指标进行分析,比如机构、时间、职称、学历、年龄段等。

    目前,我们参考了《三级综合医院评审标准与评审细则》(2011年版)、《全国医疗卫生系统“三好一满意”活动2012年工作方案》、《三级综合医院医疗资粮管理与控制指标》等卫生部指导文件,某医院所有报表,医疗行业核心期刊(中国数字医学、中国药学)等国内外论文,人民医院一、二期等数据决策系统实践项目,从而大范围地把医院的主题分析分为:门诊、药房药库、住院、抗菌药物、医院感染、医疗保险、基本监测等医院主题分析,并根据医院的实际情况,为每个主题选取了多个能够全面衡量主题业务情况的KPI。

    在门诊的主题分析中,我们选择门诊人次、急诊人次、每诊桌工作量、预付费人次、门诊收入、门诊人均药费、平均处方金额等KPI来衡量门诊业务与财务,可以监测门诊业务的门诊量是否异常,分析门诊不同收费类型的收入占比,并进一步从时间、科室、病人、挂号类型等维度分析医院门诊的基本运营情况。

    在药房药库的主题分析中,我们选择药品收入、药品收入占比、当前药房(药库)总库存额、药品库存周转率、库存药品品规数、盘盈盘亏量、毒麻药领取数量等KPI分别来衡量药房与药库业务与财务,并从药品通用名、药品规格、供应商等维度分析医院药房药库的某个时间段的出入库量、金额和各类药品的库存情况。

    在住院的主题分析中,我们选择了年住院患者出院例数、每住院人次费用、住院患者实际占用总床日等KPI来衡量住院业务与财务,从时间、病区、病种、科室等维度分析对住院床位使用情况进行合理的了解并提出合理的解决方案,更重要的是能够对住院治疗质量做出实时的监控,如住院死亡率、跌倒率、压疮率等。

    在抗菌药物的主题分析中,我们选择了抗菌药品金额、处方西药金额、DDDs统计、DDDs强度、住院病人抗菌药物使用率等KPI来衡量医院抗菌药物的使用情况,从时间、科室、医生、药品分级、药品类型等维度分析医院抗菌药物的使用量、使用金额、使用品规数,对超过规定使用的情况进行控制,有效防止出现滥用抗菌药物的情况。

    在医院感染的主题分析中,我们选择了院感总发生率、手术部分总感染率、血管导管所致血行感染率等KPI从时间、科室、病房等维度分析患者在手术过程中发生感染的情况,监测重点科室,比如重症医学科中患者在使用不同器械过程发生感染的例数等。

    在医保的主题分析中,我们选择了医保病人总费用、医保在院病人数、医保费用返还额等KPI从时间、病区、病人身份等维度来分析某时间段中不同身份不同病人的医院患者的报销费用、费用返还情况等,并实时地通过计算医保病人的人均费用判断医保收费是否出现异常,实施适当的解决措施。

    最后,通过基本监测主题分析,我们能够以一个更加全面与简洁的方式去了解与监测医院所有的业务运营情况,因为它分成资源配置、工作负荷、治疗质量、工作效率、患者负担、资产运营和科研成果七个方面,多维度分析了医院中基本设备使用管理、接收患者的业务量、治疗服务质量水平、各类型员工的工作状态、患者的经济负担、资产财务的合理规划、医院科研技术的成长情况做出了最全面的展现。

3.医院数据仓库总体方案与构建

    数据仓库自从1988年被Inomn提出后,经历快速的发展。目前有两种数据仓库体系结构。Bill Inmon提出的CIF体系结构与Ralph Kimball博士提出的MD(Multi-Dimension)体系结构。两种体系结构都能实现数据的整合和数据分析功能。

    3.1 CIF数据仓库结构与MD数据仓库结构

    CIF数据仓库开发以企业数据模型驱动,采用自顶向下的开发方式。自顶而下的开发方式需对所有系统进行分析,并要求系统相对稳定,不能轻易更换系统。开发周期长,可能不会很快看到结构。

    MD体系结构是基于多维数据集市的数据仓库结构,它所有的BI分析都是以多维设计为基础[1]。MD采用自下而上的开发方式,采用迭代的方式逐一完成各个主题的数据集市。MD机构中缺少的是一个独立的数据仓库。在MD结构中,数据仓库的是虚拟的,并且是由所有的独立数据集市构成的。

    3.2 医院数据仓库结构选择与构建

    从复杂性来说,CIF数据仓库是一个企业级的数据库,它所涉及的数据表必然包括所有主题的数据内容,在初期构建是异常的困难,很容易导致数据冗余或者数据的不规范。随着企业的业务扩展,会增加相应主题的数据表,CIF数据仓库数据开发会持续很长时间,对于医院大数据库表的增加和维护也是一项艰巨的挑战。而MD结构,将不同的主题拆分为不同的数据集市;把复杂的业务数据库简化为面向主题的多维数据集。但是维度的复用将是数据集市设计的重点。医院的系统经常有更换的可能性,如果采用CIF结构,底层数据结构发生变化,对整体的ETL和OLAP分析都会产生巨大的影响,而DM结构,只需要更新相关主题的ETL与数据维度即可,不会产生巨大的修改。综上所述,采用MD结构的数据仓库更适合医院数据仓库开发。

    多维模型数据库设计方法的中心是星型连接[2]。中心也称之事实表,围绕着事实表是维度表。事实表数据由两个部分组成,维度键与度量值。度量值(Measure)是决策者所关心的具有实际意义的数值。例如,门诊人次、手术次数。事实表中存放的事实数据通常包含大量的数据行。事实数据表的主要特点是包含数值数据,而这些数值可以统计汇总以提供有关单位运作历史信息。维度键是维度表的外键,事实表中一般不包括描述性信息。维度是人们观察的角度。例如,我们想观察抗菌药和抗菌药的使用比例,药品就是一个维度;希望看看哪个药库库存最多,药库就是一个维度。包含维度信息的表是维度表。维度表包含描述事实数据表中的事实记录的特征。有些特性提供描述性的信息,如病人的性别,年龄,医保类型,有些特性则用于指定如何汇总事实数据表数据以便为分析者提供有用的信息,如病人的性别。

4 医院数据仓库ETL设计与实现

    ETL是英文Extract、Transform、Load的英文缩写,在数据仓库项目中代表数据从业务数据库中抽取、转换到最终装载到数据仓库。通常后台的ETL系统常常要花费70%的时间和工作量[3]。

    4.1医院数据仓库ETL设计

    第一步:统一维度处理。由于数字医院由多个子系统组成,各个系统相互独立。需要把维度进行统一,让不同主题的事实表共享相同的维度。以病人数据为例,HIS中病人信息、手麻系统中的病人信息与电子病历中的病人信息数据存储的内容可能不尽相同。虽然后两个系统可以独立做成两个主题,但是如果各自都有独立的病人维度,会导致各个主题之间相互独立。因此我们需要基于HIS系统中病人一个基础病人表,然后在这张表基础上添加其他系统中额外的病人的数据,所有主题都能连接这唯一的病人维度即可进行病人角度的分析。

    第二步:脏数据清洗。业务数据库都存在大量的脏数据,脏数据如果导致数据报表的展现错误,会影响到医院管理者的决策,所以需要尽可能删除业务数据中的脏数据。脏数据主要体现在:重复数据,空数据,错误数据与应该删除但未删除的数据。在ETL的过程中进行数据清洗,修改明显的错误数据,同时也需要各子系统的管理员对自己的历史数据进行维护。

    第三步:增量抽取。由于子系统的维护人员会经常修改历史数据,所以简单的抽取增量是不能保证数据的正确性。通过调研,我们定义一个时间点把业务数据库中的数据分为稳定历史数据和非稳定历史数据。每日抽取时间点后的非稳定里数据与稳定数据拼成最新的全量数据。通过修改时间点来调整稳定数据的范围。

    4.2医院数据仓库的实现

    住院的主题分析,我们可以先从HIS系统中抽取出与住院业务有关的数据,如住院收费信息数据、住院病人信息表、住院病人医嘱信息数据、出院病人信息数据、病房基本信息数据、药房基本信息数据、药品基本信息数据、病人基本情况信息数据、住院床位信息数据等相关数据信息,对这些数据进行整合、统一维度处理、清洗与关联,搭建适合住院业务的数据仓库,制定增量抽取方案。数据仓库结构如下图所示:

 

 

关键字:数字化  医院  智能决策系统  系统

编辑:鲁迪 引用地址:http://www.eeworld.com.cn/medical_electronics/2013/0118/article_3431.html
本网站转载的所有的文章、图片、音频视频文件等资料的版权归版权所有人所有,本站采用的非本站原创文章及图片等内容无法一一联系确认版权者。如果本网所选内容的文章作者及编辑认为其作品不宜公开自由传播,或不应无偿使用,请及时通过电子邮件或电话通知我们,以迅速采取适当措施,避免给双方造成不必要的经济损失。
论坛活动 E手掌握
微信扫一扫加关注
论坛活动 E手掌握
芯片资讯 锐利解读
微信扫一扫加关注
芯片资讯 锐利解读
推荐阅读
全部
数字化
医院
智能决策系统
系统

小广播

独家专题更多

富士通铁电随机存储器FRAM主题展馆
富士通铁电随机存储器FRAM主题展馆
馆内包含了 纵览FRAM、独立FRAM存储器专区、FRAM内置LSI专区三大部分内容。 
走,跟Molex一起去看《中国电子消费品趋势》!
走,跟Molex一起去看《中国电子消费品趋势》!
 
带你走进LED王国——Microchip LED应用专题
带你走进LED王国——Microchip LED应用专题
 

About Us 关于我们 客户服务 联系方式 器件索引 网站地图 最新更新 手机版

站点相关: 医学成像 家庭消费 监护/遥测 植入式器材 临床设备 通用技术/产品 其他技术 综合资讯

北京市海淀区知春路23号集成电路设计园量子银座1305 电话:(010)82350740 邮编:100191

电子工程世界版权所有 京ICP证060456号 京ICP备10001474号 电信业务审批[2006]字第258号函 京公海网安备110108001534 Copyright © 2005-2016 EEWORLD.com.cn, Inc. All rights reserved