首页  ·  知识 ·  架构设计
医药商务智能系统的设计与实现
曲朝阳 郭晓利  万方数据    编辑:德仔   图片来源:网络
1 引 言 随着中国加入WTO,药品行业对外开放迫在眉睫,
1 引 言

    随着中国加入WTO,药品行业对外开放迫在眉睫,我国医药商业企业将面临美国等先进国家同行的严峻挑战。企业的经营模式必须从以产品为中心,以销售为中心转变为以客户为中心的模式,产品的购进、生产、销售以客户需求为导向。因此,如何吸引新的用户群、维系老用户,提高企业的赢利能力,就成为摆在各运营商面前的一个新课题。

    医药商务智能系统建设的目标就是要为企业提供一个统一的分析平台,充分利用医药运营系统中积累的宝贵数据,对其进行深层次的发掘,从不同的角度去分析企业的各种业务指标并构建业务知识模型。本文在讨论了系统关键技术后,具体分析了商务智能及构件技术在医药系统中的应用。

2 系统关键技术

    2.1 商务智能技术


    商务智能是指将企业的各种数据及时地转换为企业管理者感兴趣的信息(或者知识),并以各种方式展示出分析的过程。

    就医药行业而言,由于它的业务流程、组织部门比较复杂,因此,在系统实施过程中,首要问题是企业管理层必须给予足够的重视,对实施过程中遇到的问题及时进行沟通、协调各方快速解决。其次,就是要注意系统构架的开放性、灵活性和可扩展性,既要与现有系统保持良好的兼容性,又要考虑到将来的扩展。最后,领导者最终关心的问题就是哪种药品销售趋势最好,哪种药品最赚钱,所以,如何建立一个收支平衡点,挖掘企业最大的潜力,是最关键的问题。

    一般来说,数据仓库、联机分析处理和数据挖掘技术是商务智能系统的三大技术支柱。

    2.1.1 数据仓库(DW)技术

    数据仓库就是面向主题的、集成的、不可更新的(稳定性)、随时间(不同时间)不断变化的数据集合,用以支持经营管理中的决策制定过程。一般的,数据挖掘和OLAP是建立在DW基础之上的。

    对于医药数据仓库,由于它的信息化较晚,不可能像银行电信行业那样具有长期的、大量的、真实的历史数据积累,所以它的规模、建设周期、数据一致性的问题是应该最先考虑的。

    2.1.2 数据挖掘(DM)技术

    数据挖掘就是从大量的、不完全的、有噪声的、模糊的、随机的数据中提取隐含在其中的、人们事先不知道的、但又是潜在有用的信息和知识的过程。

    对原有的医药企业来说,他们大部分都是以产品和销售为中心,着眼于哪种药品卖的最好。而随着市场形势的变化,他们不得不转变观念,以客户为中心,根据客户的需求来进行药品的购进、生产和销售。数据挖掘在这里起着关键的作用。

    2.1.3 联机分析处理(OLAP)技术

    OLAP是使管理人员能从多种角度对从原始数据中转化出来的信息进行快速、一致、交互地存取.从而获得对数据的更深入的了解。它的技术核心是“维”这个概念。

    医药系统的联机分析处理主要是针对销售和采购等部门的报表结果进行多“维”处理,以便专家进行分析。

    2.2 构件技术

    构件是一个带有契约化接口和显式上下文依赖的组装单元,它能被独立发布并且可以被第三方组装。它的宗旨在于提高软件的生产效率和产品质量、减少软件开发人员频繁流动造成的负面影响、缩短产品的交付时间、增加产品的灵活性和适应能力。

    目前,有多个组织和公司制定了构件基础设施的标准或开发了相关产品,也为构件、构件框架和接口建立了模型和技术规范。其中OMG CORBA CCM,Mcrmsoft COM/DCOM(或.NET)以及Sun JavaBean/EJB占主导地位。

    CORBA CCM是一种集成技术,而不是编程技术。它提供了对各种功能模块进行构件化处理并将它们捆绑在一起的粘合剂。COM通过底层的远程支持使得构件技术延伸到了分布应用领域。EJB提供了一个概念清晰、结构紧凑的分布计算模型和构件互操作的方法,为构件应用开发提供了相当的灵活性。

    相比较而言,EJB和CORBA的跨平台能力、安全服务和可扩展性要比DOOM强,而REE的四层体系结构又把显示(客户层)和控制(WEB层和业务逻辑层)相分离,这样既清晰易懂,又易于维护。正是由于这些特点,我们选择了J2EE作为设计实现平台。

3 系统体系结构

    基于构件技术的医药商务智能系统的体系结构由四层组成:客户层、web层、业务逻辑层和数据库层,其中业务逻辑层功能由商务智能和构件技术的应用程序共同实现,如图1所示。
 
 
4 系统实现

    4.1 数据仓库实现

    为了满足医药用户需求,我们将系统的数据仓库规划为以下三个步骤:

    4.1.1 确定主题

    根据药品采购决策分析的需求,医药商务智能数据仓库确定为四个基本主题:药品、采购员、供应商、(大)客户四个主题。其中药品主题描述了药品的基本信息、采购信息、销售信息、库存信息等;采购员主题描述了采购员的基本信息、采购信息等;供应商主题描述了供应商的基本信息、供应信息等;(大)客户主题描述了客户的基本信息、购药信息等。主题的划分保证了每个主题的独立性,即每一个主题都有自己的特有信息,同时各个主题在逻辑上都有一定的关系。医药商务智能数据仓库中的四个主题的逻辑关系是:(大)客户到药房买药品,随着时间的增长和需求的增多,药房药品的库存逐渐减少,当药品库存减少到库存底限时,由采购员到供应商处采购药品。

    4.1.2 划分粒度

    粒度是指数据仓库中数据单元的详细程度和级别。数据越详细,粒度就越小,级别就越低;数据综合度越高,粒度就越大,级别也就越高。粒度可定义成数据仓库中数据细节的最高层次,如事物层次。这种数据层次是高度细节化的,能使用户按所需的任何层次进行汇总。根据粒度的划分标准可将数据划分为详细数据、轻度总结、高度总结三级。

    4.1.3 数据模型

    目前最流行的数据仓库多维数据模型有3种:星型模式、雪花模式和事实星座模式。星型模型是最常用的数据仓库的结构模式,本系统也采用星型模型来实现数据仓库中概念模型的开发。星型模型显示了一种多维分析的结构,星型的中心是分析的内容,对应事实表;四周是访问角度,对应维表;每一维又可划分不同的粒度。例如:对药品主题中的药品销售信息来说,若想知道在某个时间段内、某种药品销售的情况可建立一个星型数据模型,如图2所示。

 


图2 星型数据模型


    4.2 数据挖掘实现

    我们将分析应用需求进行技术型整理,归纳出以下几种医药营销的数据需求:

    (1)数据描述和总结:如根据历史数据分析某段时间某医院对药品需求的变化,确定各医院对药品的需求比平时分别增加多少等等。

    (2)运用数据特征化的方法汇总:即归纳出目标类,如对于企业销售量最大,创造利润最多的重点客户分析其销售(或销售额)占40%以上的药品或销售量增加20%以上的药品分别作为目标类,确定重点客户的偏好,以提供客户服务。

    (3)聚类分析:在不预先确定特征化目标的前提下,将重点客户的销售数据进行适当的聚类分析(数据聚类标准在数理统计中体现为不同距离方法,如Markov距离,欧式距离等,不同类型的数据,应选择适当的聚类标准),可以获得许多信息,如哪些客户,哪些地区偏好哪种药品?特别要重视对孤立点分析,对于偏离聚点的对象,即孤立点,这些客户的忠诚度值得警惕,有可能流失。同时根据历史数据,分析客户和产品销售随时变化的群体趋势,包括分析对于时间相关的数据特征,以便保留已有客户和发展新客户。

    (4)预测:根据前一时段药品的销售情况,来预测将来的销售情况。以此来决定将来购买什么药品。

    (5)数据相关性发现:一个客户购买了一种药品,由此判断他得了什么病,他还可能买什么药品。

    下面用实例来说明数据挖掘技术如何应用在医药商务智能系统中。

    4.2.1 鉴别问题

    根据实际情况,某医药公司要统计过去一段时间内,哪种药品的销量比较好,以此来决策下一步的进货情况。本例中所要解决的问题是找出药品销量与药品属性之间的关系,并建立简单高效的挖掘数据库信息表。我们采用了选择树分析器来建立销量与药品用途之间的关系模式。

    4.2.2 数据整理

    在此模型中,我们主要用到药品基本信息和药品的销售信息,药品的基本信息中保存的是药品的属性,包括名称、规格、计量单位、产地、批准文号、效期、剂别、剂型等等。药品的销售信息包括销售ID、销售单位、销售数量、梢售日期、批发价、零售价等。


表1 药品基本信息数据


表2 药品销售信息数据


    此外,要从原始的药品信息数据库提取出数据挖掘感兴趣的相关字段和信息,用两个表的ID连接,重新组合一个数据挖掘数据库,以便在应用数据挖掘时操作方便高效。所提取出来的挖掘数据库信息见表3所示。


表3 重新构建的数据挖掘数据库


    (1)数据分析

    在众多的特征之中,我们比较关心的是药品的品名、生产企业、作用用途、购货单位等这些属性,而诸如效期、剂类、剂型、批号等信息与药品的销售数量之间的关系并不是我们所要关注的。因此在数据挖掘工作中可以去掉,以提高数据挖掘的效率。这样就可以确定数据挖掘中的几个基本的变数:“品名”、“生产企业”、“作用用途”、“购货单位”。

    (2)建立模型

    这里采用的分类器是选择树模型。选择树模型是决策树模型的一种扩充,其基本原理和分析方法,与决策树相同,只是选择树提供了更多的选择分支。

    选择树分类器将每条记录都归入一个类中。归类的基本结构仍为决策树。虽然生成选择树的代价比决策树大,但选择树有两个显著的优点:可理解性更强,可以选择您认为最容易理解的或在具备一定的背景知识的基础上确认更利于作出预测的分支;准确性更高,在很多情况中,选择树比决策树更准确(更低的错误率),综合使用多项选择通常可以作出更稳定,风险更小的分类预测。

    在该例中,之所以采用选择树模型,而不是决策树模型,除了具有以上优点外,还因为根据实际情况,树的某些节点其分支信息属性并不惟一,比如各销售数量范围的结点都包含有品名、生产企业、作用用途、购货单位等信息属性。为便于分析,选取销售数量作为目标属性,其它属性作为独立变量。

    4.3 联机分析处理实现

    对于多维数据模型的查询可以采用多维表达式(Mulit Dimensione Xperssion,MDX)。MDX支持多维对象与数据的定义和操作。如同印L查询一样,每个MDX查询都要求有数据请求(SELECT子句)、起始点(FROM子句)和筛选(WHERE子句)。这些关键字以及其它关键字提供了各种工具,用来从多维数据集析取数据的特定部分。如对表3中的两种药品进行年末销售统计,在多维数据模型中可以采用如下方式:
 


    在上述的表达式中可以看到,MDX比SQL表达式更加简单和清晰。当用户的要求变化时,在OLAP的数据立方体(Cube)中只有很少一部分需要变化以适应用户需求的改变。从这个角度来看,MDx只需作最少的改动,而SQL表达式则有可能需要完全更新以适应新的要求。

    OLAP可以用来进行药品分析,其输入是等级评估的规则或标准,其输出是药品的等级评估的结果,即得到“某药品的等级是……”,“不同等级的药品的成分比例分布是……”等等对分析问题的回答。如果将OLAP工具再深入一层,还可以对不同的等级的药品进行特征归纳。正如多为数据模型显示的数据一样,头痛片的等级高于卡他灵。

5 结束语

    医药商务智能系统的实现体现了先进的管理理论,并提供了药品信息化集成的良好解决方案。一方面,它将医药的物流、资金流和信息流统一起来进行管理,对所有的人力、资金、药品、设备、信息等各项资源进行综合平衡和充分考虑,从而获取最大的效益;另一方面,它缩短了软件开发周期,增加了系统的灵活性、易维护性和可扩展性。随着信息化的普及,它必将成为医药系统的主流。
 

 
本文作者:曲朝阳 郭晓利 来源:万方数据
CIO之家 www.ciozj.com 微信公众号:imciow
    >>频道首页  >>网站首页   纠错  >>投诉
版权声明:CIO之家尊重行业规范,每篇文章都注明有明确的作者和来源;CIO之家的原创文章,请转载时务必注明文章作者和来源;
延伸阅读