首页  ·  知识 ·  大数据
基于数据仓库技术的企业智能诊断研究
赵瑛  万方数据   实践应用  编辑:德仔   图片来源:网络
1 企业存在的问题 目前,随着我国经济体制改革的不断深入,国有大中小型企业在由计划经济
1 企业存在的问题
    目前,随着我国经济体制改革的不断深入,国有大中小型企业在由计划经济向市场经济转变的过程中,受行业本身特点的限制及诸多内外因素的影响,所面临的形势越来越严峻。主要问题是企业活力不强,劳动生产率低,生产成本高,市场竞争力弱,经济效益差。因此,依靠科技进步,改革挖潜力,加强企业管理,提高产品市场竞争力和企业经济效益,成为企业生存和发展的关键所在,而对企业进行诊断则是实现这一目标的一条有效技术途径。
    企业诊断是以提高生产经营管理水平为目的,运用科学方法,针对生产中存在的问题进行分析研究,提出改善方案,用以提高企业的管理水平和经济效益。信息是企业进行有序生产活动的纽带,没有信息的传递,企业的生产活动就无从进行。因此,企业的智能诊断实质上是综合利用现代系统科学、管理科学、计算机信息处理技术以及人工智能等技术,通过对生产中所涉及的大量数据的收集、加工、分析、研究,从中发现影响生产发展的内在和外在因素,对生产经营状态作出判断的过程。
    企业的智能诊断必须以大量的、可靠的数据作为基础,这些数据包括与日常生产有密切关系的内部数据、外部数据,以及管理部门的综合数据和相应的历史数据。传统的管理信息系统中所建立的数据库由于受容量及共享程度等条件的限制,缺乏足够的数据源,且其中的数据大多仅能支持生产查询系统或报表系统,所以并不能充分满足企业诊断中数据分析的需要,而新兴的数据仓库技术则为解决该问题提供了技术思路。
2 数据仓库技术
    2.1 概念
    数据仓库(Data Warehouse)这一概念是由W.H.Inmon在(Building the Data Warehouse》一书中提出的:“数据仓库是支持管理决策过程的、面向主题的、集成的、稳定的、不同时间的数据的集合。”
    应当明确指出的是,数据仓库不是一种现成的软件或硬件产品,而应该称之为一种解决方案,它以串通的关系数据库和并行分布处理技术为基础,目的是对企业中存在的大量原始操作数据进行各种处理并转换成有用的信息。用户通过分析这些信息从而作出策略性的决策。
    2.2 特征
    企业现有的管理信息系统中,通常都建有许多小型关系数据库,这些数据库均属于OLTP(On-line Transaction Processing,即联机事务处理)。OLTP是事件驱动,面向应用的,一般属于实时操作,用户数量比较多,主要是基层操作员。
    数据仓库是在这些原有数据库的基础之上发展形成的,它除了具有传统数据库的共享性、完整性、数据独立性外,还具有如下的特征:
    (1)面向主题(Subject-oriented)。传统的数据库是面向应用设计的,便于应用程序检索和更新数据,但并不一定满足数据分析的需要。主题是在一个较高的层次上将数据进行归类的标准,每一个主题基本对应一个宏观的分析领域。
    (2)历史性(Time-variant)。数据仓库通常包含各个主题不同时间的历史数据,这些数据在应用数据库中通常不会被保存较长时间。因需要管理所有的历史数据和当前数据,所以数据仓库的容量远远大于一般的数据库。
    (3)集成性(Integration)。数据仓库要管理历史数据,就必然涉及到不同时期的多个应用程序和多个数据库,所以数据仓库需要收集、组织和聚集这些数据。
    (4)多维性(Multi-dimension)。与传统的关系数据库不同的是,数据仓库中的数据按维(Dimension)来组织,形成多维数据库,更利于面向主题的信息处理。
    2.3 数据分析技术
    从数据仓库中抽取适当的数据并组合成有价值信息从而进行分析的方法,主要是数据分析和数据挖掘。
    OLAP是一种多维数据分析(Mulitdimensionalda taa nalysis)技术,它能从现有的数据中通过大量的数据转换和数据计算生成新的业务信息,具有灵活的分析功能以及方便、直观的数据操作和结果显示等优点。OLAP的工作过程如图1所示。
 
图1 OLAP工作过程

    数据挖掘(Data Mining,DM ),也称为“知识发现”(Knowledge Discovery in Database,KDD),是从大型数据库或数据仓库中发现隐藏的重要信息或知识并提取出来的过程,其目的是帮助决策者寻找数据间的内在联系,为企业的生产决策、经营预测等提供参考依据。通过数据挖掘,可以自动分析数据,进行归纳性推理,得出有价值的知识、规则或高层次的信息,从而使企业所拥有的大量数据作为一个丰富可靠的资源为知识归纳服务。
    数据挖掘或知识发现是一个多学科相互交融形成的新兴领域,涉及数据库、知识库、人工智能、机器学习、模式识别、统计分析等多种技术。
    (2)从数据仓库中的集成数据出发,构建面向分析的多维数据模型;使用多维分析方法从不同的角度对生产进行分析、评价,自动地发现隐藏在大量数据中的知识模式,以这些模式为基础进行诊断3 基于数据仓库的企业智能诊断
    通过对数据仓库中的数据进行检索,得出有用的信息,进而转化成知识,再由知识生成企业管理需要的决策。
    3.1 企业数据仓库
    数据仓库是存储数据的一种组织形式,它从企业现有MIS数据库中获得原始数据,按照主题分成不同的级。首先是当前基本数据(current detail data),随着时间的推移,由时间控制机制将当前基本数据转为历史数据(lightly summarized data)和高度综合数据(highly summarized data)以及元数据(meta data)。整个数据仓库的组织结构由原始数据组成,数据的物理存储形式有多维数据库组织形式和基于关系数据库组织形式。企业数据仓库的建立过程如图2所示。
 
 
图2 企业数据仓库建立过程

    3.2 企业智能诊断系统
    基于数据仓库技术的企业智能诊断系统如图3所示。该系统的特点是:
 
图3 企业智能诊断系统结构

    (1)以现有生产管理信息系统中大量的事务级数据为基础,经过集成、转换和综合,重新组织成面向生产经营管理的数据仓库,为智能诊断提供数据基础。
    (2)从数据仓库中的集成数据出发,构建面向分析的多维数据模型;使用多维分析方法从不同的角度对生产进行分析、评价,自动地发现隐藏在大量数据中的知识模式,以这些模式为基础进行诊断。
    (3)数据仓库解决了企业内部数据库中数据不一致的问题,它可以为不同的用户访问数据提供所需要的数据视图;数据仓库为OLAP提供了充分可靠的数据基础,数据挖掘可以从数据仓库中找到所需的数据,数据挖掘过程中所发现的知识可以直接用于指导企业生产。
4 结束语
    从前面的分析可以看出,数据仓库技术为企业智能诊断提供了一种有效、可行的解决方案。它以企业原有数据库为基础,以数据仓库为核心,以OLAP和数据挖掘工具为手段,对大量数据进行挖掘、分析,从中识别和抽取潜在的、隐含的有用信息,并利用这些知识为企业决策者提供参考,以利于决策者作出正确的生产决策。
本文作者:赵瑛 来源:万方数据
CIO之家 www.ciozj.com 微信公众号:imciow
    >>频道首页  >>网站首页   纠错  >>投诉
版权声明:CIO之家尊重行业规范,每篇文章都注明有明确的作者和来源;CIO之家的原创文章,请转载时务必注明文章作者和来源;
延伸阅读
也许感兴趣的
我们推荐的
主题最新
看看其它的