首页  ·  知识 ·  大数据
智能企业门户的关键技术研究
王冬梅 宋绍成 孙艳  http://tech.qq.com/  实践应用  编辑:dezai  图片来源:网络
智能企业门户的创立意味着集成一系列新的理论、概念、方法和技术,通过应用基于事实的商业智能和智能化决策支持系统,辅助商业决策的制定,提高企业运转效率,
智能企业门户的创立意味着集成一系列新的理论、概念、方法和技术,通过应用基于事实的商业智能和智能化决策支持系统,辅助商业决策的制定,提高企业运转效率,也使企业以最短的时间发现商业机会、捕捉商业机遇。通过应用Agent技术,借助Agent所具有的集成性、协调性、智能性、适应性、自组织性,解决企业信息集成问题,提高协同商务水平。通过应用语义Web技术,提高门户用户的信息搜索、信息获取、信息交流与信息共享水平。

1 商业智能

    商业智能是一种基于大量信息基础上的提炼和重新整合的过程,这个过程与知识共享和知识创造紧密结合,完成了从数据到信息到知识的转变。商业智能实质上是把操作型数据转换为决策所需的商业信息的过程,这一过程又可称为“信息供应链”。通过企业门户将知识以适当的方式进行展示,以实现技术服务于决策的目的。

    商业智能技术并不是基础技术或者产品技术,它是数据仓库、联机分析处理OLAP和数据挖掘等相关技术走向商业应用后形成的一种应用技术。商业智能的系统框架包括数据源、数据集成、数据存储、数据分析服务以及数据访问与展示部分,如图1所示。


图1 商业智能系统架构图


    (1)BI的数据存储技术——数据仓库和数据集市。数据仓库(Data Warehouse)是将从多个数据源收集的信息,按照单一的模式进行存储,并通常将这些信息驻留在单个站点。数据仓库通过数据清理、数据变换、数据集成、数据装入和定期数据刷新来构造其内容。数据仓库收集了整个组织的主题信息,因此,它是企业范围的数据存储。

    企业门户为企业的决策者、客户、供应商、雇员和合作伙伴提供了一个统一的应用界面,使数据仓库的使用者可以根据自己的需要获得想要的信息,它是通过提供全面的企业信息和应用来支持企业决策和客户选择的,主要作用体现在:

    ①企业门户(EP)是将Web技术与企业的运作过程相集成的解决方案,它提供了一个单独的网关来访问信息和应用。一个企业门户通过开放和封闭的网络,提供了数据和信息的传递,使用户更方便地来了解与企业有关的信息。

    ②企业门户能够将存储在公司数据库、数据仓库和文件中的数据转换为可用的信息。它可以使用户在公司内部或公司外部快速地改变信息,并通过浏览器传送信息。分散的公司通过网络连接在一起,加上最新型的信息传递方式,这就意味着在很短的时间内,获取正确的信息,传送给准确的用户,从而提高生产率。

    ③企业门户提供了一个对传统的个人桌面工作模式的改进方法,可以在通过简便的方法定制出的图形化的用户界面下进行工作,能够实现信息的有效处理和系统的稳定性,就如同在原来的应用和信息系统下独立工作一样。

    数据集市(data mart)则是数据仓库的一个部门子集。它聚焦在选定的主题上,是部门范围的,提供多维数据视图和汇总数据的预计算,数据仓库非常适合联机分析处理OLAP。

    (2)BI的分析技术——OLAP、数据挖掘。

    ①OLAP:根据OLAP委员会的定义,联机分析处理是使分析人员、管理人员或执行人员能够从多种角度对从原始数据中转化出来的、能够真正为用户所理解的,并真实反映企业维度特性的信息进行快速、一致、交互地存取,从而获得对数据的更深入了解的一类软件技术。OLAP也可以说是多维数据分析工具的集合。有些历史的企业将会积累下大量的来自外部或内部的数据,在进行OLAP分析时要先将这些数据批量装入数据仓库。此外,业务系统也会不断产生新的数据,并需要增量装入数据仓库。

    数据仓库建立之后,即可以利用0LAP复杂的查询能力、数据对比、数据抽取和报表来进行探测式数据分析了。也就是说,用户在选择相关数据后。可以通过切片、切块、上钻、下钻、旋转等操作,可在不同的粒度上对数据进行分析尝试,得到不同形式的知识和结果。

    ②数据挖掘:数据挖掘是按照一定的规则对数据库和数据仓库中已有的数据进行信息开采、挖掘和分析,从中识别和抽取隐含的模式和有趣知识,并利用它们为决策者提供决策依据。

    数据挖掘与OLAP的区别和联系是:OLAP侧重于与用户的交互、快速的响应速度及提供数据的多维视图,而数据挖掘则注重自动发现隐藏在数据中的模式和有用信息。OLAP的分析结果可以给数据挖掘提供分析信息作为挖掘的依据,数据挖掘可以拓展OLAP分析的深度,可以发现OLAP所不能发现的更为复杂、细致的信息。

    (3)BI的表示和发布技术——数据可视化。为了使发现知识的过程和结果易于理解和在发现知识过程中进行人机交互,要发展发现知识的可视化方法。为了了解数据之间的相互关系及发展趋势,人们可以求助于可视化技术。信息可视化不仅用图像来显示多维的非空间数据,使用户加深对数据含义的理解,而且用形象直观的图像来指引检索过程,加快检索速度。在互联网的架构下,支撑企业门户商业智能的各项技术是一种交融、整合的关系、以提高商业智能方案的协同性和开放性2 Agent技术

    目前,企业所面对的运营环境变化多端,难以预测,传统的企业信息门户具有一些难以克服的缺点,难以适应现代企业信息化系统的发展要求,主要表现在:集成异构信息系统乏术,过多考虑技术方案,忽略技术与组织之间的相互依赖关系;门户的扩展性有限,若要在门户加入新的功能,就需要较大程度的系统重组与程序调试。门户的主动性有限,主动性的扩展要求人工智能和符号处理技术的辅助,然而这些很难加入到门户的框架中,因此Agent技术日益引起企业门户建构者的关注。

    (1)Agent技术的企业门户系统架构。中科院成都计算机应用研究所的钟勇等人提出了一个基于多Agent的企业信息门户应用架构。

    在引入Agent技术后,企业门户的构架如图2所示,它分为表示层、服务层、商业逻辑与任务管理层、数据管理层与平台层。


图2 基于多Agent的企业信息门户应用架构


    ①表示层:负责与用户的交互,包括内外部网站、办公交流平台、业务应用导航。

    ②服务层:包括服务平台代理,进行多代理管理、协调和通信,管理基于组件的系统底层组件和业务组件,及组件问的协调和通信。

    ③商业逻辑与任务管理层:根据用户的请求调后台的服务进程,通过服务平台代理,将结果集返回给表示层,它是整个系统中最复杂也是最核心的部分。本层是一个多Agent系统,包括多Agent规划、通信和协作等。这一层就是按照用户的要求生成用户的代理对象,负责管理由本地发出的代理对象,记录它们的当前位置和状态。

    ④数据管理层:管理企业中的各类数据源和应用系统,包括自动化办公(OA)、工作流引擎(WE)、数据整合平台(DI)、企业资源计划(ERP)、客户关系管理(CRM)等业务系统。

    ⑤平台层:是整个系统的传输管道,是系统功能实现的最基本条件。提供了代理的生存环境,是代理移动的基础、代理之间通信的场所、远程代理与主机通信的纽带。对下层而言,它把对象序列化后提交给网络层;对上层而言,是将对象反序列化的场所,并把对象提交给代理层,包括网络、Web、J2EE/EJB中间件服务器和关系数据库等。

    (2)Agent技术的企业门户的功能。企业门户系统的核心是一组相互协作的Agent组成的Agent子系统,它构成信息处理及支持信息协作的中间应用层,这种中间应用层虽不同于一般概念上的中间件技术,但是它同样具有类似中间件技术的诸多好处。各Agent代表着参加交互的各方,通过Agent之间的协商,开放系统环境中各异质实体间差异被屏蔽,且具有语义上的一致性。在具体实现中,为满足系统的分布式透明性要求,设计了Agent中介系统,它负责管理所有SA的相关信息,这样各Agent通过与Agent中介系统交互便可以动态获取其他Agent的属性,从而与其他Agent进行交互,以获取所需要的信息。

    企业门户系统中的Agent可以分为两类:一类为代表用户对信息访问请求的Agent,称之为用户Agent(UA),另一类是代表着不同的信息资源的信息Agent(SA),它可以为其他Agent提供信息访问服务。

    用户Agent:接受用户请求并返回结果的Agent。用户只需提出要求,用户Agent会自动寻找提供相应服务的Agent,并将最终结果返回给用户。它能创建新的UA,通过访问Agent中介系统得到目的主机的地址、服务能力等相关信息,并让它移动到目的主机运行来完成信息协作任务。

    信息Agent(SA)接收来自不同的用户Agent的请求,根据不同的请求采取相应的动作。它的数量可以有多个,它是在后台运行的,对用户来说是透明的,它可完成各种不同任务,小到一次简单的信息查询,大到一次复杂的逻辑会话。企业门户系统的信息Agent(SA)包括如下:

    ①认证Agent:采用基于角色的用户权限管理方法,引入角色、权限、操作等要素,进行用户操作权限配置,建立统一用户认证和权限模型,实现系统级、模块级、栏目级等多级权限设置。

    ②通信Agent:负责与其它Agent之间、以及企业信息门户系统外的可靠的数据通信,包括端到端和多端两种通信方式,包括电子邮局、短消息网关、即时通信网关、XML开放接口、消息网关等。

    ③进程Agent:解释用户命令或其它Agent发送的请求或控制,根据不同情况产生、管理和规划进程,将Agent当前目标、当前任务结构和任务图作为输入并基于层次任务网络进行规划。

    ④任务Agent:管理业务应用组件、控制应用组件的执行(包括创建、激活、暂停和终止等)。

    ⑤业务构件Agent:管理和规划企业EJB,根据应用导航的要求响应任务调度指令。

    ⑥监控Agent:在不确定的动态环境中,使Agent能对外界环境的变化作出及时反应。执行监控进程,根据Agent下一个要执行的动作为其建立上下文环境,它通过为动作提供有限的资源来监控其执行。

    ⑦知识库Agent:包括信息、文档和其它相关的知识,执行过程中生成的数据对象,提供知识的管理与检索、知识挖掘与决策分析。

    ⑧服务平台Agent:进行各种Agent的管理和调度,规定各Agent间的协同机制,触发各地叫的执行并将执行结果返回用户。它是企业信息门户运行的总平台或调度中心。
3 智能决策支持系统

    智能决策支持系统应用于企业信息门户的目的是为了提高企业各级决策能力的需要。集成智能决策支持系统的企业信息门户提供使企业迅速分析数据的技术和方法,包括收集、管理和分析数据,将这些数据转化为有用的信息,然后分发到企业中需要该信息的地方。企业信息门户与智能决策支持系统相结合使之跃升为智能企业门户,它不单纯是一种产品或服务,而应当被看作是在企业数据仓库的基础上,利用数据挖掘和信息挖掘工具获取商业信息,以辅助和支持商业决策的全过程。

    IDSS由数据库、模型库、知识库等组成,各个部件之问的相互通讯、相互协调是系统高效运行的保障。如图3所示。如何使系统各部件统一,也是IDSS的研究内容之一,如用逻辑的观点、面向对象的观点和关系化的思想来统一IDSS。


图3 智能决策支持系统结构


    (1)用逻辑的观点表示IDSS。用逻辑的观点来统一IDSS,是用一阶逻辑语言表示IDSS的各部分,把数据库中的关系、方法库中的方法、模型库中的模型和智能部件中的知识都用逻辑公式来表示。用这种方法来表示知识部件,其效率较高,可是数据库和模型库运行效率低。

    (2)用面向对象的思想来统一IDSS。面向对象技术以对象和类为基本构成元素,对象由一组数据和对该数据所实施的操作组成,类是对象的一种抽象表示,将一组具有相同数据结构和操作的对象抽象为一个类,将模型、知识、数据库系统均抽象成各种不同类的对象来表示,对系统的各种操作则通过类之间的消息传递加以控制,这样IDSS各部件之间的接口容易实现,系统的基本模块为类,各个类彼此相对独立,每个对象类都是数据和方法的封装,类和类之间通过消息传递而相互作用,可以很好地实现模型和方法的重用。

    (3)用关系来表示IDSS。用关系表示IDSS,就是利用关系型数据库的思想来表示系统中的数据、模型和知识等信息,使其得到统一模型,知识的关系化表示就是事实的关系化和规则的关系化,产生式系统中的事实可以直接移用关系中的元组来表示,事实相当于具有属性的实体,规则相当于实体之间的联系,最终也可用元组对IDSS的统一表示,用系统工程的思想指导整个系统开发,主要注重系统的整体性,使系统的各部件之间相互协调工作,这样的系统具有很好的整体性能,但在强调整体性的同时忽略了IDSS的核心部分一模型部件和知识部件的有效构建,在一定程度上影响了IDSS作为决策的地位。

    智能决策支持系统是决策支持系统(DSS)与人工智能(AI)技术相结合的产物。它将人工智能中的知识表示与知识处理的思想引入决策支持系统,继承了人工智能领域中专家系统的研究成果,为决策支持系统开辟了新的发展方向。

4 语义Web

    万维网标准化组织W3C提出了被称为第三代Web(第一代为手写的HTML页面,第二代为时下常用的由机器生成的动态HTML页面)的语义Web。根据W3C的定义,语义Web是建立在RDF与其它定义的标准基础之上,对Web上的数据所进行的一种抽象表示。语义Web提供了一个通用的框架,允许跨越不同应用程序、企业和团体的边界共享和重用数据。

    (1)语义web门户面临的主要问题。基于语义Web技术的门户在理论上能够克服目前Web门户知识组织所面临的一些问题,然而,语义Web门户尚处于新生阶段,许多技术仍不成熟,无法实际应用。目前,基于语义Web技术的语义Web门户的知识组织存在如下亟待解决的问题:非规范知识处理的理论及技术研究、知识本体的开发、知识的表示、知识单元及元数据、安全性问题等。

    ①非规范知识处理的理论及技术研究。Internet上的知识大部分为非结构化或半结构化,它们以各种媒体形式存在,以自然语言为载体,分布在几亿个网页上,且每天以百万网页的数量级在增长、消失或改变内容。这些知识充满了各种矛盾的事实、数据和观点,基本体现了非规范知识的所有特点。

    Internet的快速发展与广泛应用要求在开放、动态环境下实现灵活、可信、协同、深层次的知识共享和利用。这个目标的实现在很大程度上要依赖于非规范知识处理技术的进步,因此需要系统深入地开展非规范知识处理的基本理论与核心技术的研究,主要包括:非规范知识的表示和建模;非规范知识的获取和融合;非规范知识的转换和传播;非规范知识处理的基础理论。

    ②知识本体的开发。知识本体是指术语学上的核心词汇、概念及二者之间的关系和应用情境等,它具有最强的语义特性,而且作为一种实现语义层互操作的技术手段,有助于实现资源的语义互换和领域应用。利用知识本体可以实现知识归类和分级;为知识间的关系和应用提供线索;实现知识跨领域、跨数据库间的语义互换。

    同时由于知识本体具有本体的共性,本体在表达具有一致性的知识和结构时具有很高的适用性,因此,知识本体在语义Web门户起着举足轻重的作用。传统门户试图使用各种不同知识组织方法,如内容、类型、视图等等,但常常使用户陷入迷航困境,同时还会引发与其它门户不兼容等问题,而基于知识本体的知识组织为解决这一问题提供了有效途径。这对语义Web门户——一种可随Internet的规模而不断升级的开放系统来说,尤为重要。

    ③知识的表示、知识单元及元数据。随着Internet的迅速发展和数字信息资源数量、类型和种类的激增,人们发现在海量的信息环境中,查询和检索越来越困难,为有效地解决这一问题,学者们提出了元数据这一概念。元数据就是关于数据的描述,是半结构化数据,能提供机器可理解的信息。它是专门用来描述数据的特征和属性的、提供某种资源的有关信息的结构数据,可以促进Internet的知识组织和知识发现,是实现语义Web门户知识组织的关键。

    Web门户中的知识类型多样,包括结构化、半结构化和非结构化知识,如何将它们映射成数据库或其他存储机制的数据实体是语义Web技术首先要解决的问题。知识单元将知识对象的描述抽象化,进而可以通过元素、属性、值来表达各种知识。我们将这种知识单元叫做知识表示的中间层。一般来说,知识表示可以建立多个中间层,且在各个应用程序逻辑层中都有相应的知识中间层存在。

    (2)语义Web门户的发展目标。
门户的建设是目前学术界的研究焦点之一,门户作为当前网络环境下机构与机构、机构与用户、机构内部之间、用户与用户之间知识交流、共享的主要平台,是当前知识经济时代进行知识管理的有效工具。智能化和知识化是今后门户的发展方向,它面临的重要挑战是如何表达资源的语义,并以合适的形式提供给相关用户,这也正是语义Web门户发展提出的目标。

    基于语义Web技术的知识组织,可以表达资源蕴含的丰富语义信息,因此语义Web门户的知识组织比现有的Web门户的知识组织有着更高的准确性和效率,为门户的规模化发展奠定良好的基础。然而语义Web门户的知识组织仍处于探索阶段。一方面,使用语义Web技术的潜在优势也是非常明显的,因为这些技术可以极大地改善知识处理和共享、增强Web门户的质量、为终端用户提供更人性化的功能。另一方面,语义Web技术仍处于发展研究阶段,距离实现语义Web门户还有一定距离,在知识组织理论上具有的优势近期还不能得以立即显现。

    语义Web技术的提出为Web门户的发展提供了很好的契机,它为数字资源提供底层的语义级支持。本文提出的系统框架不仅给用户提供知识级支持,而且它还具有传统Web门户所不具备的语义功能,包括基于语义Web的知识组织和知识的自动获取等。在本文提出的框架基础上,今后需要在知识表达、知识本体、知识组织、知识检索、知识可视化和个性化用户需求等方面做进一步的研究。

5 结 论

    从技术对IEP建设实践活动应用的视角看企业门户的发展,我们可以作出如下结论:

    (1)信息技术是在企业门户渐进和跃变的交叉进程中前进的,企业门户应用信息技术的结构也是不断变化的,该结构需要随着企业门户的发展不断融人新的信息技术,需要与企业门户的业务进行动态融合,需要持续适应企业门户战略的变化,需要在技术、业务、管理和战略之间寻求结合点,需要在数据管理、信息资源管理、知识管理之间实现无缝集成,需要在稳定和变化之间实现均衡,这是一个艰难而充满挑战的过程,是体现信息技术在企业门户中应用价值的过程。

    (2)随着企业门户应用技术向广度和深度的扩展延伸,企业门户的不同应用形式也在其发展的进程中实现了时空的统一,企业门户的功能由处理企业组织单个部门的局部信息逐渐发展为集成管理企业的功能。

    (3)企业门户应用技术向广度和深度的扩展延伸的深层含义是企业门户新的功能和管理模式,是企业持续的创新能力和新的竞争优势的载体。

本文作者:王冬梅 宋绍成 孙艳 来源:http://tech.qq.com/
CIO之家 www.ciozj.com 微信公众号:imciow
    >>频道首页  >>网站首页   纠错  >>投诉
版权声明:CIO之家尊重行业规范,每篇文章都注明有明确的作者和来源;CIO之家的原创文章,请转载时务必注明文章作者和来源;
延伸阅读