1引言
随着互联网的迅速普及,电子商务以前所未有的速度发展,企业客户关系管理也面临着一场划时代的革命。争夺和维系客户,从而促使企业稳定、快速、长远地发展成为企业经营战略的关键。CRM(客户关系管理)是企业为了建立良好的客户关系,坚持“以客户为中心”的经营管理理念,借助多项技术支持建立的一整套的解决问题方案。Web数据挖掘运用到客户管理管理中,将会解决许多实际问题,具有丰富的学术价值。
2电子商务与CRM、Web数据挖掘及Web数据挖掘应用现状
2.1电子商务与CRM、Web数据挖掘
电子商务即利用计算机技术和网络技术进行数字化方式交易。一般指通过Internet和WWW进行的交易。在电子商务环境下,CRM使企业有了一个基于电子商务的面向客户的平台。它使得企业能更好地满足客户需求及提供更优质的服务.从而使企业在这种不存在时空差异的新型商务环境中保留现有客户和发掘潜在客户,以提高市场竞争力。同时CRM又可以提供客户需求、市场分布、回馈信息等重要信息.为企业决策和经营活动提供丰富的数据,提供智能化分析。随着CRM功能的网络化发展.使得企业越来越重视网络客户信息的搜集与分析。但是,海量的网上信息中,只有少量对企业有用的数据。而且网上的信息多是半结构化和非结构化的数据,如声音、图像、文件和超链接等。因此,为了适应Web发展而产生了Web挖掘技术。目前,在国外已有相当多的电子商务系统应用了Web数据挖掘技术来提高企业的收益。Web数据挖掘在电子商务的应用主要是在CRM中。体现为客户分析、站点白适应、交叉营销策略、客户的获取和保持、改善站点结构等几个方面。
2.2 Web数据挖掘定义及在CRM中的应用现状
Web数据挖掘是数据挖掘技术在Web环境下的应用,是集Web技术、数据挖掘技术、信息科学等多个领域的一项技术。是从大量的Web文档集合和在站点内进行浏览的相关数据中发现蕴涵的、未知的、有潜在应用价值的信息。简单地说,Web数据挖掘就是应用数据挖掘方法帮助人们从Web中提取有用的知识。Web数据有三种类型:Web内容数据,如HTML标记的Web文档:Web结构数据,如Web文档内的超链接;用户访问数据,如服务器日志信息。相应地,Web挖掘也分成三类:Web内容挖掘、Web结构挖掘和Web使用模式挖掘。Web数据挖掘的结果可以优化电子商务网站的结构和系统性能、智能搜索引擎、商业智能的发现、针对不同的用户提供个性化的页面或商品推荐等。Web上数据挖掘的潜力在于应用最新的数据挖掘算法,分析Internet服务器上的日志。对网站的修改更加有目的、有依据,稳步的提高用户的满意程度;根据用户的访问模式修改网页之间的连接,把用户想要的信息以更快捷、更有效的方式提供给用户;发现系统性能的瓶颈,找到安全漏洞。查看网站流量模式,找到网站中最重要的部分;发现用户的需要和兴趣,对需求强烈的地方提供优化;用服务器f或代理服务器)预先存贮的方法来解决下载缓慢的问题。通过Web数据挖掘可以了解到客户尽可能多的爱好和价值取向,提供个性化的网站,以保证在电子商务时代的竞争力。
3 Web数据挖掘在CRM中的应用
Web挖掘在各个领域显示出了诱人的应用前景。它是企业管理好客户资源和开拓市场的一件利器。Web挖掘在CRM中的应用主要有以下几种模式:第一,利用Web内容挖掘从多个网站中收集客户的消费习惯和竞争对手的信息;第二,基于结构及用户模式的挖掘能发现每个客户的不同特点以及产品之间是否具有关联性等;第三,通过Web挖掘技术实现个性化网站。
3.1 Web内容挖掘.收集客户的消费习惯和竞争对手的信息
Web内容挖掘是指对Web页面内容进行挖掘。即对Web上大量文档集合的“内容”进行总结、分类、聚类、关联分析以及利用Web文档进行趋势预测等,是从Web文档内容或其描述中抽取知识的过程:web数据挖掘技术具体应用于企业CRM客户数据的分析处理过程中,从而为企业发展的进一步决策提供实践依据。Web上的数据既有文本数据,也有声音、图像、图形、视频数据等多媒体数据;既有无结构的自由文本,也有用HTML标记的半结构的数据和来自于数据库的结构化数据。随着WWW上的信息的迅猛增长,许多只支持由关键词和超级链接所构成搜索引擎返回的结果中有许多无用及无关的信息。这就需要开发更为有效的技术来支持Web内容挖掘。Web内容挖掘的目的是自动搜索WWW上的信息资源。大部分的WWW的知识蕴藏在Web贞面文档中,但是WWW信息的非结构化性是我们对Web页面进行挖掘时必须解决的难题。传统从WWW上提取信息的搜索引擎,给广大的计算机用户带来了一些方便,但是它们不能对搜索到的众多的信息进行分类、过滤,也不能理解文档。所以用户必须自己在搜索到的众多信息中,进行挑选工作。最近出现了一些利用Web内容挖掘从WWW上搜索信息资源的智能型搜索工具。 3.2改进网站结构设计
Web访问信息的关联规则挖掘是发现企业客户浏览页面的行为和访问模式,客户在访问站点时,他请求的页面之间会存在某种相互的关联。它可以被用于判定在一个Web站点中频繁访问的路径,还有一些其它的有关路径的消息。通过路径分析,可以改进页面及网站结构的设计。通过对Web访问信息进行关联规则的挖掘,可以在电子商务活动中制定有效的市场策略,更好地组织电子商务网站的页面结构。并利用相关性,从而更好地组织站点,实施有效的市场策略。对Web站点的链接结构的优化可从三方面来考虑:1)通过对Web Log的挖掘,发现用户访问页面的相关性,从而对密切联系的网页之间增加链接,方便用户使用;2)利用路径分析技术判定在一个Web站点中最频繁的访问路径,可以考虑把重要的商品信息放在这些页面中,改进页面和网站结构的设计,增强对客户的吸引力,提高销售量;3)通过对Web Log的挖掘,发现用户的期望位置。如果在期望位置的访问频率高于对实际位置的访问频率,可考虑在期望位置和实际位置之间建立导航链接,从而实现对Web站点结构的优化。Web数据挖掘中的关联规则理论来分析企业客户浏览行为和访问信息,从中发现企业客户浏览中的关联规则和兴趣偏好。Web中的兴趣关联规则就是利用客户兴趣的相关性原则,根据客户已经或正在浏览的网页推测客户下一步将浏览的网页,并提前预取出来,这将大大加快打开网页的速度,提高网站的运行效率。企业客户在网站浏览过程中的关键行为和兴趣偏好,从而来评估客户的兴趣度,调整网站的结构和网贞布局,更好地为客户服务。
3.3评估客户兴趣度,发现潜在客户
用户在网站上的浏览行为反映了用户的兴趣和购买意向。对一个电子商务网站来说,了解、关注在册客户群体非常重要,但从众多的访问者中发现潜在客户群体也同样非常关键。如果发现某些客户为潜在客户群体,就可以对这类客户实施一定的策略使他们尽快成为在册客户群体。对一个电子商务网站来说也许就意味着订单数的增多、效益的增加。
当客户访问一个Web站点时,通常带有某种喜好,不同的客户间有不同的兴趣喜好。客户的访问路径中蕴藏了用户对站点的兴趣及客户的兴趣转移。在Web使用挖掘中,关联规则技术主要用于从用户访问序列数据库的访问序列中挖掘出相关的规则。如挖掘出用户在一个访问期间从服务器上访问的页面,文件之间的联系,这些页面之间可能并不存在直接的参引关系。最常用的技术就是Apriori算法,从事务数据库中挖掘出最大的频繁访问项集,这个项集就是关联规则挖掘出来的用户访问模式。许多企业都对企业的客户、市场、销售、服务与支持信息进行深层次发掘和分析,对客户价值进行分类,发现新的市场机会,增加收入和利润。在电子商务中客户聚类是一个重要的方面。通过分组具有相似浏览行为的客户并分析组中客户的共同特征,可以帮助电子商务的组织者更好地了解自己的客户,及时调整页面及页面内容使商务活动能够在一定程度上满足客户的要求,向客户提供更适合、更面向客户的服务,使商务活动对客户和销售商来说更具意义。
4 Web数据挖掘在CRM中应用中的难点和应当注意的问题
4.1 Web中客户身份的识别问题
位于Web上的每一台机器都拥有自己独一无二的IP地址,但是一般都使用动态IP技术.即每当客户登录到Web时.它就可以拥有一个与上次完全不同的IP地址。这就使单独使用IP来识别客户的方法行不通。为了精确识别客户.需要足够的数据,代理服务器提供一个中间缓冲层,这为识别客户带了更大的问题,在服务器日志文件中,所有通过代理服务器发来的用户请求均具有I司样的客户标志号,即使这些请求是多个客户发起的;同时,由于代理服务器缓存的存在.一位客户对服务器的请求在一定时期内会被多个客户看到。针对客户身份识别过程中出现的种种情况,主要可以采用以下几种Web技术来进行处理:
1) Cookies技术
Cookies是浏览器存储在客户系统上的一个变量,用来代表特定的网站,是大部分网站用来管理客户会话和跟踪用户的主要方法。可以用来记录用户的访问行为,并在Web服务器和浏览器之间进行来回发送来对用户会话进行管理。
2) URL重写
URL重写是将需要来回传送的信息置人查询字符串中,通过UBL来进行传递。如果企业想从一个网贞到另一个网页对用户进行跟踪(假设用户已在某处注册),那么就可以把用户名作为查淘字符串的一部分追加到这些网贞中的每一个链接中。这种简单的技术可以用来跟踪用户访问Web站点的路径。
3)隐藏表单域
隐藏表单域方法允许企业网站将一些相关的值放入网页上用户不可见的一些表单域。一旦客户提交表单,这些值将会被送回Web服务器。
4.2异构数据源处理的难点和对策
Web上有海量的数据信息,数据挖掘就是从大量的数据中发现隐含的规律性的内容。解决数据的应用质量问题?充分利用有用的数据,废弃虚伪无用的数据,是数据挖掘技术的最重要的应用。相对于Web的数据而言,传统的数据库中的数据结构性很强,即其中的数据为完全结构化的数据,而Web上的数据最大特点就是半结构化。所谓半结构化是相对于完全结构化的传统数据库的数据而言。显然,面向Web的数据挖掘比面向单个数据仓库的数据挖掘要复杂得多。Web上的数据是半结构化数据,Web数据挖掘技术首要解决半结构化数据源模型和半结构化数据模型的查询与集成问题。针对Web上的数据半结构化的特点,寻找一个半结构化的数据模型是解决问题的关键所在。除了要定义一个半结构化数据模型外,还需要一种半结构化模型抽取技术,即自动从现有数据中抽取半结构化模型的技术。面向Web的数据挖掘必须以半结构化模型和半结构化数据模型抽取技术为前提。
5结束语
企业CRM是对企业和客户之间的交互活动进行管理。它的一个重要目标是找到现有的和潜在的客户,然后策划和实施促销活动以影响客户的行为。运用Web数据挖掘技术对电子商务网站上的各种数据源进行挖掘,发现相关的一些知识模式。可以指导企业更好地运作站点和向客户提供更优质的个性化的服务,有效提高商业站点的竞争力。Web数据挖掘是当今世界上的热门研究领域,其研究具有广阔的应用前景和巨大的现实意义。
本文作者:卢秋根 黎静 来源:万方数据