1 基于Web使用挖掘的商业智能分析
1.1 Web使用挖掘 Web挖掘就是从与WWW相关的资源和用户浏览行为中抽取感兴趣的、有用的模式和隐含的信息,可分为3类:Web内容挖掘(Web content mining)、Web结构挖掘(Web structure mining)和Web使用记录的挖掘(Web usage mining,WUM)。Cooley等认为WUM就是由Web服务自动发现用户访问路径。WUM通常有4个过程:数据预处理、模式发现、模式分析及模式应用,如图1所示。
图1 Web使用挖掘
实际数据一般都具有不完全性、冗余性和模糊性,要使挖掘内核更有效地挖掘出知识,就必须为它提供干净、准确、简洁的数据。预处理主要对用户访问日志进行数据清洗、用户惟一性识别、用户会话识别、路径补充和事务识别等处理。
模式发现就是利用挖掘算法挖掘出有效的、新颖的、潜在的、有用的及最终可以理解的信息和知识。可用于WUM的技术有路径分析、关联规则、序列模式、分类聚类技术等,其中路径分析技术是WUM所特有的,如图2所示。
图2 基于Web使用挖掘的商业智能应用
模式发现阶段挖掘出的用户访问模式还需要通过一定的技术和方法过滤掉没有用的模式,将有用的、潜在的模式形成人们可以理解的规则。模式分析有很多种方法,其中最主要的是可视化技术、OLAP和数据查询。
1.2 基于WUM的商业智能分析
WUM通过对大量用户使用记录的分析,能够为服务商提供商业智能,使服务商更方便地实施客户关系管理。目前基于WUM的商业智能研究主要有以下几个方面:
(1)分析潜在的目标市场,优化电子商务网站的经营模型
根据客户的历史资料不仅可以预测需求趋势,还可以评估需求倾向,有助于提高企业的竞争力。
(2)聚类客户与客户细分
在电子商务中聚类客户是一个重要的方面。通过对具有相似浏览行为客户的分组,并分析组中客户的共同特征,可以帮助电子商务的组织者更好地了解自己的客户,向客户提供更适合、更客户化的服务。销售商根据分析出来的聚类信息及时调整页面及页面内容,使商务活动能够在一定程度上满足客户的要求,这对客户和销售商来说都具有重要的意义。
(3)分析客户生命周期
确定消费者消费的生命周期,针对不同的产品定制相应的营销策略,从而提高销售商的营销效率。
(4)发现潜在用户
对电子商务网站来说,了解、关注在册客户群体非常重要,但从众多的访问者中发现潜在的客户群体也非常重要。如果能发现潜在的客户群体,网站就可以对这类客户实施相应的策略,使他们尽可能成为在册客户群体,电子商务网站随之订单数就可能增多、效益就有可能提高。
(5)延长客户的驻留时间
对客户来说,传统客户与销售商之间的空间距离在电子商务中已经不存在了,互联网上每个销售商对于客户来说都是一样的。了解客户的浏览行为、知道客户的兴趣及需求所在、动态地调整Web页面以满足客户的需求,均被证明能够使用户在网站上驻留更长时间。而消费者驻留时间的延长有助于信息的传递,能够推动网站的发展。
(6)分析客户个性化特征,针对不同客户提供“量身定做”的产品
电子销售商可以获知消费者的个人爱好,更加充分地了解客户的需要,并针对每个消费者的独特需要提供个性化的产品,这样有利于提高消费者的满意度和忠诚度,使消费者成为长久的客户。
(7)客户信用评估
根据客户的信用,提供相应信用等级的服务,这样一方面促使客户为了自身的利益提高自己的信用,另一方面降低了销售商的风险。
2 基于Web使用挖掘的商业智能应用
基于WUM的商业智能目前主要应用在为用户提供个性化服务和改善网站性能方面。个性化服务包括个性化网站、个性化广告服务以及为用户推荐产品或网页等;通过改善网站性能,可以逐步建立自适应型网站。
2.1 个性化服务
个性化服务需要客户的个性化信息。如果没有提供任何信息,客户将得到一般的服务。
(1)个性化网站
强调信息个性化,亦即识别、建立、调整客户的喜好,使客户能以自己的方式来访问。人们越来越希望网页的内容能够从原先的以“网站”为中心转变成以“用户”为中心,尽可能地自动调整以迎合每个用户的浏览兴趣。
(2)个性化广告
当打开一个网站时,就会弹出客户不需要的广告,这会使消费者心烦意乱,而且浪费他们宝贵的时间和精力。个性化广告就不同,它针对客户需要提供广告,使客户减少搜索的时间,得到想要的东西。有针对性的提供个性化广告条,对那些要通过WWW发送广告的企业,提供个性化的广告服务要比随意提供的广告有价值得多。
(3)在线推荐产品或网页
根据网络访问者的偏好和导航行为进行个性化营销。把活动用户的短期访问历史与前面挖掘的模式进行匹配,为活动用户预测下一步最有可能访问的页面,并根据得分对页面进行排序后,附在现行用户请求访问页面后推荐给用户。它与以前系统最大的区别是推荐活动不是根据用户输入的profile做出的,而是依据从其访问活动中动态自动发现的模式进行的。由用户输入获得的profile与用户爱好紧密联系,但具有片面性且是静态的。因为Web站点具有动态性、时效性、异质性,所以随着时间的变化,若仅依赖用户的profile信息,推荐效果会降低。
在线推荐是Web使用挖掘的重要研究方向,如Olfa Nasraoui等提出基于近似推理的智能推荐引擎等。
另外,利用WUM提高搜索引擎的性能是WUM比较重要的研究领域。如Dell Zhang等研究了利用WUM提高搜索引擎的性能。
2.2 改善站点性能
对是Web站点的链接结构的优化可从两方面来考虑:①通过对是Web Log的挖掘%发现用户访问页面的相关性,从而对密切联系的网页之间增加链接%方便用户使用。②通过对Web Log的挖掘,发现用户的期望位置。如果在期望位置的访问频率高于对实际位置的访问频率,可在期望位置和实际位置之间建立导航链接,从而实现对Web站点的优化。我们可以找到用户的返回点,这个位置可能是期望位置,也可能是目标页面,可以通过确定时间阈值来解决这个问题。当用户在返回点停留的时间较长,超过指定的阈值,则认为该页面是目标页面,否则可以认为该页面是期望位置。
3 基于在线商业智能的客户关系管理
客户关系管理(CRM)系统最早由美国的Gartner Group于1997年提出。CRM源于“以客户为中心”的管理思想,是一种旨在改善企业与客户之间关系的新型管理机制,目的在于建立一个企业与客户之间的信息交流互动管理系统,使企业在客户服务、市场竞争、销售及支持方面形成彼此协调的全新的关系实体,为企业带来长久的竞争优势。它一方面通过提供更快捷和周到的优质服务吸引和保持更多的客户,另一方面通过对业务流程的全面管理降低企业的成本。
本文提出在线商业客户关系管理的框架。它建立在由Web使用挖掘提供的商业智能的基层之上,如图3所示。网站记录的客户与主网站的交互数据是Web使用数据分析、WUM的主要数据源,通过数据分析建立客户信息库、知识库,客户关系管理系统收集来自主网站、数据分析和信息库的消费者信息,通过一般的途径和主网站对客户关系进行管理;客户关系管理系统根据客户信息库、知识库所反应的不同客户偏好等为客户提供不同的个性化服务。虽然这样的系统能够提供高效的个性化服务,却不需要大量的营销人员。主要投资是电脑软硬件和相应的为数不多的电脑维修操作人员,省去了营销费用,降低了办公费用。
图3 客户关系管理系统
4 总结及未来研究
电子商务的发展与电子商务理论的发展是相辅相成的,电子商务理论的发展依靠商业智能、知识管理思想的发展。通过分析用户访问信息,能够发现其中隐藏的知识,根据这些知识可以为在线企业提供商业智能,而基于商业智能实施客户关系管理是知识管理的关键。因此,本文研究了基于Web使用挖掘的商业智能,并提出建立在这样的商业智能基础之上的在线企业客户关系管理系统的框架。
未来还要对WUM、在线知识和商业智能发现、在线客户关系管理以及电子商务的理论与方法进行系统的研究。
本文作者:刘业政 杨攀 杨慧 来源:万方数据