首页  ·  知识 ·  大数据
给大数据爱好者泼点冷水
车品觉  大数据  实践应用  编辑:Grace   图片来源:网络
我们可以知道开车的路上,前面到底有没有堵车,这完全是因为我们已经学会了用上别人的数据。大数据非常重要的是,我们有没有学习到用到数据上的冗余。

前阵子有一位教授讲了一个总结,这个总结非常好:到底企业今天有没有使用上大数据?很简单的两句话,第一有没有量级的数据,如果没有,它不可能有足够的材料使用大数据。第二,当它有量级的数据的时候,有没有用这个量级的数据达到深度的洞察。我们现在有很多的媒体会讲到,我们做了一个一百多人的统计以后,我们发现百分之多少人喜欢什么,多少人不喜欢什么。这只是一个小样本的东西,其实没有用上大数据。

当然,就义乌每天的商品量来讲,肯定会用上量级的数据。那么有没有进行深度的洞察,这是非常关键,所谓深度的洞察就是知道更深度问题的原因。

有关数据的深度

有没有数据,有很多人其实都会说有:我当然有数据。但是如果细分的话会发现,有没有数据,下一句就是准不准,然后再下面就是细不细、全不全、稳不稳、快不快。我在这里所讲到的每一个问题,背后都是把数据的阶段要提升,不仅是有没有,还有拿到的数据到底准不准确,拿到的数据是不是足够细,这非常关键。如果加起来都有的话,那么我们就是有很重要的数据资产,这是一个。

另外要使用数据的闭环,我们从布点开始收集非常多的数据,我们要把它存储起来,要不断的刷新。这时候从电子商务来讲,我们要把东西分类,不同行业的分类怎么去存储。存储完之后,我们最关键的就是说多快刷新,因为东西都是动态的,不可能是静态的。你收集了这一秒之后,什么时候会刷新你的数据?比如说交通的情况,肯定是要快速刷新的,以秒级来刷新的。但是如果问你住在哪里,住在哪里这个数据不会在一秒钟里面刷新,可能一个月才刷新一次。所以数据的刷新是有长短的,以及数据存储跟刷新之间是有很重要的整合的关系。

第三个,识辨跟关联,数据不关联是没有力量的,不关联是无法产出它的价值出来。做了前三个我们才可以说,才在当中找出规律,我们可以把数据挖掘做成一个决策,行动。最后一点是反馈。

整个大数据里面最重要的是什么?其实整个大数据里面最重要的东西就是这个数据的闭环到底是不是完整的。如果这个数据的闭环不完整,那么就无法知道未来还要收集更多的什么数据,布点到底布得对不对。不要小看布点,我们今天很多的移动的数据,布点是不一样的,收集的东西也是不一样的。过去在互联网的网页,我们只需要收集人们点了什么。但是今天移动手机上我们收集的数据不是点了什么,而是在什么时候放大这个图片来看,这个动作以前在PC里面是没有的。所以整个闭环会因为科技的变化,也会产生变化。这就是我们现在对于使用数据的时候,最大的一个变化点。

从每一个点,包括我们更多的人使用手机,更多的人使用不同的设备,包括最近产生的物联网的技术也影响到我们收集数据的完整性。

我们会发现收集的时候会影响到数据的准不准、细不细,以及反馈的时候能够知道,以前我们以为自己有的数据实际上是没有的,或者以前有的数据今天是不准确不快的。传统企业有很多数据的收集,不是以一个礼拜的,有时候一个月以后的数据还是不完整的。一个月之后的数据都不完整,那你怎么使用这个数据?快不快其实蛮关键的,现在有很多零售业在各地都有公司,但是汇总数据是以月为单位,月底才能拿到需要的数据。

稳不稳好像听起来不是这么关键,但是如果使用数据的闭环中如果不问,如果说yes的东西结果说了no及因为你的数据不稳定,这也是非常关键的。当我们对闭环使用得很熟悉的时候,今天的第三张图,大数据的总结就是这几张图,对数据有没有清楚一点,什么东西我有什么东西我没有,什么东西有但是不全,什么东西我有但是不能细,再把这个东西做细做全。当然,这不是为了数据而数据,更多的是关于你到底最后是要找出什么规律,要找出什么样的规律的时候你的数据最重要,你就会知道为什么不细的东西要补得更细。

那么如果这个闭环使用得很好的情况下,我们就进入到数据泛化的情况下。一个公司,少部分人使用数据而不是所有人使用数据的话,那么是数据科学的阶段。少量的数据科学家可以把其中少部分的问题来解决。但是到了下一个阶段,我们要把整个公司的数据能力工程化,也就是说更稳定更容易使用。当到了工程化的下一个阶段,就是服务化。不是一定要很高大上的人才使用数据,而是公司里每一个人都使用上数据,这就是数据的泛化。

给大数据爱好者的一盆冷水

成本化的变化对大数据来讲,其实是非常关键的。我前一阵子见了国内有很大量数据的,他跟我说,整个大数据的两个点非常容易用,一个是获客,怎么用更低的成本获取客户,另外怎么用大数据帮我们定价,这两个对大数据是非常关键的,如何定价如何获取更好的客户,还有怎么样保全今天的客户,这三个点是非常重要。

大数据拥有非常多的隐性成本,看起来很美,但是其实大部分的数据只有20%的数据量是有足够的数据样本做大数据的,其它的地方都非常稀缺。举个例子,如果这个人每周都来比如说1号店购买,那么你很容易猜到他要什么。但是一年才来一次、两次的人,大数据怎么能知道这个人到底要什么?这个80%里面所要使用的成本,跟刚才的20%的成本是很不一样的。有很多的企业,应用大数据的时候都以为所有的东西都是20%里面的东西,容易用的东西。实际上你慢慢用下去,发现它的成本结构是不一样的,越用到数据稀缺的地方,成本越高。那个时候,所以我跟很多企业家讲,小心一点,当你用大数据的时候二八原则就开始出现了,没有那么美好的。

第二个,当你发现有很多用户,特别是互联网金融里面,比如说前一阵有一个人跟我说,他的公司可以,只要你告诉他在微信的数据之后,他可以很快的决定借不借钱给你、借多少。这是说微信微博里写的东西都是可信的时候,但是大家都知道公司会用这个来评分决定借钱给你的时候,这时候的成本就高了,要防止作弊。

第三,现在使用大数据的限制还是比较少的,未来随着限制的增多隐性的成本还是增加的。

我是想说,所有人都认为大数据很美好的时候,还是会有这样的隐性的问题在。

为什么今天是大数据时代?

科技的变化其实对大数据的影响非常大,大数据这个行业最大的吸引力在哪里?就是没有一个人说自己是专家。但是同时,如果你能吸引它,它的变化很好玩。今天我想跟大家说的一个最大的变化,有很多以前我们根本无法获取的数据,现在可以越来越容易拿到。从哪里找到用户,怎么吸引他,用什么吸引他,怎么去行动?这些对零售业来讲以前是很难的,但是关键的不是这张图,大家画这张图的时候面对的是今天自己的用户的时候,那就不是大数据。大数据是什么?是他还没有成为你的客户的时候,你居然知道怎么找到这个客户、怎么吸引他、用什么吸引他和如何行动。这就是刚才讲的80%里面你没有那么多数据,因为他只来了一次。如果让来过你店次的人,你都知道怎么找到他用什么吸引他,我觉得这个时候用上了大数据。用大数据,我觉得最关键的是如何知道自己本来不知道的事情,然后它的价值点就不只是优化这些数据。

刚才我所讲,对外部数据的认知,产生了价值让自己增值,刚才讲到义乌的商品集散销中心,不能只看自己义乌的数据,而要看全世界的数据,全世界的数据今天的整合,今天这个地方才会产生非常大的力量。

最后,抓住移动大数据的时代。移动大数据的时代,不是4个V,而是三个时间点,实时、适时、全时。全时,我们利用全时的时候收集数据,找出一些规律出来。适时,就是在什么机会点去营销,在合适的时间。在中间一个关键点,实时,实时收集数据实时触达用户的这个能力只有手机这个年代出现,以往来讲这个东西是不存在的。因为有了手机,实时收集的能力,与实时去营销的能力出现了,才会出现你一定要对他全时的关注以及适时的关注。这3个T的年代,我们一定要重新定位,过去的大数据是PC时代的大数据,现在的大数据年代是移动的大数据年代,连数据底层都已经出现了变化。如果在座的有人电子商务,你可以回去跟你的工程师说,我们的底层数据到底有没有移动?很简单,我问一个问题,在你的数据底层里面,因为APP里面一个非常关键的KPI是,这个人到底每天停留在你的APP的时间有多少,你的APP能成为他进入手机的第一个应用的百分比是多少?这些数据都是在以前PC时代比较少去看的。包括有一个指标非常关键,如果你现在有APP的话,你的APP的数据更新次数是多少?用户upgrade你的APP,只要你的用户开始减少upgrade,你要小心,他快要离开你的APP了。这些数据在移动的时代,和PC的时代是非常不一样的。

本文作者:车品觉 来源:网络大数据
CIO之家 www.ciozj.com 微信公众号:imciow
    >>频道首页  >>网站首页   纠错  >>投诉
版权声明:CIO之家尊重行业规范,每篇文章都注明有明确的作者和来源;CIO之家的原创文章,请转载时务必注明文章作者和来源;
延伸阅读
也许感兴趣的
我们推荐的
主题最新
看看其它的