首页  ·  知识 ·  大数据
大数据时代存储还是必须的吗
程浩译  畅享网    编辑:dezai   图片来源:网络
关于大数据的讨论往往聚焦在将大量数据进行存储,然后再进行回顾式的分析。而存储又带来了新的问题,诸如数据如何存储、数据如何组织、怎样清洗数据以及怎样的时间划分是合适的。

尽管这些基于存储的问题解决了,分析师还要决定哪些数据是已经过期了的。它们可能已经过时了,不能够用来反映当前环境了,有些历史数据是不能给我们一个关于未来的视角的。

实时数据分析

换一个思路,我们可以选择进行实时大数据分析。这样的话,我们就不用考虑大规模存储相关的问题了,而改为关心商业数据流量带宽了。Jeff Bertolucci在Information Week上面写道,电信公司最早开始使用实时大数据分析来了解当前的网络状况。“先存储,后分析”的方法,在要求实时性的领域中作用可能就不大了。

尽管中小企业可能没有像电信公司那么大量的数据流,但是他们也应当在投资数据存储之前,先知道它们需要哪些商业数据。Mary Shacklett在Tech Republic上面的一篇文章中提到,清理历史数据,然后得出有用的结果的花费很可能已经超出中小企业的预算承受范围了。从过去中反思学习的确是好的,但是对于中小企业而言,这样的投资得到的数据分析质量的确还是存疑的。

实时分析的好处

IT专家应当推荐企业走向实时之路,而不要陷入无尽的数据清理之中。实时分析之中往往见效很快,中小企业短时间内就能看到数据分析的好处;而用传统方式大规模存储,企业要投入很多资金。实时分析方法还有一个好处,就是让中小企业能够了解到哪些商业数据是需要的,因为毕竟不是所有的数据流都要用到商业分析之中。

通过对数据流的检验,中小企业能够看出哪些是有必要进行存储并回顾的。数据可以在源头就得到了优化。

要知道,洞察力来自于对数据的了解,而不在于你存储了多少数据。

 

本文作者:程浩译 来源:畅享网
CIO之家 www.ciozj.com 微信公众号:imciow
    >>频道首页  >>网站首页   纠错  >>投诉
版权声明:CIO之家尊重行业规范,每篇文章都注明有明确的作者和来源;CIO之家的原创文章,请转载时务必注明文章作者和来源;
延伸阅读
也许感兴趣的
我们推荐的
主题最新
看看其它的