首页  ·  知识库 ·  大数据
网格模式   列表模式
  • 数据倾斜就是我们在计算数据的时候,数据的分散度不够,导致大量的数据集中到了一台或者几台机器上计算,这些数据的计算速度远远低于平均计算速度,导致整个计算过程过慢。
  • 数据倾斜,在MapReduce编程模型中十分常见,就是大量的相同key被partition分配到一个分区里,造成了"一个人累死,其他人闲死"的情况,这违背了并行计算的初衷,整体的效率是十分低下的
  • 在互联网的大时代背景,线下门店如何打造智慧门店?如何线上线下一体化的融合?如何利用大数据精准营销?如何整合散落在各处的数据信息?来持续优化精准营销、销售与供应链,紧随着新时代新零售
  • 大数据时代,数据成为社会和组织的宝贵资产,像工业时代的石油和电力一样驱动万物,然而如果石油的杂质太多,电流的电压不稳,数据的价值岂不是大打折扣,甚至根本不可用,不敢用,因此,数据治
  • 由于在变化快速的商业世界里,业务形态多种多样,为了能够更有针对性的进行数据建模,经过长时间的摸索,业界逐步形成了数据建模的四部曲:业务建模->领域建模->逻辑建模->物理建模。
  • 在数据管理方面,有两类数据,需要政企重点关注,第一个是元数据管理,它是对所有数据进行定义,标准和划分,赋予数据意义,元数据管理是我们数据管理的基石。
  • 以往在增量时代,每天都有新的领域、新的市场被开发。尤其是在互联网、电商等领域的红利期,似乎只要做好单点的突破就能获得市场。这个蛮荒时代,业务运营主要依靠是经验和直觉驱动
  • 美团住宿数据治理团队通过多年数仓建设及数据治理的经验沉淀,并结合业务发展阶段对于数据治理的诉求,将治理的思路逐步从专项、表象、问题驱动的治理,转变为自动化、体系化的治理,并从标准化
  • 随着数据资源的爆炸性增长,企业面临着数据标准不统一、数据信息分散、数据质量参差不齐、开发维护困难等问题,很难满足实时分析和决策的高要求。因此,数据治理对于工业互联网的发展至关重要
  • 运营模型也多种多样:比如,有偏理论的,也有偏实践的;有分析用户属性与生命周期的,也有经营用户的;根据用户增长、用户活跃、用户留存、用户变现等运营目标,每个目标下都有特定的方法论;再
  • 媒体融合下半场的重心将向智能化趋势发展。如何打造实用有效的媒体数据产品和服务,继而完成数智化转型,已成为媒体行业当前最为关注的问题。本文围绕当前媒体机构的转型需求,媒体数据中台建设
  • 常用的用户数据可分为属性(User)数据与事件(Event)数据,常用的数据来源主要包括客户端、服务端、业务数据与历史数据。TA系统用户行为分析就使用属性(User)+事件(Event)的定义方式,高