-
数据倾斜,在MapReduce编程模型中十分常见,就是大量的相同key被partition分配到一个分区里,造成了"一个人累死,其他人闲死"的情况,这违背了并行计算的初衷,整体的效率是十分低下的
-
在互联网的大时代背景,线下门店如何打造智慧门店?如何线上线下一体化的融合?如何利用大数据精准营销?如何整合散落在各处的数据信息?来持续优化精准营销、销售与供应链,紧随着新时代新零售
-
埋点设计文档面向开发的埋点需求说明书,目的是让开发理解需要在什么情况下做哪些埋点采集,以及具体需要的属性参数类型、取值,确保采集的准确性和完善性。
-
大数据时代,数据成为社会和组织的宝贵资产,像工业时代的石油和电力一样驱动万物,然而如果石油的杂质太多,电流的电压不稳,数据的价值岂不是大打折扣,甚至根本不可用,不敢用,因此,数据治
-
由于在变化快速的商业世界里,业务形态多种多样,为了能够更有针对性的进行数据建模,经过长时间的摸索,业界逐步形成了数据建模的四部曲:业务建模->领域建模->逻辑建模->物理建模。
-
在数据管理方面,有两类数据,需要政企重点关注,第一个是元数据管理,它是对所有数据进行定义,标准和划分,赋予数据意义,元数据管理是我们数据管理的基石。
-
以往在增量时代,每天都有新的领域、新的市场被开发。尤其是在互联网、电商等领域的红利期,似乎只要做好单点的突破就能获得市场。这个蛮荒时代,业务运营主要依靠是经验和直觉驱动
-
美团住宿数据治理团队通过多年数仓建设及数据治理的经验沉淀,并结合业务发展阶段对于数据治理的诉求,将治理的思路逐步从专项、表象、问题驱动的治理,转变为自动化、体系化的治理,并从标准化
-
随着数据资源的爆炸性增长,企业面临着数据标准不统一、数据信息分散、数据质量参差不齐、开发维护困难等问题,很难满足实时分析和决策的高要求。因此,数据治理对于工业互联网的发展至关重要
-
运营模型也多种多样:比如,有偏理论的,也有偏实践的;有分析用户属性与生命周期的,也有经营用户的;根据用户增长、用户活跃、用户留存、用户变现等运营目标,每个目标下都有特定的方法论;再
-
媒体融合下半场的重心将向智能化趋势发展。如何打造实用有效的媒体数据产品和服务,继而完成数智化转型,已成为媒体行业当前最为关注的问题。本文围绕当前媒体机构的转型需求,媒体数据中台建设
-
常用的用户数据可分为属性(User)数据与事件(Event)数据,常用的数据来源主要包括客户端、服务端、业务数据与历史数据。TA系统用户行为分析就使用属性(User)+事件(Event)的定义方式,高