• 大数据常见问题之数据倾斜
    数据倾斜就是我们在计算数据的时候,数据的分散度不够,导致大量的数据集中到了一台或者几台机器上计算,这些数据的计算速度远远低于平均计算速度,导致整个计算过程过慢。......
    大数据常见问题之数据倾斜
  • 一文带你搞清楚什么是“数据倾斜”
    数据倾斜,在MapReduce编程模型中十分常见,就是大量的相同key被partition分配到一个分区里,造成了"一个人累死,其他人闲死"的情况,这违背了并行计算的初衷,整体的效率是十分低下的......
    一文带你搞清楚什么是“数据倾斜”
  • 一文全面了解线下门店核心数据指标
    在互联网的大时代背景,线下门店如何打造智慧门店?如何线上线下一体化的融合?如何利用大数据精准营销?如何整合散落在各处的数据信息?来持续优化精准营销、销售与供应链,紧随着新时代新零售......
    一文全面了解线下门店核心数据指标
  • 如何设计企业级数据埋点采集方案
    埋点设计文档面向开发的埋点需求说明书,目的是让开发理解需要在什么情况下做哪些埋点采集,以及具体需要的属性参数类型、取值,确保采集的准确性和完善性。......
    如何设计企业级数据埋点采集方案
  • 数据建模的方法、模型、规范和工具
    由于在变化快速的商业世界里,业务形态多种多样,为了能够更有针对性的进行数据建模,经过长时间的摸索,业界逐步形成了数据建模的四部曲:业务建模->领域建模->逻辑建模->物理建模。......
    数据建模的方法、模型、规范和工具
  • 无人售货新零售商城系统两大架构推荐
    无人售卖新零售系统平台一开始运营的方向就是走智能化路线,无人售货新零售电商系统通用户人脸识别、智能化数据推荐、无感支付等购物体验都是大数据筛选出来的精准目标人群为主,加上物联网技术......
    无人售货新零售商城系统两大架构推荐
  • 5600字带你全面系统了解主数据管理
    在数据管理方面,有两类数据,需要政企重点关注,第一个是元数据管理,它是对所有数据进行定义,标准和划分,赋予数据意义,元数据管理是我们数据管理的基石。......
    5600字带你全面系统了解主数据管理
  • 数据分析能力模型
    以往在增量时代,每天都有新的领域、新的市场被开发。尤其是在互联网、电商等领域的红利期,似乎只要做好单点的突破就能获得市场。这个蛮荒时代,业务运营主要依靠是经验和直觉驱动......
    数据分析能力模型
  • 业务数据治理体系化思考与实践
    美团住宿数据治理团队通过多年数仓建设及数据治理的经验沉淀,并结合业务发展阶段对于数据治理的诉求,将治理的思路逐步从专项、表象、问题驱动的治理,转变为自动化、体系化的治理,并从标准化......
    业务数据治理体系化思考与实践
  • 工业数字化转型中的数据治理
    随着数据资源的爆炸性增长,企业面临着数据标准不统一、数据信息分散、数据质量参差不齐、开发维护困难等问题,很难满足实时分析和决策的高要求。因此,数据治理对于工业互联网的发展至关重要......
    工业数字化转型中的数据治理
  • 10个关键数据模型 客户深度运营实操指南
    运营模型也多种多样:比如,有偏理论的,也有偏实践的;有分析用户属性与生命周期的,也有经营用户的;根据用户增长、用户活跃、用户留存、用户变现等运营目标,每个目标下都有特定的方法论;再......
    10个关键数据模型 客户深度运营实操指南
  • 媒体数据中台建设方法论和落地实践
    媒体融合下半场的重心将向智能化趋势发展。如何打造实用有效的媒体数据产品和服务,继而完成数智化转型,已成为媒体行业当前最为关注的问题。本文围绕当前媒体机构的转型需求,媒体数据中台建设......
    媒体数据中台建设方法论和落地实践
  • 如何构建完备的用户数据采集体系
    常用的用户数据可分为属性(User)数据与事件(Event)数据,常用的数据来源主要包括客户端、服务端、业务数据与历史数据。TA系统用户行为分析就使用属性(User)+事件(Event)的定义方式,高......
    如何构建完备的用户数据采集体系
  • 网易传媒数据治理建设实践
    本篇从四个部分向大家展开介绍,第一部分是传媒的业务介绍,第二部分是数仓建设演进,第三部分是数据管治体系,最后再介绍对数据治理体系化建设的一些展望。......
    网易传媒数据治理建设实践
  • 数据治理的元数据、主数据等概念
    数据治理涵盖了从前端业务系统、后端业务数据库再到业务终端的数据分析,从源头到终端再回到源头,形成的一个闭环负反馈系统。从目的来讲,数据治理就是要对数据的获取、处理和使用进行监督管理......
    数据治理的元数据、主数据等概念
  • 指标和标签的基础理解
    什么是指标,什么是标签,最本质的区别在哪?如何识别?......
    指标和标签的基础理解
  • ODS、DWD、DWM等理论实战
    数仓在建设过程中,对数据的组织管理上,不仅要根据业务进行纵向的主题域划分,还需要横向的数仓分层规范。本文作者围绕企业数仓分层展开分析,希望对你有帮助。......
    ODS、DWD、DWM等理论实战
  • 企业数据治理落地和同行面试基础
    数据治理关注的核心需求也存在差异,数据治理管理过程最简单最通俗的就是利用组织、制度、流程和工具将信安系统的数据转换为有用的信息的过程。......
    企业数据治理落地和同行面试基础
  • 企业数字化转型:数字化成熟度模型ODMM
    ODMM评估的结果是一个量化的、优先排序的列表,列出了企业的数字业务理想与其当前数字成熟度水平之间的差距。企......
    企业数字化转型:数字化成熟度模型ODMM
  • 从信息化改造到数字化转型,中国企业行至何处?
    几年之前,中国企业还在大力提信息化改造,工业和信息化部也在提“两化融合”(工业化+信息化),现在大家又开始提数字化转型......
    从信息化改造到数字化转型,中国企业行至何处?
  • 金融数据安全分类分级方法
    金融数据复杂多样,对数据实施分级管理,能够进一步明确保护对象,有助于金融业机构合理分配数据保护资源和节约成本,是金融业机构建立完善的金融数据生命周期保护框架的基础,也是关键性数据安......
    金融数据安全分类分级方法
  • 一文读懂数据指标体系建设
    几乎所有的数据分析工作都会提到一个词——“建立数据指标体系”,虽然这个词对于大家来说并不陌生,但是数据指标到底是什么以及如何具体的搭建呢?......
    一文读懂数据指标体系建设
  • 爱奇艺数据库实践:不同场景如何快速选择数据库
    我们做数据库选型的时候首先要问:需求是谁提出的,也就是说谁选型?是负责采购的同学、DBA还是业务研发?......
    爱奇艺数据库实践:不同场景如何快速选择数据库
  • 财务共享的服务质量与财务风险管理联动探索
    记账自然成为大数据的制造者,挖掘和应用这些数据的价值为企业战略护航是新时代财务的立足之本。......
    财务共享的服务质量与财务风险管理联动探索
  • 维度数据建模过程及举例
    本文介绍数据仓库中维度数据建模的过程描述,并举一个示例以加深对相关概念的理解。......
    维度数据建模过程及举例
  • 知乎用户画像与实时数据架构实践
    对于实时数据方面,期望拥有可以实时响应的用户行为流,同时在算法特征、指标统计、业务外显等业务场景有愈来愈多的数据实时化的诉求。......
    知乎用户画像与实时数据架构实践
  • 美团数据指标体系搭建实例
    数据,已经渗透到当今每一个行业和业务职能领域,成为重要的生产因素;人们对于海量数据的挖掘和运用,预示着新一波生产率增长和消费者盈余浪潮的到来。......
    美团数据指标体系搭建实例
  • 数据仓库基本概念
    业务板块定义了数据仓库的多种命名空间,是一种系统级的概念对象。当数据的业务含义存在较大差异时,你可以创建不同的业务板块让各成员独立管理不同的业务,后续数据仓库的建设将受到业务板块的......
    数据仓库基本概念
  • 关于数仓建设及数据治理的超全概括
    用空间换时间,通过大量的预处理来提升应用系统的用户体验(效率),因此数据仓库会存在大量冗余的数据;不分层的话,如果源业务系统的业务规则发生变化将会影响整个数据清洗过程,工作量巨大。......
    关于数仓建设及数据治理的超全概括
  • 普及元数据和主数据的联系与定义
    在数据治理中,我们总是会听到元数据和主数据,我们今天就可以来说说什么是元数据,什么是主数据。......
    普及元数据和主数据的联系与定义
  • 数据分类模型之“元数据、引用数据、主数据、业务数据...”
    六大类数据模型:元数据、引用数据、主数据、企业结构数据、交易活动数据、交易审计数据,分别指什么?有什么作用?......
    数据分类模型之“元数据、引用数据、主数据、业务数据...”
  • 数据标准与主数据、元数据、数据质量的关系
    想做大数据治理,首先要把数据标准做好,否则匆忙建设各种数据仓库、数据集市,最后发现标准有问题,质量不高,这时候再去建数据标准就会导致投资浪费问题。......
    数据标准与主数据、元数据、数据质量的关系
  • 浅谈主数据管理
    主数据是满足跨部门业务协同需要的、反映核心业务实体状态属性的组织机构的基本信息。它是关键业务实体的数据,也有人认为它其实应该翻译为“核心数据”。比如对于房地产行业来说,楼盘信息就属......
    浅谈主数据管理
  • 电商运营要关注哪些数据?电商数据分析怎么做?
    电商数据分析一直是个让人比较头疼的东西,特别是对电商运营人员来说,电商数据分析如何做的深入且分析的有价值呢?......
    电商运营要关注哪些数据?电商数据分析怎么做?
  • 可实操使用的数仓建设规范指南
    优秀可靠的数仓体系,往往需要清晰的数据分层结构,即要保证数据层的稳定又要屏蔽对下游的影响,并且要避免链路过长。那么问题来了,一直在讲数仓要分层,那数仓分几层最好?......
    可实操使用的数仓建设规范指南
  • 数据治理一体化实践之体系化建模
    随着数字经济的快速发展,数据已经成为新的生产要素。如何有效地开展数据治理工作,提升数据质量,打破数据孤岛,充分发挥数据的业务价值,已成为业界的热门话题。......
    数据治理一体化实践之体系化建模
  • 大型企业如何实现MySQL到Redis的同步
    本文将重点讨论在超大规模系统中缓存会面临什么样的问题,以及应该使用什么样的策略来更新缓存。......
    大型企业如何实现MySQL到Redis的同步
  • 详解大数据批流处理中的两大架构
    随着应用需求的不断发展,数据处理系统的能力也亟待提高。其中最为迫切的,便是如何利用云边协同计算平台的环境优势,实现高效的批流融合处理系统,从而低延迟、高吞吐地对全量历史数据与实时的......
    详解大数据批流处理中的两大架构
  • 数据仓库各层该如何设计数据模型
    目前各大公司的产品需求和内部决策对于数据实时性的要求越来越迫切,需要实时数仓的能力来赋能。传统离线数仓的数据时效性是T+1,调度频率以天为单位,无法支撑实时场景的数据需求。即使能将调......
    数据仓库各层该如何设计数据模型
  • 如何优雅地规划数仓体系?
    数仓规划是数仓建设的蓝图,涵盖从需求分析开始到最终的数仓评估验收整个环境;数仓规划之所以重要,是因为它是描述了数据流动的概念性框架,为元数据管理奠定了基础,对数据加工过程的理解、数......
    如何优雅地规划数仓体系?
  • 一文了解主数据建设的挑战与发展
    从数据管理到组织机构变革,其实现在不仅是业务方需要的组织机构的变革,还有数据上的驱动组织变革,我们经历过非常多的行业,都在为了业务而进行组织机构的每次的一轮又一轮的调整,这里会遇到很多......
    一文了解主数据建设的挑战与发展
  • 什么是大数据战略以及如何构建
    对于大数据,重要的不仅仅是数据量。数据量只是大数据的特性之一,这实际上是更容易解决的挑战之一。大数据更难的挑战与其他特性有关:数据类型的多样性、数据变化的速度、来自不同系统的数据的......
    什么是大数据战略以及如何构建
  • 大数据的数据治理与应用场景
    大数据技术在技术层面、业务层面都有十分重要的应用价值在技术层面:大数据技术可以应用于非结构化数据的分析、挖掘,大量实时监测数据分析等,为管理系统、综合信息平台等建设提供技术支持;在......
    大数据的数据治理与应用场景
  • 商品知识图谱的构建思路
    把知识进行表征常用两种方式:一是知识图谱,通过图的方式表达知识的结构;二是向量,把知识用有限维的向量来表达。......
    商品知识图谱的构建思路
  • 从数据仓库、数据湖,到数据中台的差异与架构演进
    数据仓库平台逐步从BI报表为主到分析为主、到预测为主、再到操作智能为目标。......
    从数据仓库、数据湖,到数据中台的差异与架构演进
  • 大数据环境下,如何做好企业数据资产的管理
    电信运营商在长期的内部精细化管理和精确营销服务的过程中,积累了大量的数据。这些数据在大数据背景下具备外部变现的潜质,大数据为运营商业务分析运营带来新的变革可能。......
    大数据环境下,如何做好企业数据资产的管理
  • 数据资产估值体系框架的初步探究
    在数据资产交易逐渐成为社会各界关注重点的当下,设计和构建科学的数据资产估值体系,对厘清数据资产属性、制定统一的定价机制、促进数据市场健康发展具有至关重要的意义。......
    数据资产估值体系框架的初步探究
  • To B战略规划与营销体系的业务逻辑
    很多咨询公司你都会听到它们在讲,一般做战略规划,或者说DSTE。都会提到BLM这个模型以及一个叫做MM市场管理的两个工具。这些方法论都是源自于某厂的一些实践。......
    To B战略规划与营销体系的业务逻辑
  • 产品数据规划指南
    对于一个数据的量化,一般通过对字段进行某种计算得到(比如求和、平均)在原始数据的基础上,通过统计汇总,加工处理形成的用于表征业务活动好坏优劣的数据。......
    产品数据规划指南
  • 数据湖和数据仓库的区别
    进行数据分析工作的时候会用到很多的工具,比如说数据湖和数据仓库,不过这两者之间的差异和区别,可能会让人困惑。那么大家知道不知道数据湖和数据仓库的区别是什么呢?......
    数据湖和数据仓库的区别
  • 数据仓库开发规范
    表的命名需要遵循基本原则:层次_表名_所属项目,如bdl_order_eb;......
    数据仓库开发规范
  • 企业大数据平台数据仓库架构建设思路
    随着互联网规模不断的扩大,数据也在爆炸式地增长,各种结构化、半结构化、非结构化数据的产生,越来越多的企业开始在大数据平台下进行数据处理。......
    企业大数据平台数据仓库架构建设思路
  • 数据库VS数仓VS数据平台VS数据中台
    数据中台出现的意义在于降本增效,是用来赋能企业沉淀业务能力,提升业务效率,最终完成数字化转型。......
    数据库VS数仓VS数据平台VS数据中台
  • BI建设项目的前期,如何收集和明确项目需求?
    企业做BI项目的第一步,一般都是明确BI项目的需求,毕竟有需求才能带来价值,明确了需求才知道BI项目的重点建设方向在哪里。今天就来和大家聊聊,如何明确BI项目的需求。......
    BI建设项目的前期,如何收集和明确项目需求?
  • 企业数字化升级必须了解CDP(用户数据平台)
    2021年,数据驱动增长的概念已经非常成熟,非常多的企业已经亟需通过数据驱动业增长,企业搭建CDP,可以实现业务全链路打通,并通过数据驱动业务增长。......
    企业数字化升级必须了解CDP(用户数据平台)
  • 携程度假数据治理之数据标准管理实践
    本文分享的是数据标准管理在携程度假数据治理中的实践,希望对想要了解和学习数据治理实践的读者有所帮助,也希望能收获宝贵的建议。......
    携程度假数据治理之数据标准管理实践
  • 企业如何做好大数据项目的选型
    企业如何做好大数据项目的选型。我们将会从6个方面来进行分享:第一部分是大数据项目的基本概念,第二部分是大数据项目选型的整体框架;第三部分是选型评估的6个要素;第四部分是项目选型的4个......
    企业如何做好大数据项目的选型
  • 网易传媒数据指标体系建设实践
    指标体系是将零散单点的具有相互联系的指标,系统化的组织起来,通过单点看全局,通过全局解决单点的问题。完整的指标体系是由指标和维度组成的。......
    网易传媒数据指标体系建设实践
  • To B 的常用分析指标
    SaaS采用订阅模式,这决定了厂商的收入取决于未来的时间段,即每月或每年的经常性收入(MRR/ARR)。这些收入需要在较长的时间内弥补前期的获客成本(CAC)以及后期的维护成本(CRC),才能产生盈利。......
    To B 的常用分析指标
  • 数据指标中心的建设
    做好业务分析的重点在于数据分析师要有良好的专业素养:一方面要有过硬的专业技能、了解业务;另一方面要能够通过合作和协调,让分析策略可以落地并正向影响业务。这篇文章将从数据认知开始,给......
    数据指标中心的建设