首页
文章
文库
登录
|
注册
最新
推荐
热门
主题
关注
收藏
反馈
关注公众号
更多关联主题
文章
文档
微信ClickHouse实时数仓的最佳实践
为了满足业务数据分析的需求,微信WeOLAP团队联手腾讯云,共建千台规模、数据PB级、批流一体的ClickHouse数据仓库,实现了10倍以上的性能提升。本文将由浅入深,为大家揭晓微信在ClickHouse实时......
公司如何从0搭建BI系统?
一个完善的大数据分析平台,不仅仅是单纯展现数据的,更不是一些业务常用报表的罗列,还要能够为数据分析师、业务人员提供更多对数据的洞察,让数据更加智能化......
企业财务主数据如何建、怎么用
在财务信息化建设中,财务模块作为各个模块的数据最终归集之处,对于主数据维护的合理性要求最高。高度关注财务主数据维护,才能保证财务信息化工作有一个好的开头。......
数据建模方法论及实施步骤
了解数据建模之前首先要知道的是什么是数据模型。数据模型(DataModel)是数据特征的抽象,它从抽象层次上描述了系统的静态特征、动态行为和约束条件,为数据库系统的信息表示与操作提供一个抽......
企业的数据治理流程
数据治理是所有数据应用的根基,数据治理做的不好直接影响所有数据应用的价值。数据应用做得越深入,所需数据就会更多,对数据质量也会有更高的要求。而企业的数据治理做得越好,数据的质量也就......
数仓中指标-标签,维度-度量,自然键-代理键等各名词深度解析
作为一个数据人,是不是经常被各种名词围绕,是不是对其中很多概念认知模糊。有些词虽然只有一字之差,但是它们意思完全不同......
数仓建设规范指南
本文将全面讲解数仓建设规范,从数据模型规范,到数仓公共规范,数仓各层规范,最后到数仓命名规范,包括表命名,指标字段命名规范等......
深度解析用户画像标签体系构建方法
标签是对对象某个维度特征的描述与刻画,是某一种用户特征的符号表示,每一种标签都规定了我们观察认识描述对象的一个角度,用于对象的标注、刻画、分类和特征提取。......
关于用户画像,我用4000字给你讲明白
用户画像的内容可以很宽泛,只要是对用户的认知,都可以叫做用户画像。但你所去认知的这批人必须是你的典型用户,他们会用相似的方式使用你的产品,服务或消费你的品牌。......
详尽的用户画像怎么做
用户画像的核心工作就是给用户打标签,标签通常是人为规定的高度精炼的特征标识,如年龄、性别、地域、兴趣等。这些标签集合就能抽象出一个用户的信息全貌,每个标签分别描述了该用户的一个维度......
从0到1构建用户画像的流程与方法
用户画像作为一种设计工具,可以很好地帮助设计师跳出“为自己设计”的惯性思维,聚焦目标用户,发现核心价值,赋能产品。......
「B端用户画像」的特征和建立方法
在B端的设计中,用户画像的建立一直困扰着广大设计师朋友们,由于对于业务的不熟悉、对建立目的的不明确,经常会采用无脑硬套C端用户画像、刻意为建立画像而画像、过于追求画像广度而不注重深度这......
数据仓库研发规范
本文将为您介绍数据仓库研发规范的阶段规划、角色职责和整体流程。......
最为常用的数据挖掘方法论
本文介绍两种最为常用的数据挖掘方法论——CRISP-DM方法论和SEMMA方法论。......
数据管理、数据治理、数据中心、数据中台、数据湖、数据资产等的
数据中台、数据仓库和数据湖没有直接的关系,在某个维度上他们为业务产生价值的形式有不同的侧重,数据中台距离业务更近,能更快速的响应业务和应用开发的需求......
结合数据中台的数据治理模式实践
随着信息化时代的高速发展,数字化理念逐渐深入人心,各行各业都在做数字化转型。证券行业也不例外,各种线下的客户服务被线上化,很多依赖人工的工作场景被流程再造,并最终以数字化应用的形式体现......
数据指标体系指南
数据指标体系是构建数据中台的重要一环。数据指标的建立让运营及产品人员更直观地看到基本指标的变动,让数据分析师更便捷地开展数据分析工作。这篇文章就紧紧围绕“指标体系”展开,内容略干。......
数据指标设计方法
指标的设计链路,可以从目的→设计→公式→口径&范围,每一步都需要跟使用场景强绑定。所以当面对不同的使用场景时,同一个指标可能有多套口径的情况。......
如何构建公司的数据指标体系?
数据指标是业务中的核心内容,然而指标管理中总会出现许多问题。指标管理系统在一定程度上可以帮助实现规范化管理,但是针对不同的业务场景与需求,数据管理还应当灵活应变。......
银行数据指标体系建设与运营实战
怎样提升数据价值转化、缩短数据供应和数据应用之间的距离是数据中台建设面临的重要课题。......
数据中心数据质量线上监控的实践
本文主要分享有赞针对离线和实时数据做的一些监控实践,当前商家数据基本在7点前完成产出,所以线上监控规则大多是7点开始调度,为了更早的发现问题,我们也开始做业务层表(kylin)构建完成后触发监......
财务报表分析具体怎么做
作为一个财务工作者少不了与财务报表分析打交道,不怕报表制作难,就怕报表分析不够一目了然。直观的报表数据展现,更能让用户提炼到有用的价值,最终呈现给最高管理层,为分析决策提供依据。......
数据驱动决策的13种思维方式
“数据驱动决策”,为了不让这句话成为空话,请先装备以下13种思想武器,将来你一定能用上......
怎么提高自己的系统设计和架构理论水平
比如传统的业务系统主要关注的是领域建模设计,高并发、高可用、数据一致性等系统,在设计的时候会与业务系统有较大的差别,所以这里针对不同类型的系统,来简单介绍一下设计的时候面临的一些难......
一文读懂数据仓库建设中的数据建模方法
所谓水无定势,兵无常法。不同的行业,有不同行业的特点,因此,从业务角度看,其相应的数据模型是千差万别的。......
详解Kafka生产者和消费者的工作原理
每个消费者保留的唯一元数据是该消费者在日志中的偏移量或位置。此偏移量由使用者控制:通常,使用者在读取记录时会线性地推进其偏移量,但实际上,由于位置是由使用者控制的,因此它可以按喜欢的任......
HiveQL SELECT语句查询
HIVE总是按照从左到右的顺序执行的。嵌套SELECT语句会按照要求执行“下推”过程,在数据进行连接操作之前会先进行分区过滤。......
灾备行业关于数据保护与容灾备份的常识
谈灾备,就会细谈数据保护与容灾备份。然而,相关的概念经常有人混淆。我们搜集和参考公开资料进行初步梳理。一、数据保护在云与大数据时代,海量增长的数据容量,给数据的存储和保护带来新的挑......
美团商品知识图谱的构建及应用
本文将围绕零售商品知识图谱,介绍美团在商品层级建设、属性体系建设、图谱建设人效提升等方向的探索,希望对大家有所帮助或启发。......
数据开发,如何平衡效率与质量
数据模型设计的是商业模式,是产品逻辑;数据结果反映的是业务实操,是实际现状。......
严选库存中心设计实践
严选作为一家自营品牌电商,核心竞争力之一是对供应链的把控能力。在这其中,对库存的管理更是重中之重。如何降低库转、降低缺货率,是业务同学和分析师们几年来持续研究的课题。......
制造企业的数据分析之路
人工智能这些热点提高企业管理人员的兴趣,企业管理人员也对此寄于较高的期望值,有些人会觉得这些数据分析的技术能够马上改变企业的现状,解决很多年的顽疾......
Python结合RFM模型实现用户分层
通过分析发现原来几个重要的客户被竞争对手挖走了,而这几个用户对平台贡献了80%的销售额。之前对所有用户采用一样的运营策略,为了解决这个问题,需要对用户进行分类,了解当前用户分层情况,进行精......
数据分析里最常用的思维定式
数据分析的工作中也是如此,我们做数据分析的目的是为了提升公司的决策水平,如果不能描述客观事实,那么信息在沟通过程中很容易变形。......
数仓到底要分多少层
想要知道数仓要分几层,那就必须得先回答另一个问题:就是数据仓库为什么要分层?分层思想到底是在干什么?......
数据中台:从0-1,数据服务平台(DMP)实践
新的流量洼地越来越少,企业一方面要做到精准获客,另一方面也要使出浑身解数提升用户留存,最大化挖掘用户价值。......
服务型业务的关键运营动作
在toB业务的不同发展阶段,增长逻辑的驱动力从市场导向到产品导向再到服务导向,但在具体的运营逻辑上,依然围绕着用户拉新、付·费转化、用户服务这3个关键运营模块,在这3个模块下,不同的产......
用户画像中的标签维度是怎么设定
关于用户画像中的的标签体系制定,我们需要遵循的是市场发展趋势变化的建设背景,其中包括了信息技术的发展、用户心智的变化、营销理念的转变,以及内容创意的丰富多样......
软件项目的全生命周期
项目:是指一系列独特的、复杂的并相互关联的活动,这些活动有着一个明确的目标或目的,必须在特定的时间、预算、资源限定内,依据规范完成。......
数据治理分析项目最佳实践
?当今信息化建设程度不断深入,企业在优化整合各种IT能力,使IT成为企业的前进驱动力与核心竞争力的同时,将视角关注于更深层次的数据治理与分析,预示着以数据、流量、知识为主的数字经济时代到来,......
企业微信万亿级日志检索系统
虽然现网保留7天最新日志,但是由于某些模块请求量大或日志打印不合理,我们也会限制一个小时日志打印量,超过阈值后不再保存......
数据方法论和分析方法,运用到实际业务场景应该注意这些
数据分析方法论:是从宏观角度出发,从管理和业务的角度提出的一种分析框架,这个框架可以很好的指导我们接下来具体分析的方向和板块......
数据的Sense,离不开数据分析思维
通过大数据技术的加持,很多重要的社会经济心理变量变得可以构建,如居民幸福感、投资人情绪等,而实时技术的发展甚至使得实时预测变成了可能。......
ETL开发规范
数据抽取:从数据源获取所需数据的过程。数据抽取过程会过滤掉目标数据集中不需要的源数据字段或数据记录。......
Flink+Clickhouse在广投集团实时数仓的最佳实践
集团财务共享中心的财务人员在核对财务凭证数据时经常需要跨多个系统查询且每个系统使用方式不一,同时因为系统累计数据庞大,制单和查询操作经常出现卡顿,工作效率非常低。......
基于 Flink + ClickHouse 打造轻量级点击流实时数仓
Flink和ClickHouse分别是实时计算和(近实时)OLAP领域的翘楚,也是近些年非常火爆的开源框架,很多大厂都在将两者结合使用来构建各种用途的实时平台,效果很好......
如何解决冷启动问题
在缺乏有价值数据的时候,如何有效地满足业务需求的问题,就是“冷启动问题”。为了沟通方便,下面统一从推荐系统的角度来讲“冷启动问题”,其他业务场景同理。......
系统的设计一个指标体系
虽然今天互联网企业已经足够的数字化,但看清楚公司的运行情况,依旧是一件很难的事情。看清楚,不仅包括看清楚企业的投入情况,也包括看清楚业务的运行情况......
数据分析:如何深挖原因,推动业务
数据分析需要一点“精神分裂”,找完原因,还要向业务同学提建议。这个时候,又得掌握站在业务同学的角度思考如何提出建议。......
数据质量管理方法
数据质量管理(DATAQualityManagenment)是指对上述过程中每个阶段可能出现引发数据质量的问题进行识别、监控、预警等相关管理活动。......
如何搭建一套完整的指标体系
通过搭建指标体系的「OSM模型+ARGO模型+金字塔原则」整体框架,我们便可以快速地搭建起一套适合自身业务的指标体系。......
一文快速入门分库分表
分库分表是为了解决由于库、表数据量过大,而导致数据库性能持续下降的问题。按照一定的规则,将原本数据量大的数据库拆分成多个单独的数据库,将原本数据量大的表拆分成若干个数据表,使得单一的库......
最实用的机器学习算法优缺点分析
对于机器学习算法的盘点,网上屡见不鲜。但目前,还没人能结合使用场景来把问题说明白,而这一点正是本文的目的所在。......
如何优雅地规划数仓体系
数仓规划是数仓建设的蓝图,涵盖从需求分析开始到最终的数仓评估验收整个环境;数仓规划之所以重要,是因为它是描述了数据流动的概念性框架,为元数据管理奠定了基础,对数据加工过程的理解、数......
一个数据平台的十二年架构演变历程
本文将深入介绍这一转型的幕后故事:金融时报数据平台的创建和演化。该数据平台提供读者与FT互动的信息,让我们能够决定如何继续为读者提供他们想要和需要的东西。......
数仓建设体系
数据仓库概念:英文名称为DataWarehouse,可简写为DW或DWH。数据仓库的目的是构建面向分析的集成化数据环境,为企业提供决策支持(DecisionSupport)。它出于分析性报告和决策支持目的而创建。......
掉进数据治理无止境的坑,我是怎么爬出来的
本文主要介绍美团酒旅数据治理的历程和实践经验,以及业务发展各个阶段中数据体系遇到的问题和解决方案。最后,将探讨数据治理在现阶段的建设思路和发展方向。......
智慧工厂五大基本特征
在中国制造2025及工业4.0信息物理融合系统CPS的支持下,离散制造业需要实现生产设备网络化、生产数据可视化、生产文档无纸化、生产过程透明化、生产现场无人化等先进技术应用,建立基于工业大数据......
数据分析从0-1必备6大知识清单
判断一个人做数据分析的水平,不是看他学习了几种工具,最核心的差距在于思考问题的思维能,这是数据分析的本质,也是最容易被人忽视的点......
0年数据分析老司机的深度思考
战略分析的方法:需要从竞品及行业数据中发现行业发展趋势及竞品的战略定位,同时结合公司内部数据,可以发现相对于行业和竞品发展,内部在哪些地方存在不足,以此制定进攻和防守策略......
首页
上一页
1
2
3
4
5
6
7
8
9
10
...
下一页
尾页
大数据
主题文档
Facebook大数据实时分析案例分享
营销数据分析
文科教授眼中的大数据-祝建华
阿里研究中心:大数据时代
大数据,你准备好了么?
大数据产业生态战略研究
大数据时代的企业Hadoop解决方案
大数据挖掘
大数据--下一个创新、竞争和生产力的前沿
大数据相关介绍