• 大数据治理:成熟度评估框架
    在实施信息治理计划时,首先采取的步骤之一就是评估当前成熟度状态,预测所需的未来成熟度状态。大数据具备‘小数据’的全部特征。惟一的差别就是大数据来源渠道的复杂性和多样性。尽管组织在治......
    大数据治理:成熟度评估框架
  • 大数据智能的三个层次
    在统计学、MBA、大数据智能圈子里,“轰炸机机身中弹统计”是一个很有名的关于幸存者偏差(SurvivorshipBias)的鸡汤故事。本文将以这个故事为例,和大家探讨一下大数据智能的三个层次:大数据......
    大数据智能的三个层次
  • 用户画像是怎么生成出来的?
    如果说有什么能力是产品经理最需要具备的核心能力,那么答案一定是“了解用户”,而要说如何体现产品经理对用户了解的程度,那一定是能输出一份合格的用户画像。......
    用户画像是怎么生成出来的?
  • 智能制造的核心关键:工业大数据
    工业大数据的重要性众所周知,但究其根本,大数据是手段而不是目的,人工智能也是如此。如果仅仅因为工业互联网的概念很热,企业就要去盲目拥抱工业互联网和工业大数据、人工智能技术,实际上是......
    智能制造的核心关键:工业大数据
  • 业界都在谈的“企业数字化转型”是什么?
    企业数字化要实现人与人、物与物、人与物的全连接,需要把员工、客户、合作伙伴、供应商连在一起,基于大数据和人工智能来开展运营。另外,把实时决策融入业务流程,实现自动化,使运营更加简单......
    业界都在谈的“企业数字化转型”是什么?
  • 数据基础设施的未来
    在以往提供良好服务的“通用”数据中心架构如今正在达到其可扩展性、性能和效率的极限,并使用统一的资源比率来满足所有计算处理、存储和网络带宽要求。而对于数据密集型工作负载(例如大数据、......
    数据基础设施的未来
  • 知乎的数据同步建设、工具选型及平台化实践
    从数仓建设的角度思考,数据仓库需要依赖于稳定和规范的数据源,数据需要经过采集加工后才能真正被数仓所使用。推动数据同步服务的平台化,才有可能从源头规范数据的产出。数据同步服务不像数据......
    知乎的数据同步建设、工具选型及平台化实践
  • 精细化运营在小红书的实践
    今天我给大家分享的是「精细化运营在小红书的实践」,这里面最重要的两个字就是实践。而精细化运营和一些理论,我想你们肯定也听过。......
    精细化运营在小红书的实践
  • 如何把握数据治理项目启动的最佳时机
    在数据驱动的信息化时代,企业只有将核心业务数据更好地掌握在手中,才能从中萃取更大的业务价值,进而优化产品管理,拓展市场新渠道,打造企业核心竞争力,而数据治理就是挖掘这些价值的重要手......
    如何把握数据治理项目启动的最佳时机
  • 大数据平台的数据同步服务实践
    在大数据系统中,我们往往无法直接对在线系统中的数据直接进行检索和计算。在线系统所使用关系型数据库、缓存数据库存储数据的方式都非常不同,很多存储系统并不适合分析型(OLAP)的查询,也不......
    大数据平台的数据同步服务实践
  • 如何设计用户画像的标签体系?
    什么是标签体系呢?简单说就是你把用户分到多少个类里面去。当然,每个用户是可以分到多个类上的。这些类都是啥,彼此之间有何联系,就构成了标签体系。标签体系的设计有两个常见要求,一是便于......
    如何设计用户画像的标签体系?
  • 从移动营销的巨变到个人数据交易
    广告营销领域内的跨界乱战,越来越演变成大数据的争夺战。争夺战中暴露出很多问题:数据交易不规范,数据标准不统一,数据使用没有充分保护。而这一系列的问题中最尖锐的,还是隐私问题。......
    从移动营销的巨变到个人数据交易
  • 寒冬下的增长困境,大数据能发挥多大作用
    面对普遍存在的增长困境,很多互联网公司选择的策略是盘活存量、做优增量,也就是想办法怎么开源节流地精细化运营,以及用最小的成本获取较大的增长,然后让自己存活下来。......
    寒冬下的增长困境,大数据能发挥多大作用
  • 新零售业务中台设计及产品体系解决方案
    新零售的实质就是零售数据化,尽可能借助互联网、物联网、云计算、人工智能和大数据等技术实现零售的“线上+线下+物流”互联互通。......
    新零售业务中台设计及产品体系解决方案
  • 你确定你真的懂用户画像?
    在互联网逐渐步入大数据时代后,不可避免的给企业及消费者行为带来一系列改变与重塑。其中最大的变化莫过于,消费者的一切行为在企业面前似乎都将是“可视化”的。......
    你确定你真的懂用户画像?
  • 机器学习中那些必要又困惑的数学知识
    现在很多想从事于机器学习的朋友都存在很多困惑,主要是很多相关的书看不懂,尤其是数学部分,机器学习的基础是数学。数学并非是一个可选可不选的理论方法,而是不可或缺的支柱。对于机器学习算......
    机器学习中那些必要又困惑的数学知识
  • 终于有人把用户画像的流程、方法讲明白了
    用户画像将产品设计的焦点放在目标用户的动机和行为上,从而避免产品设计人员草率地代表用户。产品设计人员经常不自觉的把自己当作用户代表,根据自己的需求设计产品,导致无法抓住实际用户的需......
    终于有人把用户画像的流程、方法讲明白了
  • 互联网金融做大数据风控的九种维度
    在互联网金融迅猛发展的背景下,风险控制问题已然成为行业焦点,基于大数据的风控模型正在成为互联网金融领域的热门战场。那么,大数据风控到底是怎么一回事呢?与传统风控相比,它又是怎样来进......
    互联网金融做大数据风控的九种维度
  • spark图解
    spark已经成为广告、报表以及推荐系统等大数据计算场景中首选系统,因效率高,易用以及通用性越来越得到大家的青睐,我自己最近半年在接触spark以及sparkstreaming之后,对spark技术的使用有一......
    spark图解
  • 大数据理论体系总结--数据仓库管理与全链路数据体系
    就这样,大数据领域蓬勃发展了好几年,有很多伙伴执迷于技术,成为了分布式计算与存储的领域专家。也有很多伙伴执迷于数据,成为了行业的数据研发专家。当然还有很多小伙伴,热衷于工具系统开发......
    大数据理论体系总结--数据仓库管理与全链路数据体系
  • 美团大数据质量监控平台
    数据,已经成为互联网企业非常依赖的新型重要资产。数据质量的好坏直接关系到信息的精准度,也影响到企业的生存和竞争力。MichaelHammer(《ReengineeringtheCorporation》一书的作者)曾说过,......
    美团大数据质量监控平台
  • 如何将知识图谱特征学习应用到推荐系统
    将知识图谱作为辅助信息引入到推荐系统中可以有效地解决传统推荐系统存在的稀疏性和冷启动问题,近几年有很多研究人员在做相关的工作。目前,将知识图谱特征学习应用到推荐系统中主要通过三种方......
    如何将知识图谱特征学习应用到推荐系统
  • 如何从零构建实时的个性化推荐系统
    在移动互联网迅速发展的今天,信息量爆发性增长,人们获取信息的途径越来越多,如何从大量的信息中获取我们想要的内容,成为了推荐系统研究的重点。随着大数据产业的不断壮大,推荐系统在企业也......
    如何从零构建实时的个性化推荐系统
  • 如何通过数据驱动业务发展
    很多公司在采集数据时,会采集到很多脏数据,比如模拟器刷量、羊毛党刷量。如果未做反作弊识别,很难将这部分数据过滤掉;另外一方面,在采集数据时,没有做到标准化、规范化上报。那么在做数据......
    如何通过数据驱动业务发展
  • 人人都在谈的 “数据驱动” 到底是什么
    移动互联网技术的快速发展,移动终端的广泛普及,催生了大数据技术。今天,无论是个人的日常生活,还是企业的业务发展,都和数据密切相关,大数据技术正成为新发明、新产品和新服务的创新源泉。......
    人人都在谈的 “数据驱动” 到底是什么
  • 什么是数据驱动
    所谓“数据驱动”,就是企业内部运转的一个接一个的“数据循环”,通过数据分析和价值发现改善客户、产品、基础设施、盈利方式等核心环节,形成独特的竞争优势,最终实现整个企业乃至供应链的快速运......
    什么是数据驱动
  • 图的表示、深度广度遍历算法及其应用
    世间的一切对象都可化为节点;世间一切关系都可化为节点间的一条线;从而组成了如梦幻泡影的图。将来的环球必定是图的世界。......
    图的表示、深度广度遍历算法及其应用
  • 数据产品经理的进阶之路
    产品经理最开始之前考虑的更多是在核心竞争力上,那个时候可能用的更多是左上角。但是逐渐,可能会挪到右下角,作为产品,能否给公司挣到钱。也可能,是在中间,公司内部团队、对外合作公司,哪......
    数据产品经理的进阶之路
  • 数据中台到底是什么?
    数据中台到底是什么?具体包含哪些内容?跟大数据平台是什么关系?在架构层面是怎么体现的?数据中台跟产品又有什么关系?......
    数据中台到底是什么?
  • 工业互联网的实践路径
    工业互联网的应用价值体现在哪里?实际上要解决当前制造业面临的典型挑战,特别是来自市场的需求挑战和成本上涨的挑战,用两个词可以概括:敏捷和精益认识。工业互联网的价值是用互联网、大数据......
    工业互联网的实践路径
  • 大数据正在改变制造过程的三种方式
    供应链充满了不确定性。如果企业想减少可能的风险,并与零售商和客户建立良好的关系,则需要再次进行数据分析。在供应链中,大数据应用围绕着可追溯性、采购和仓储三个主要孤岛开展。......
    大数据正在改变制造过程的三种方式
  • 应对Hadoop集群数据疯长,这里祭出了4个治理对策!
    在目前规模比较大的互联网公司中,总数据量能达到10PB甚至几十PB数据量的公司,我认为中国已经有超过了20家了。而在这些公司中,也有很多家公司的日数据增长达到100TB+了。所以我们每天都要观察......
    应对Hadoop集群数据疯长,这里祭出了4个治理对策!
  • 实时数据平台设计:技术选型与应用场景适配模式
    本文我们则会推荐整体技术组件选型,对每个技术组件做出简单介绍,尤其对我们抽象并实现的四个技术平台(统一数据采集平台、统一流式处理平台、统一计算服务平台、统一数据可视化平台)着重介绍......
    实时数据平台设计:技术选型与应用场景适配模式
  • 一文详解大规模数据计算处理原理及操作重点
    大数据技术主要针对的是大规模数据的计算处理问题,那么要想解决的这一问题,首先要解决的就是大规模数据的存储问题。大规模数据存储要解决的核心问题有三个方面:......
    一文详解大规模数据计算处理原理及操作重点
  • 如何快速应用机器学习技术
    目前机器学习技术正在对世界各地的企业产生重大影响,但很多机构依然对在何时、何处最优的使用机器学习感到困惑。为了成功的运用这门技术,企业首先要明确,哪些问题最适合应用机器学习,并确保......
    如何快速应用机器学习技术
  • 产品指标体系如何搭建
    价指标体系是指由表征评价对象各方面特性及其相互联系的多个指标,所构成的具有内在结构的有机整体。”简单来说,就是将统计指标系统性的组织起来。指标体系是由指标和体系两部分组成。指标主要......
    产品指标体系如何搭建
  • 机器学习和统计模型的差异
    这确实是一个难以回答的问题。考虑到机器学习和统计模型解决问题的相似性,两者的区别似乎仅仅在于数据量和模型建立者的不同。......
    机器学习和统计模型的差异
  • 构建机器学习系统的经验教训
    数据科学家对优化算法和模型以进一步发掘数据价值的追求永无止境。在这个过程中他们不仅需要总结前人的经验教训,还需要有自己的理解与见地,虽然后者取决于人的灵动性,但是前者却是可以用语言......
    构建机器学习系统的经验教训
  • 机器学习建模问题中的特征构造方法
    在机器学习建模问题中,合适特征的构造对于模型的性能至关重要,看到很多同学介绍特征工程,包括特征的预处理和特征筛选等,这些非常重要,但是特征预处理和特征筛选的前提是要有基础特征,而这......
    机器学习建模问题中的特征构造方法
  • 机器学习项目失败的9个原因
    如果你问了错问题,你将会得到错误的答案。比如金融业中的欺诈识别问题,这个问题最初可能是“这个特定的交易是否存在欺诈”。为了确定这一问题,你将需要一个包含欺诈和非欺诈交易示例的数据集......
    机器学习项目失败的9个原因
  • 面向机器学习:数据平台的设计与搭建
    标准的机器学习工作流:针对业务上产生的具体问题,我们把它转化成数据问题,或者评估它能否用数据来解决。将数据导入并过滤后,我们需要将数据与业务问题和目标进行相关性分析,并根据具体情况......
    面向机器学习:数据平台的设计与搭建
  • 创建有效的大数据模型的技巧
    数据建模是一门复杂的科学,涉及组织企业的数据以适应业务流程的需求。它需要设计逻辑关系,以便数据可以相互关联,并支持业务。然后将逻辑设计转换成物理模型,该物理模型由存储数据的存储设备......
    创建有效的大数据模型的技巧
  • 机器学习教会我们的6个道理
    深度学习的巨大成功,揭示了从人类自身启发,并形成算法的巨大价值;相反,从机器学习中,我们有什么值得学习和启发的东西吗?......
    机器学习教会我们的6个道理
  • 数据科学家需要掌握的十大统计技术
    「数据科学家比程序员擅长统计,比统计学家擅长编程。」本文介绍了数据科学家需要掌握的十大统计技术,包括线性回归、分类、重采样、降维、无监督学习等。......
    数据科学家需要掌握的十大统计技术
  • 从数据埋点到AB测试
    要能做用户行为的分析,就需要有一套用户行为数据采集、传输、处理、分析的基础设施,而埋点和分析平台就是在做这件事。业界大多产品都是通过嵌入到多个终端的SDK来采集用户行为数据,而后续的......
    从数据埋点到AB测试
  • 创建有效的大数据模型的6个技巧
    数据建模是一门复杂的科学,涉及组织企业的数据以适应业务流程的需求。它需要设计逻辑关系,以便数据可以相互关联,并支持业务。然后将逻辑设计转换成物理模型,该物理模型由存储数据的存储设备......
    创建有效的大数据模型的6个技巧
  • 完整机器的学习项目的工作流程
    现在机器学习应用非常流行,了解机器学习项目的流程,能帮助我们更好的使用机器学习工具来处理实际问题。......
    完整机器的学习项目的工作流程
  • 腾讯QQ大数据:产品指标体系如何搭建
    14年接触到“指标体系”这个词,一脸懵逼,当时还停留在离散的报表需求阶段,不能明确说出什么就是指标体系。发展到现在,做了几个产品的数据工作,对指标体系概念以及规划方法有一定的积累,总......
    腾讯QQ大数据:产品指标体系如何搭建
  • 京东推荐系统架构揭秘:大数据时代下的智能化改造
    随着业务的快速发展以及移动互联网的到来,多屏(京东App、京东PC商城、M站、微信、手Q等)互通,推荐类型从传统的商品推荐,逐步扩展到其他类型的推荐,如活动、分类、优惠券、楼层、入口图、......
    京东推荐系统架构揭秘:大数据时代下的智能化改造
  • 大数据调整供应链系统的四种方式
    大数据是我们无法避免的流行语,但这是有充分的理由的:它正在改变很多企业的运营方式,并将继续改变,尤其是在供应链领域。......
    大数据调整供应链系统的四种方式
  • 基于Hadoop的数据分析平台搭建
    为了应对随着数据量的增长、数据处理性能的可扩展性,许多企业纷纷转向Hadoop平台来搭建数据分析平台。Hadoop平台具有分布式存储及并行计算的特性,因此可轻松扩展存储结点和计算结点,解决数据......
    基于Hadoop的数据分析平台搭建
  • 11 个 AI 和机器学习模型的开源框架
    过去十年中人工智能的飞速增长刺激了当今就业市场对AI和ML技能的巨大需求。从金融到医疗保健,现在几乎所有行业都在使用基于ML的技术。本文将介绍一系列可用于构建机器学习模型的最佳框架和库。......
    11 个 AI 和机器学习模型的开源框架
  • 推荐系统本质与网易严选实践
    企业怎样才能正确认识和利用推荐系统来拓展业务?本文对推荐的本质和实现思路进行了深入的探讨,并介绍了网易严选的推荐系统实践,让您充分领略个性化推荐的魅力。......
    推荐系统本质与网易严选实践
  • 如何从系统层面优化深度学习计算?
    深度学习在近几年里取得了巨大的进步,它已经或者是有望成功地被应用在我们许多生活场景中,比如自动驾驶、安防、翻译、医疗等等。可以说,计算机的计算和通信能力的大幅提升是促使深度学习成功......
    如何从系统层面优化深度学习计算?
  • 我们有那么多数据了 怎样才能变成钱?
    数据变现的能力,足以成为企业竞争优势的源泉。无论采用哪种途径,都需要实施组织变革。......
    我们有那么多数据了 怎样才能变成钱?
  • 如何有效地进行数据治理
    无论企业大小,在使用数据上都面临相似的数据挑战。企业越大,数据越多,而数据越多,越发需要制定一个有效的、正式的数据治理策略。......
    如何有效地进行数据治理
  • 企业构建大数据平台的痛点、思路与解决路径
    曾几何时,组织多半会选择以增量方式实现大数据解决方案。而并非每个分析和报告需求、大型数据集或来自多个数据源的临时报告执行并行处理的项目,都对大数据解决方案有着重要需求。......
    企业构建大数据平台的痛点、思路与解决路径
  • 常见推荐策略及其在OTA上的应用
    推荐系统是一种信息过滤系统,用于预测用户对物品的“评分”或“偏好”。个性化推荐已经在电商(Amazon,淘宝,京东等)、电影和视频(Youtube,Hulu,爱奇艺,腾讯视频)、个性化音乐(Spotify......
    常见推荐策略及其在OTA上的应用
  • 今日头条推荐算法原理全文详解
    平台出于内容生态和社会责任的考量,像低俗内容的打压,标题党、低质内容的打压,重要新闻的置顶、加权、强插,低级别账号内容降权都是算法本身无法完成,需要进一步对内容进行干预。......
    今日头条推荐算法原理全文详解
  • 基于Hadoop的大数据平台实施
    大数据平台架构设计沿袭了分层设计的思想,将平台所需提供的服务按照功能划分成不同的模块层次,每一模块层次只与上层或下层的模块层次进行交互(通过层次边界的接口),避免跨层的交互,这种设计......
    基于Hadoop的大数据平台实施