• 新IT运营模式的5大元素
    2017年CIO展望可以总结为三个字——数字化。明年,公司将使用下一代技术改造产品,渠道和运营。与此同时,过去几年IT完成的所有工作不会消失,因此,正如老话说的那样,边前进,边构建。......
    新IT运营模式的5大元素
  • 数据运营的6个步骤
    运营是一个包含了诸多琐碎事项的工作,运营人员要会拆分自己的工作项,并根据不同工作项的特点有针对地对特定的运营数据进行分析,才能事半功倍。......
    数据运营的6个步骤
  • 运营必须掌握的APP基础数据分析体系
    在互联网企业,任何一个APP都要事先规划好数据体系,才允许上线运营,有了数据才可以更好的科学运营。因此本文将为大家介绍APP的基础数据指标体系。......
    运营必须掌握的APP基础数据分析体系
  • 如何建立数据分析的思维框架
    <pstyle="margin-top:0px;margin-bottom:0.75em;line-height:1.7em;text-indent:1em;color:r......
    如何建立数据分析的思维框架
  • Kafka的安装
    ?每台机器都需要kafka先安装kafka到h15,其他2台机器安装一样的kafka,但是需要修改broker.id=?(保证?不和其他kafka机器重复)......
    Kafka的安装
  • 使用Kafka与Flume
    在CDH5.2及更高版本中,Flume包含Kafka源和sink。使用这些从Kafka到Hadoop或从任何Flume源到Kafka的流数据。......
    使用Kafka与Flume
  • java 调用hbase api创建hbase分区表
    Java调用Hbaseapi创建hbase分区表运行环境:idea16+jdk-1.7+hbase-cdh-1.2.0+cdh-5.8.0......
    java 调用hbase api创建hbase分区表
  • Hbase 基本API操作详解
    本文档参考最新(截止2014年7月16日)的官方RefGuide、DeveloperAPI编写。所有代码均基于“hbase0.96.2-hadoop2”版本编写,均实测通过......
    Hbase 基本API操作详解
  • 产品经理的‘’元需求“:如何提出对需求本身的需求?
    对于产品经理来讲,每天会和大量的各种需求打交道。有的来自不同用户,有的来自跨部门或管理层甚至老板。当面对这些需求时,我们如何高效、准确地把握和解决需求,提出对需求本身的需求,即“元......
    产品经理的‘’元需求“:如何提出对需求本身的需求?
  • 敏捷团队如何把控代码质量和准时交付
    随着大家对系统稳定性愈加重视,提高线上系统稳定,加强代码设计、编码等评审工作,成为京麦团队在本次迭代开展的一项重要工作。......
    敏捷团队如何把控代码质量和准时交付
  • 眺望2017:运维的风口在哪?
    相比开发领域,运维界的发展更显沉稳谨慎。在2016年,有一些值得运维人关注的动态:Apache虽然依然是全球范围内使用数量第一的Web服务器;但是Nginx的热度持续升高,......
    眺望2017:运维的风口在哪?
  • hadoop项目实战
    在远程服务器上的数据库中有两张表,user和order,现需要对表中的数据做分析,将分析后的结果再存到mysql中。两张表的结构如下图所示现需要分析每一天user和,oder......
    hadoop项目实战
  • Hadoop面试必须知道的那些事儿
    Hadoop,众所周知的ApacheHadoop,是一个开放源代码软件平台,用于大容量数据的可扩展和分布式计算。它提供对数字平台和企业内部生成的结构化和非结构化数据的快速,高性能......
    Hadoop面试必须知道的那些事儿
  • 大数据等最核心的关键技术:32个算法
    参与者大多数是计算机科学家,他请这些科学家投票选出最重要的算法,以下是这次调查的结果,按照英文名称字母顺序排序。......
    大数据等最核心的关键技术:32个算法
  • 为什么你的社交产品死了
    你知道一款好的社交产品需要具备哪些特点吗?很多人都跟风做社交类产品,但真正能成功的又有几家呢?......
    为什么你的社交产品死了
  • 想为平台引来种子用户?先教你最有效的三个招数
    从历史上看,增长最快、最具颠覆意义的公司都有一个共同点,那就是它们并没有把精力放在出售商品上,而是集中精力打造自己的平台,比如谷歌、eBay等。......
    想为平台引来种子用户?先教你最有效的三个招数
  • 初识Hadoop
    Hadoop天生就是来解决数据吞吐量太大的,它可以使大数据的存储和处理变的快速、使得应用程序运行的更加的轻盈。......
    初识Hadoop
  • HIVE教程
    Hive是对于数据仓库进行管理和分析的工具。但是不要被“数据仓库”这个词所吓倒,数据仓库是很复杂的东西,但是如果你会SQL,就会发现Hive是那么的简单,简单到甚至不用学就可以使用......
    HIVE教程
  • Hive安装部署
    Hive是对于数据仓库进行管理和分析的工具。但是不要被“数据仓库”这个词所吓倒,数据仓库是很复杂的东西,但是如果你会SQL,就会发现Hive是那么的简单......
    Hive安装部署
  • Hive技术架构
    Facebook为了解决海量日志数据的分析而开发了Hive,Hive是一种用SQL语句来读写、管理存储在分布式存储设备上的大数据集的数据仓库框架。......
    Hive技术架构
  • 利用大数据技术实现日志记录与分析
    记录日志采用UDP协议写入大数据平台,大数据平台采用Hive表来存储日志信息。写入日志的工作,封装了一个Auto.Lib3.Dealer.Log.dll,这个dll要依赖ZooKe......
    利用大数据技术实现日志记录与分析
  • 追求环保高效的数据中心的5大策略
    这五大策略中,我认为第一点的“高度的重视”策略使所有其他的策略在某种程度上可能给我的读者们带来了一个稍老想法的新形式。......
    追求环保高效的数据中心的5大策略
  • 2017年值得关注的数据中心趋势预测
    2017年,在云服务和数据中心业界将会发生什么样的变化?在本文中,我们专程就该话题采访了业内专家LarsStrong、IanSeaton、BruceTaylor和Vince......
    2017年值得关注的数据中心趋势预测
  • 腾讯Hermes实时检索大数据平台介绍
    实时检索分析平台(Hermes),旨在为公司大数据分析业务提供一套实时的、多维的、交互式的查询、统计、分析系统,......
    腾讯Hermes实时检索大数据平台介绍
  • 数字化时代的传统IT转型
    刚刚过去的2016,云计算正在落地,大数据正在应用,移动化改变沟通型态,区块链离我们愈近,而IOT却把我们都包含其中。新IT大潮来袭,传统IT如何应对?......
    数字化时代的传统IT转型
  • Kafka 在行动:7步实现从RDBMS到Hadoop的实时流传输
    Kafka是什么?它是一个分布式,可扩展的可靠消息系统,把采取发布-订阅模型的应用程序/数据流融为一体。这是Hadoop的技术堆栈中的关键部分,支持实时数据分析或物联网数据货币......
    Kafka 在行动:7步实现从RDBMS到Hadoop的实时流传输
  • 服务中间件Dubbo的来历
    随着互联网的发展,网站应用的规模不断扩大,常规的垂直应用架构已无法应对,分布式服务架构以及流动计算架构势在必行,需要一个治理系统确保架构有条不紊的演进。......
    服务中间件Dubbo的来历
  • 运维自动化闭环,腾讯是这样做的
    实现运维自动化闭环,最主要就是配置管理、状态管理和变更管理能力。治大国如烹小虾,我们来类比餐厅老板,看如何实现炒菜的自动化......
    运维自动化闭环,腾讯是这样做的
  • 智能化运维最佳实践-自动化
    伴随着互联网以及大数据时代的到来,IT信息系统已经成为最重要的数据载体和信息来源,IT系统在企业内部的重要性日益突出......
    智能化运维最佳实践-自动化
  • 大数据时代,又如何向身边的人解释什么是商业智能 BI?
    站在一个比较专业的角度来看,这些解释肯定不太严谨或者本身的理解就是错误的,比如前面所提到“大数据就是数据大”的情况。......
    大数据时代,又如何向身边的人解释什么是商业智能 BI?
  • Hadoop实战演练:搜索数据分析----数据去重 (1)
    用户ID是根据用户使用浏览器访问搜索引擎时的Cookie信息自动赋值,即同一次使用浏览器输入的不同查询对应同一个用户ID......
    Hadoop实战演练:搜索数据分析----数据去重 (1)
  • 老牌企业的突破式创新
    在行动敏捷、来势汹汹的初创企业面前,老牌公司发现自己正被逼得节节败退。对于老牌公司来说,击败竞争者意味着必须卓有成效地执行。而有效执行则意味着渐进式创新,以求略胜竞争对手一筹。......
    老牌企业的突破式创新
  • 你应该知道的Hadoop历史
    Hadoop是一个开源框架,可以存储巨量数据,同时通过相互关联电脑所组成的分布式网络,运行关联程序以完成大数据任务。......
    你应该知道的Hadoop历史
  • 成功实施DevOps的七个有力工具
    DevOps本身不是开发工具,而是开发文化的一次革新,为了能够成功地实施DevOps,需要借助一些工具。PavanBelagatti列出了7个强有力的工具可以帮助企业成......
    成功实施DevOps的七个有力工具
  • storm+kafka集成简单应用
    基本场景是应用出现错误,发送日志到kafka的某个topic,storm订阅该topic,然后进行后续处理。场景非常简单......
    storm+kafka集成简单应用
  • Kafka快速上手
    Kafka是一个分布式的数据流平台,常用来作为消息传送中间件。本篇介绍Kafka的使用方法,以Linux系统为例(windows系统只需将下面的命令"bin/"都改为"bin......
    Kafka快速上手
  • MapReduce工作原理图文详解
    合并的过程中会产生许多的中间文件(写入磁盘了),但MapReduce会让写入磁盘的数据尽可能地少,并且最后一次合并的结果并没有写入磁盘,而是直接输入到reduce函数。......
    MapReduce工作原理图文详解
  • 敏捷测试过程的度量标准
    大多数习惯传统阶段性开发模式的测试人员也习惯了制定和使用度量数据、在正式的缺陷跟踪系统中记录缺陷、编写详细的测试计划。这些人在敏捷开发中应该何去何从?......
    敏捷测试过程的度量标准
  • 步步经心:项目经理的角色扮演
    作为项目经理,当遇到强势管理者或者恃才傲物的技术人员(换言之就是拒你千里之外的脸),但又需要施加影响时,最重要的不是推销自己的想法,而是努力解读对方的想法......
    步步经心:项目经理的角色扮演
  • 从用户、商业、项目角度理解产品信息结构
    每接触一些新事物、新概念、新理论、新技能时,我们总会提出这样一个问题:要怎么开始呢?或是怎么样才能入门呢......
    从用户、商业、项目角度理解产品信息结构
  • 京东内部的敏捷项目管理模型
    对现在的互联网产品设计来说,尤其是对创业公司,是一个快速开发、快速验证的时代。团队工作方式如何应付快速开发和调整的节奏?......
    京东内部的敏捷项目管理模型
  • 产品经理最应该拥有的6个品质
    产品岗没有对口的专业,如果非要算,计算机、通信、工业设计勉勉强强算靠边的专业。那么,如何判断一个完全没有经验的人有成为PD大神的潜力呢?......
    产品经理最应该拥有的6个品质
  • Facebook的数据中心是如何提供支持的?
    Facebook的服务即将变得越来越复杂,需要消耗越来越多的电力。社交巨头必须为这样的未来做好准备。现在,它的数据中心电源使用效率已经达到了1.06—1.08的水平......
    Facebook的数据中心是如何提供支持的?
  • hive的查询注意事项以及优化总结
    Hive是将符合SQL语法的字符串解析生成可以在Hadoop上执行的MapReduce的工具。使用Hive尽量按照分布式计算的一些特点来设计sql,和传统关系型数据库有区别,......
    hive的查询注意事项以及优化总结
  • 腾讯是如何培养产品经理的
    腾讯真正强大的地方在哪里?腾讯人为何不谈产品和功能?腾讯的职级分层有哪四层?腾讯产品经理相关的21项能力分别是哪些?......
    腾讯是如何培养产品经理的
  • BYOD正在改变企业的移动管理方式
    移动应用正在深刻地改变着企业管理移动设备的方式。如今,企业的重点不再是如何保障设备自身的安全,而是保障设备上的应用程序的安全。......
    BYOD正在改变企业的移动管理方式
  • 互联网产品设计阶段的工作流程
    关于互联网产品设计阶段的工作流程,近几年好像有了一个标准的模式,大家都按照这么一个大概的流程来工作,又好像没有标准,每个团队又不尽相同,有的简单粗暴,有的复杂细致。......
    互联网产品设计阶段的工作流程
  • Hive vs. HBase的区别
    对于刚接触大数据的用户来说,要想区分Hive与HBase是有一定难度的。本文将尝试从其各自的定义、特点、限制、应用场景等角度来进行分析,以作抛砖引玉之用。......
    Hive vs. HBase的区别
  • 利用Sqoop把SqlServer数据库中的表导入导出到HDFS
    Sqoop是一个开源的工具,它允许用户将数据从关系型数据库抽取到Hadoop中,用于进一步的处理。抽取出来的数据可以被Mapreduce程序使用......
    利用Sqoop把SqlServer数据库中的表导入导出到HDFS
  • Hadoop 设置任务执行的队列以及优先级
    Hadoopjarapp.jar-Dmapreduce.job.queuename=root.etl.distcp-Dmapreduce.job.priority=HI......
    Hadoop 设置任务执行的队列以及优先级
  • zookeeper到底是个什么鬼
    高效的分布式协调服务(一处配置全局生效)。包括配置服务、命名服务(类似于DNS)、分布式锁、集群管理......
    zookeeper到底是个什么鬼
  • Hadoop 的常用组件一览
    ApacheHadoop项目有两个核心组件,被称为Hadoop分布式文件系统(HadoopDistributedFileSystem,HDFS)的文件存储,以及......
    Hadoop 的常用组件一览
  • hadoop框架详细分析
    apreduce是一种模式,一种什么模式呢?一种云计算的核心计算模式,一种分布式运算技术,也是简化的分布式编程模式,它主要用于解决问题的程序开发模型,也是开发人员拆解问题的方法。......
    hadoop框架详细分析
  • hive空值判断
    ''与length(xx)=0''表示的是字段不为null且为空字符串,此时用aisnull是无法查询这种值的,必须通过a=''或者length(a)=0查......
    hive空值判断
  • Gartner:移动设备应用于工作场所尚不成熟
    尽管80%的受访员工都拥有一台或多台公司配备的设备,但台式电脑依然在企业内大行其道,其中过半员工均在使用企业配备的台式电脑。......
    Gartner:移动设备应用于工作场所尚不成熟
  • 2017年亚太地区数据中心10大预测
    在企业机构进行数字化转型的过程中,他们底层的云和数据中心基础设施必须以相同的速度、并行地发展成熟。否则,业务线和IT部门就会步调不一致。这将导致两个部门关系进展,裂缝变大。......
    2017年亚太地区数据中心10大预测
  • 丰田模式那么苛刻 为什么反而更能激发创新?
    正如精益生产研究者杰弗瑞·莱克所言:“就像一艘船航行于充满危险礁石的海域,只要礁石(问题)被海水覆盖,就能顺利航行;可是,一旦海平面降低,船可能很快会撞上礁石而损坏或颠覆。”......
    丰田模式那么苛刻 为什么反而更能激发创新?
  • 产品经理应如何避免陷入产品死亡循环陷阱
    精益创业的方法论被很多人奉为圭臬,产品快速推出,根据用户需求快速迭代。这个方法论在早期创业起到很重要的指导作用。但这里也有陷阱。......
    产品经理应如何避免陷入产品死亡循环陷阱
  • 创新要坚守底线和目标
    腾讯注意到人们对微信提出了四个“能不能”:能不能让有价值的信息传递更高效?能不能让社交网络更有温度?能不能让社会资源配置更迅捷?能不能让社群鸿沟更加弥合?......
    创新要坚守底线和目标
  • hive中的时间处理函数
    hive中的时间处理函数......
    hive中的时间处理函数