首页  ·  知识库 ·  大数据
企业最需要什么样的数据科学家?
网友  界面  2019-6-10 13:47:00 实践应用  编辑:Estelle   图片来源:网络
不同时期企业对数据科学家的要求,与数据产品通才不同,采用一刀切的方法招聘数据科学家是行不通的。

今天,各行各业的数字化程度都在不断加深,数据的价值越来越凸显,而那些最懂数据的人——数据科学家,在一个数据型企业中的关键作用更是不言而喻。

  • 数据科学家有哪些类型?都有什么技能?

  • 你的企业现阶段最需要什么样的数据科学家?

  • 应该如何面试数据科学家?

作为数据型企业的领导者,如果不能回答出上面这三个问题,说明你需要重新审视自己的数据团队了。不同类型的数据科学家所需技能也各不相同,在招聘数据科学家时,用一刀切的方法行不通,管理者必须考虑数据组织的规模、成熟度、产品团队的需求,以及数据科学家将解决的问题,才可能招聘到最适合自己的数据科学家。

-------------

随着数据价值的不断增加和数据使用的标准化,多种与数据相关的职业随之出现,包括数据分析师、数据工程师、数据基础设施工程师、数据架构师和数据科学家。他们在不同领域和不同规模的数据组织里,有很大不同。

在为相关部门招聘新员工时,你必须仔细考虑他们应该具备哪些技能,各种角色分工的比例,以及这些不同的角色之间如何互相协作。本文把关注的重点放在数据科学分析。

不同类型

数据科学家的类型有多种:

  • 早期产品分析师——确定一个新产品是否适合市场

  • 增长分析师——调整指标

  • 核心市场分析师——确保平台上数据流动健康

  • 生态系统分析师——识别竞争威胁和战略机遇

  • 机器学习分析师——确保支撑产品的算法健康运行

  • 产品通才——解决你可能遇见的产品的通用问题

早期数据科学家的技能与产品通才不同,因此采用一刀切的方法招聘数据科学家是行不通的。你必须考虑数据组织的规模和成熟度、产品团队的需求,以及数据科学家将解决的相关问题。例如,在早期阶段,雇佣专门从事PB级数据(企业存储空间达到100万GB)的数据工程师可能没有什么价值,但随着产品应用量的增加,他们的价值会越来越大。

所需技能

数据科学家要么是应届毕业生,要么是经验丰富的专业人士,如何把他们结合起来解决各种各样的问题非常重要。一般来说,这些人提供了三种类型的技能——科学的严谨性、咨询顾问思维和应用于以下不同维度的编程能力。

  • 问题构建。数据科学家必须能够构思和构造问题,这通常需要他们具有咨询顾问思维以及科学的方法来解决问题。

  • 技术能力。提取数据需要编程和科学技能。

  • 分析能力。数据科学家需要分析技能来提取和操作数据集,并从表格、图表等形式的数据中提取数值。要理解这些数据,顾问思维和科学解决问题的方法必不可少。

  • 综合能力。数据科学家需要对结果进行解释、简化和综合,顾问思维对于简化和形成结论非常重要。

  • 影响力。通过讲故事来影响决策是让数据科学家创造影响力的重要方式。使用数据来影响他人需要一种咨询顾问思维。

招聘经验丰富的专业人士还是应届毕业生,取决于组织的成熟度和团队的平衡需求,但类型单一是不明智的。

如何招聘?

在考虑招聘数据科学人才时,需要注意的是,整个数据领域还处于起步阶段,因此很难找到在其职业生涯之初或与你共事之初就具备所有这些技能的人。高质量的数据科学家将与你的组织一起成长,随着公司的发展,他们也将获得所需的技能,并成为经验丰富的专业人士。

一个好的招聘过程应该以评估所需要的技能为导向。对于通才来说,面试过程应该包含两个分析案例、一次编程测试、一个应用分析和一场关于科学与定量能力的面试。

1 . 两个分析案例

这是面试中最重要的部分,如果候选人没过关,就不应该得到录用。因此,用两场面试来测试候选人这一技能是很有价值的。

  • 问题构建——你能通过构建问题来找到业务难题的解决之道吗?

  • 沟通和清晰度——在你的思维过程中,是否富有创造力并善于沟通,且表达清晰?

  • 原始数据分析能力——你能分析问题吗?

  • 产品思维——你能为产品提供建议吗?

  • 产品的成功与健康——你能定义产品是否成功,并分析产品是否健康,以识别问题吗?

2. 编程

如果编程能力弱,你会花费80%的时间提取数据、20%的时间分析数据,但正确的做法正好相反。  

  • 简单的数据获取——你能编写简单的程序来获取数据吗?

  • 复杂数据获取——你能连接不同的数据集来获取复杂数据集吗?

3. 应用分析

评估候选人是否能够从头到尾地解决实际问题非常有用。候选人需要制定问题、获取和操作数据并进行汇总。

  • 问题构建——你能通过构建问题来找到业务难题的解决之道吗?

  • 获取——你能够编写简单的查询程序来获取数据吗?

  • 掌控——你能够基于业务问题掌控数据吗?

  • 汇总——你能将结果说得简单易懂并提供清晰的信息吗?

4. 科学与定量能力

这次面试对了解候选人的科学与定量能力很有价值。 

  • 定量——候选人是否具有基本的定量能力,尤其是在数学方面?

  • 统计学——候选人是否有很强的技能,能够根据统计学做出正确的决策?

  • 科学性——候选人是否具备分析复杂数据的科学技能?这并不需要测试,但从候选人的简历中就可以看出来。

需要特定面试的职位

机器学习分析师

通才的面试和机器学习分析师的面试最大的区别在于,后者需要具备更强的技术能力和科学能力。

  • 分析案例——与通才相同;

  • 机器学习分析案例——与通才一样,但问题应该具体到对输出进行根因分析;

  • 科学与定量能力——与通才一样,但候选人需要更强的机器学习概念和统计能力;

  • 编程——与通才一样,但候选人需要更强的编程能力。

高级人才

高级人才除了需要拥有执行战略的能力,还应该具备领导能力。

  • 两个分析案例——与通才相同;

  • 编程——与通才相同;

  • 应用分析——与通才相同;

  • 领导力和策略——候选人是否能够利用数据驱动并影响策略?

市场分析师

对通才和市场分析师的面试最大的区别在于,后者需要更好地理解经济学并具有大局思维。因此面试中的分析案例应该调整为与市场相关。

生态系统分析师

生态系统分析师通过分析市场趋势和帮助产品领导者了解其产品的市场环境,从而为领导者发展业务和制定产品策略提供支持。面试应该包括:

  • 分析案例——与通才相同;

  • 科学与定量能力——与通才相同;

  • 领导力和策略——候选人是否能够利用数据驱动并影响策略?

  • 演示——候选人应该演示为产品构建的业务案例,并评估其对问题的提出、汇总和影响的看法。

集中式VS分散式

集中式意味着所有的分析师都在一个部门,而分散式意味着分析师分布在整个团队中。一般来说,两者都有优点,这主要取决于组织的规模、成熟度、潜在增长量和领导的能力。理想情况下,组织结构应该是最大限度地发挥两者影响,并提升企业文化。   

规模

在公司成立初期,公司人员很少,集中还是分散的问题无关紧要。随着公司的发展,集中式可能更好,因为人们可以处理公司内的多个问题,并且能够集中看法、分享知识和进行规模化分析。当分析团队达到10人或更多时,就应该采用二者组合的模式,将分析人员安排到产品团队中,但仍是分析部门的一部分。当团队变得更大,比如50人时,最好将主要的权力下放,比如下放到3个领导者手中。集中式分析服务更有助于招聘、分配人员到团队、成员的职业发展、培训和绩效评估,以及建立强大的职业认同感。    

成熟度

组织的成熟度是另一个非常重要的标准。如果因为人员和组织的成熟度不够,数据分析无法产生其应该具有的最大效果,那么在较长一段时间内保持集中是明智的选择。

领导能力

即使随着规模和成熟度的增加,如果团队里的高级人员没有足够的资历,分析团队也很难规模化。我们的建议是继续集中管理,直到该小组有足够数量的领导人为止。

其他注意事项

评估数据科学家的比例

我们的目标应该是用最少的数据科学家来解决最多的问题。因此,应该在聘用更多的数据工程师和数据基础设施人员上进行投资,以帮助扩展数据组织。

制定职业发展框架

数据科学家的职业发展机会非常重要。领导者需要为管理者和个人的职业发展制定一个框架。

招聘职位名称

尽管“数据科学家”这个头衔被滥用,但实际上正是这类职位的头衔,使许多实力强大的候选人也许不会对其他头衔感兴趣。

提前招人

尽可能提前,因为招募一名高效的数据科学家,整个流程要花上好几个月的时间。  

利用数据科学训练营培养入门级人才

许多机构和训练营的存在是为了把极具天赋的学者培养成入门级的数据科学家。这些项目可以是优秀人才的来源,但这需要成熟的领导者、指导人和一个健全的团队结构,才会富有成效。

不要只看头衔的表面价值

以技能为基础的面试、背景调查和对以往经验的深入了解对评估候选人尤为重要。

候选人最好能有多个领域的工作经验

一个强大的数据科学家应该能够将技能和才能从一个领域应用到另一个领域。

博士学位被高估了

虽然许多数据科学家拥有高级学位和研究经验,但在大多数情况下,这并不是胜任工作的充分条件。 

不要限定技术知识的范围

这是一个新兴领域,该技术在相对较短的时间内变化巨大,不要过于限定范围。

三个谬见

谬见一:数据科学家是数据迷。

科学家未能充分发挥其潜力的一个主要原因是,他们被视为向利益相关者交付数据的服务组织。为了最大化数据科学家的价值,我们可以将他们安排到产品团队中,确保他们在做出重大决策时拥有一席之地,并让他们参与到整个产品的开发过程中。

谬见二:所有数据科学家都研究机器学习。

虽然算法开发人员专注于机器学习,但产品分析人员在很大程度上是问题解决者,他们可能会使用机器学习作为发现问题的工具。帮助设计和进行实验的数据科学家就有优秀的统计能力,但不一定擅长机器学习。

谬见三:数据知情的方法总是优于数据驱动的方法。

所需的方法完全取决于你要解决问题的类型。如果你想要驱动产品的目标、路线图和策略,那么你应该主要使用数据知情的方法。但是,如果你想为生产系统提供动力,就需要使用数据驱动的方法。

数据科学家想要让产品经理开心的话,就要以牺牲诚实为代价。而数据科学家是寻求真理的人,他们只能对每个人都坦诚相待,才能最好地支持产品。数据科学家应该被充分授权指出问题,即使这意味着说出一些产品经理不想听的话——而一个好的产品经理会欣然接受。


CIO之家 www.ciozj.com 微信公众号:imciow
    >>频道首页  >>网站首页   纠错  >>投诉
版权声明:CIO之家尊重行业规范,每篇文章都注明有明确的作者和来源;CIO之家的原创文章,请转载时务必注明文章作者和来源;
延伸阅读
也许感兴趣的
我们推荐的
主题最新
看看其它的