最具影响力的数字化技术在线社区

168大数据

 找回密码
 立即注册

QQ登录

只需一步,快速开始

1 2 3 4 5
打印 上一主题 下一主题
开启左侧

怎么招聘数据科学家?看这一篇就够了

[复制链接]
跳转到指定楼层
楼主
发表于 2019-6-5 16:32:17 | 只看该作者 回帖奖励 |倒序浏览 |阅读模式

马上注册,结交更多数据大咖,获取更多知识干货,轻松玩转大数据

您需要 登录 才可以下载或查看,没有帐号?立即注册

x
今天,各行各业的数字化程度都在不断加深,数据的价值越来越凸显,而那些最懂数据的人——数据科学家,在一个数据型企业中的关键作用更是不言而喻。
●数据科学家有哪些类型?都有什么技能?
●你的企业现阶段最需要什么样的数据科学家?
●应该如何面试数据科学家?
作为数据型企业的领导者,如果不能回答出上面这三个问题,说明你需要重新审视自己的数据团队了。不同类型的数据科学家所需技能也各不相同,在招聘数据科学家时,用一刀切的方法行不通,管理者必须考虑数据组织的规模、成熟度、产品团队的需求,以及数据科学家将解决的问题,才可能招聘到最适合自己的数据科学家。本文研究成果来自红杉美国数据科学团队。
随着数据价值的不断增加和数据使用的标准化,多种与数据相关的职业随之出现,包括数据分析师、数据工程师、数据基础设施工程师、数据架构师和数据科学家。他们在不同领域和不同规模的数据组织里,有很大的不同,(见下表)。
在为相关部门招聘新员工时,你必须仔细考虑他们应该具备哪些技能,各种角色分工的比例,以及这些不同的角色之间如何互相协作。本文把关注的重点放在数据科学分析。
不同类型
数据科学家的类型有多种:
▨早期产品分析师——确定一个新产品是否适合市场
▨增长分析师——调整指标
▨核心市场分析师——确保平台上数据流动健康
▨生态系统分析师——识别竞争威胁和战略机遇
▨ 机器学习分析师——确保支撑产品的算法健康运行
▨产品通才——解决你可能遇见的产品的通用问题
早期数据科学家的技能与产品通才不同,因此采用一刀切的方法招聘数据科学家是行不通的。你必须考虑数据组织的规模和成熟度、产品团队的需求,以及数据科学家将解决的相关问题。例如,在早期阶段,雇佣专门从事PB级数据(企业存储空间达到100万GB)的数据工程师可能没有什么价值,但随着产品应用量的增加,他们的价值会越来越大。
所需技能
数据科学家要么是应届毕业生,要么是经验丰富的专业人士,如何把他们结合起来解决各种各样的问题非常重要。一般来说,这些人提供了三种类型的技能——科学的严谨性、咨询顾问思维和应用于以下不同维度的编程能力。
▨问题构建
数据科学家必须能够构思和构造问题,这通常需要他们具有咨询顾问思维以及科学的方法来解决问题。
▨技术能力
提取数据需要编程和科学技能。
▨分析能力
数据科学家需要分析技能来提取和操作数据集,并从表格、图表等形式的数据中提取数值。要理解这些数据,顾问思维和科学解决问题的方法必不可少。
▨综合能力
数据科学家需要对结果进行解释、简化和综合,顾问思维对于简化和形成结论非常重要。
▨影响力
通过讲故事来影响决策是让数据科学家创造影响力的重要方式。使用数据来影响他人需要一种咨询顾问思维。
招聘经验丰富的专业人士还是应届毕业生,取决于组织的成熟度和团队的平衡需求,但类型单一是不明智的。
如何招聘?
在考虑招聘数据科学人才时,需要注意的是,整个数据领域还处于起步阶段,因此很难找到在其职业生涯之初或与你共事之初就具备所有这些技能的人。高质量的数据科学家将与你的组织一起成长,随着公司的发展,他们也将获得所需的技能,并成为经验丰富的专业人士。
一个好的招聘过程应该以评估所需要的技能为导向。对于通才来说,面试过程应该包含两个分析案例、一次编程测试、一个应用分析和一场关于科学与定量能力的面试。
1 . 两个分析案例
这是面试中最重要的部分,如果候选人没过关,就不应该得到录用。因此,用两场面试来测试候选人这一技能是很有价值的。
▨问题构建——你能通过构建问题来找到业务难题的解决之道吗?
▨沟通和清晰度——在你的思维过程中,是否富有创造力并善于沟通,且表达清晰?
▨原始数据分析能力——你能分析问题吗?
▨产品思维——你能为产品提供建议吗?
▨ 产品的成功与健康——你能定义产品是否成功,并分析产品是否健康,以识别问题吗?
2. 编程
如果编程能力弱,你会花费80%的时间提取数据、20%的时间分析数据,但正确的做法正好相反。  
▨ 简单的数据获取——你能编写简单的程序来获取数据吗?
▨复杂数据获取——你能连接不同的数据集来获取复杂数据集吗?
3. 应用分析
评估候选人是否能够从头到尾地解决实际问题非常有用。候选人需要制定问题、获取和操作数据并进行汇总。
▨问题构建——你能通过构建问题来找到业务难题的解决之道吗?
▨获取——你能够编写简单的查询程序来获取数据吗?
▨掌控——你能够基于业务问题掌控数据吗?
▨汇总——你能将结果说得简单易懂并提供清晰的信息吗?
4. 科学与定量能力
这次面试对了解候选人的科学与定量能力很有价值。
▨定量——候选人是否具有基本的定量能力,尤其是在数学方面?
▨统计学——候选人是否有很强的技能,能够根据统计学做出正确的决策?
▨科学性——候选人是否具备分析复杂数据的科学技能?这并不需要测试,但从候选人的简历中就可以看出来。
需要特定面试的职位
机器学习分析师
通才的面试和机器学习分析师的面试最大的区别在于,后者需要具备更强的技术能力和科学能力。
▨ 分析案例——与通才相同;
▨机器学习分析案例——与通才一样,但问题应该具体到对输出进行根因分析;
▨ 科学与定量能力——与通才一样,但候选人需要更强的机器学习概念和统计能力;
▨编程——与通才一样,但候选人需要更强的编程能力。
高级人才
高级人才除了需要拥有执行战略的能力,还应该具备领导能力。
▨ 两个分析案例——与通才相同;
▨编程——与通才相同;
▨应用分析——与通才相同;
▨领导力和策略——候选人是否能够利用数据驱动并影响策略?
市场分析师
对通才和市场分析师的面试最大的区别在于,后者需要更好地理解经济学并具有大局思维。因此面试中的分析案例应该调整为与市场相关。
生态系统分析师
生态系统分析师通过分析市场趋势和帮助产品领导者了解其产品的市场环境,从而为领导者发展业务和制定产品策略提供支持。面试应该包括:
▨分析案例——与通才相同;
▨ 科学与定量能力——与通才相同;
▨ 领导力和策略——候选人是否能够利用数据驱动并影响策略?
▨ 演示——候选人应该演示为产品构建的业务案例,并评估其对问题的提出、汇总和影响的看法。
集中式VS分散式
集中式意味着所有的分析师都在一个部门,而分散式意味着分析师分布在整个团队中。一般来说,两者都有优点,这主要取决于组织的规模、成熟度、潜在增长量和领导的能力。理想情况下,组织结构应该是最大限度地发挥两者影响,并提升企业文化。   
▨规模
在公司成立初期,公司人员很少,集中还是分散的问题无关紧要。随着公司的发展,集中式可能更好,因为人们可以处理公司内的多个问题,并且能够集中看法、分享知识和进行规模化分析。当分析团队达到10人或更多时,就应该采用二者组合的模式,将分析人员安排到产品团队中,但仍是分析部门的一部分。当团队变得更大,比如50人时,最好将主要的权力下放,比如下放到3个领导者手中。集中式分析服务更有助于招聘、分配人员到团队、成员的职业发展、培训和绩效评估,以及建立强大的职业认同感。    
▨成熟度
组织的成熟度是另一个非常重要的标准。如果因为人员和组织的成熟度不够,数据分析无法产生其应该具有的最大效果,那么在较长一段时间内保持集中是明智的选择。
▨领导能力
即使随着规模和成熟度的增加,如果团队里的高级人员没有足够的资历,分析团队也很难规模化。我们的建议是继续集中管理,直到该小组有足够数量的领导人为止。
其他招聘注意事项
▨评估数据科学家的比例
我们的目标应该是用最少的数据科学家来解决最多的问题。因此,应该在聘用更多的数据工程师和数据基础设施人员上进行投资,以帮助扩展数据组织。
▨制定职业发展框架
数据科学家的职业发展机会非常重要。领导者需要为管理者和个人的职业发展制定一个框架。
▨招聘职位名称
尽管“数据科学家”这个头衔被滥用,但它实际上正是这类职位的头衔,许多实力强大的候选人也许不会对其他头衔感兴趣。
▨提前招人
尽可能提前,因为招募一名高效的数据科学家,整个流程要花上好几个月的时间。  
▨利用数据科学训练营培养入门级人才
许多机构和训练营的存在是为了把极具天赋的学者培养成入门级的数据科学家。这些项目可以是优秀人才的来源,但这需要成熟的领导者、指导人和一个健全的团队结构,才会富有成效。
▨ 不要只看头衔的表面价值
以技能为基础的面试、背景调查和对以往经验的深入了解对评估候选人尤为重要。
▨候选人最好能有多个领域的工作经验
一个强大的数据科学家应该能够将技能和才能从一个领域应用到另一个领域。
▨ 博士学位被高估了
虽然许多数据科学家拥有高级学位和研究经验,但在大多数情况下,这并不是胜任工作的充分条件。 
▨ 不要限定技术知识的范围
这是一个新兴领域,该技术在相对较短的时间内变化巨大,不要过于限定范围。
三个谬见
▨数据科学家是数据迷。
科学家未能充分发挥其潜力的一个主要原因是,他们被视为向利益相关者交付数据的服务组织。为了要最大化数据科学家的价值,我们可以将他们安排到产品团队中,确保他们在做出重大决策时拥有一席之地,并让他们参与到整个产品的开发过程中。
▨所有数据科学家都研究机器学习。
虽然算法开发人员专注于机器学习,但产品分析人员在很大程度上是问题解决者,他们可能会使用机器学习作为发现问题的工具。帮助设计和进行实验的数据科学家就有优秀的统计能力,但不一定擅长机器学习。
▨ 数据知情的方法总是优于数据驱动的方法。
所需的方法完全取决于你要解决问题的类型。如果你想要驱动产品的目标、路线图和策略,那么你应该主要使用数据知情的方法。但是,如果你想为生产系统提供动力,就需要使用数据驱动的方法。
数据科学家想要让产品经理开心的话,就要以牺牲诚实为代价。而数据科学家是寻求真理的人,他们只能通过对每个人都坦诚相待,才能最好地支持产品。数据科学家应该被充分授权指出问题,即使这意味着说出一些产品经理不想听的话——而一个好的产品经理会欣然接受。
来源:红杉汇
楼主热帖
分享到:  QQ好友和群QQ好友和群 QQ空间QQ空间 腾讯微博腾讯微博 腾讯朋友腾讯朋友
收藏收藏 转播转播 分享分享 分享淘帖 赞 踩

168大数据 - 论坛版权1.本主题所有言论和图片纯属网友个人见解,与本站立场无关
2.本站所有主题由网友自行投稿发布。若为首发或独家,该帖子作者与168大数据享有帖子相关版权。
3.其他单位或个人使用、转载或引用本文时必须同时征得该帖子作者和168大数据的同意,并添加本文出处。
4.本站所收集的部分公开资料来源于网络,转载目的在于传递价值及用于交流学习,并不代表本站赞同其观点和对其真实性负责,也不构成任何其他建议。
5.任何通过此网页连接而得到的资讯、产品及服务,本站概不负责,亦不负任何法律责任。
6.本站遵循行业规范,任何转载的稿件都会明确标注作者和来源,若标注有误或遗漏而侵犯到任何版权问题,请尽快告知,本站将及时删除。
7.168大数据管理员和版主有权不事先通知发贴者而删除本文。

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

关闭

站长推荐上一条 /1 下一条

关于我们|小黑屋|Archiver|168大数据 ( 京ICP备14035423号|申请友情链接

GMT+8, 2024-5-18 22:09

Powered by BI168大数据社区

© 2012-2014 168大数据

快速回复 返回顶部 返回列表