168大数据

标题: CMU-CS硕士北美码农求职数据科学家,已拿到Apple Offer [打印本页]

作者: 乔帮主    时间: 2015-2-3 20:51
标题: CMU-CS硕士北美码农求职数据科学家,已拿到Apple Offer

拒了另一个Offer,工作彻底也定了,考虑到还有同学正在找工作,先简单地写一点东西,希望对正在北美找工作的同学有帮助。也请关注我的知乎专栏,我会写一些关于我在CMU的经历,我的在实验室干活的感受,以及找工作酸甜苦辣。

一点背景介绍,陈然,THU软件学院2009级,CMU-MCDS 13Fall,暑假在MCDS Director Prof. Eric Nyberg的OAQA组里干活,一直觉得很有可能留下来继续读PhD的,做做Machine Learning的交叉学科的应用。后来被老板告知没有RA(毕业至15Fall PhD入学这段时间),要去工作,于9月的Career Fair开始刷题找工作,因为准备得晚,一直被拒,连跪七个面试后来了一个大offer,Data Scientist @ Trulia in SF ,考虑到这个组很小,只有5个人,也是偏Research的,其他人都是PhD或者有多年工作经验的,再加上估计也不会有人给我更多的钱了,遂从了,并毫不犹豫地放弃了PhD的学术理想。

因为这个组催的急,还有FB,LinkedIn也就不等了,Aetna的Senior Informatics Analyst也不继续面了,另外一个拿到的Offer是Apple 的 Map Evaluation Team,也是类似Data Scientist的角色。我也一共就这两个offer。

感觉Trulia给了我Data Scientist的Offer主要是这么几个原因:

1. 一是我们的项目名字叫 Master of Computational Data Science,一看就是相关专业,感谢项目改名!

2. 二是我选了大量Machine Learning的课程,从基础的Machine Learning到中级统计到Probabilistic Graphical Model,基本对于现在工业界能用的Model都了解

3. 三是我会使用Hadoop等工具,这主要得益于第一我选过Cloud Computing,这课手把手,还给钱,教使用AWS做了很多东西。第二我选过Machine Learning in Big Data, 这课主要教的就是怎么在Hadoop和Hadoop Stream上实现Naive Bayes,虽然内容不多,但是讲了方方面面的很多琐碎的东西,而且工业界很适用。

4. 四是我有实际的Machine Learning项目经验。我来读Master的时候就希望可以把一个项目的时间做的尽可能的长,我很厌倦实习和毕设那2个月做一个项目但是什么都做不出来的感觉,所以我通过Spring 2014选课+暑期留在实验室+Fall 2014毕设做同一个项目把这个项目做了8个月。这是个在法律界的使用NLP,IR,ML的项目,太难做了,太繁琐了,太多Dirty Work了,太多心得了。但是面试的人跟我总是有特别多的共鸣。

5. 最后当然我本科也是学CS的,计算机组成原理,计算机网络,数据库,编译原理,操作系统,信息检索等课程也都上过,基础知识也没有什么短板,这个也很重要

我申请的时候主要投的职位包括:Software Engineer, Software Engineer in Machine Learning, Data Scientist, Data Engineer, Data Science Engineer。至于这些所谓的Data Scientist 或者类似的职位到底是做什么的,每家公司情况都不一样,我的所见所谓主要是有这么几类:

1. 做Infrastructure的。这一类就是做系统的,而且要求不低。

2. 做传统数据分析的。Excel,SQL,写report。

3. 做比较新的数据分析的。往往要使用爬虫到处爬数据,写脚本处理Log,Hadoop处理数据等等。

4. 做Machine Learning应用的。常见的Machine Learning的相关的应用包括搜索,NLP,图像,广告,反欺诈等等。

5. 其他的大杂烩的。

大家可以对着这样的职位的要求查缺补漏,把一些课和技能补全。

最后,我会把详细的经验和心得也写出来,不过需要一点时间,大家可以在下面几个地方关注我:
知乎:陈然
微博:Sina Visitor System
LinkedIn: Ran Chen | LinkedIn
邮箱:chenr09@gmail.com

最后,给大家一点信心,展示一下我的求职坎坷之路:

没有回复我的:
Precyse(Senior NLP)
Pinterest(Data Engineer)
A9(Data Science Engineer)
TripAdvisor(Software Engineer – Machine Learning)
Grassbridge-llc(Data Scientist – Machine Learning)
Reflektion(Software Engineer – Machine Learning/Predictive Algorithm/eCommerce)
Adobe(Data Scientist)
Medallia(Research Scientist NLP & Machine Learning)
Skyhigh(Networks Java Algorithm Engineer – Big Data – Cloud Security)
Yelp (Software Engineer – Data-Mining, Data Scientist)
Groupon(Data Scientist/Algorithm Engineer, New Graduate)
Zensight(Machine Learning Engineer)
Indeed(Software Engineer – New Grad (Seattle))
Fitbit(Research Engineer – New Grad)
Uber(SOFTWARE ENGINEER – MACHINE LEARNING)
Quantcast(Software Engineer, Machine Learning)
ePlus(Data Scientist)
Eharmony(Machine Learning Engineer)
Lynx(NLP/Machine Learning Engineer)
http://Adap.tv(Data Scientist)
OnDeck(Data Scientist)
Facebook(Software Engineer)

跪在简历的:
IBM(Waston Team)
Quora(Software Engineer, New Grad; Data Scientist, New Grad)
Airbnb(Machine Learning; Software Engineer New Grad)
Twitter(Data Scientist, Modeling; Software Engineer – Machine Learning/Relevance (Seattle); Software Engineer, New Grad)
Coursera(Data Product Engineer)
Glassdoor(Machine Learning / Data Scientist, Search Relevance)
BloomReach(Software Engineer – New Grad)
Zillow(Software Engineer, New Graduate)
Meetup(Machine Learning Engineer)
DataRobot(Software Engineer Machine Learning)

跪在电面的:
AOL(Data Scientist / Data Analyst Machine Learning)
WealthFront(Data Engineer)
Palantir(Software Engineer)
Heap(Software Engineer)
Apple(Siri New Features Team, Siri Data Team)
Kosei(Data Engineer)

跪在Onsite/On Compus的:
RocketFuel(Software Engineer)
Google(Software Engineer)

其他:
Aetna(Senior Informatics Analyst):不愿意继续面试了

拿到的Offer:
Trulia(Data Scientist)
Apple(Map Evaluation Team)

End,








欢迎光临 168大数据 (http://www.bi168.cn/) Powered by Discuz! X3.2