先来说一下行业中大家普遍接受的定义:
data analyst:工作重点放在怎么分析数据来找到如何可以提高产品的insights,并和PM一起工作来改善产品。也有的DA需要做dashboard来检测核心指标。核心技能是sql,python等数据分析工具,以及tableau等数据可视化工具。
data scientist:data scientist的目标也是改善产品。但scientist和analyst的差别有两点。第一个是ds使用的技术手段一般更高级,比如用到很多machine learning和statistical modeling的方法,对数学统计理解的要求也更高。第二个区别是项目的类型,ds一般做长期偏研究类型的项目,而da一般做一个很简单快速的分析,一两天之内就要给PM结论。
machine learning engineer:mle和ds比起来更偏engineer一些,也就是说要写很多production code。这是因为mle一般做的是实现产品中的ml feature,比如说怎么样把ml算法应用到提高Google地图ETA精度。因为是实现产品功能,所以对写代码的要求相应ds来说要高一些。ds也做ml model,但是区别是ds要么做的model是给商业组提供insights的,比如怎样找到sales的目标客户这种。
data engineer:data engineer的关注点主要在怎样提高数据获取流程上面。他们会写很多data pipeline,比如有一个数据集是大家经常要使用的,data engineer就会写一个流程创造这个数据集,并且一段时间自动更新一下。再比如da要做一个dashboard或者ds要做一个model,data engineer都会帮忙他们获取相应的数据。
但是事情并没有这么简单,现在市面上很多公司并不是严格按照这个定义来给他们的岗位命名的。在投一个工作之前先看看他们要求的核心技能是什么,和他们解决的问题是什么,这个都可以在工作描述里面找到。比如analyst岗一般会说很多soft skills,比如有很强的分析技能,有很强的交流能力,熟练使用sql之类的。data scientist一般会提到很多ml或者causal inference方面的技能。mle则是会提到很多编程以及model serving方面的技能。看了工作描述已经基本知道了这个岗位是做什么。在面试的时候也可以多问问hr和hiring manager他们平时主要是解决什么问题,这样可以有一个更清楚的了解。
下面总结下部分公司的岗位区分。
Google:quantitative analyst是他们的核心data scientist,product analyst data science是analyst,software engineer machine learning是mle,也有的software engineer是做data engineering。他们也有data scientist岗,一般比较偏QA,但也有偏PA的,需要面试和组里确认。
FB:data scientist analytics是analyst,core data science组和infra组的data scientist做的活更偏scientist。research scientist是phd swe/scientist,并不一定做research。mle也在software engineer里,有的组会做到ml项目
Airbnb:他家的data scientist是分track的,analytics,inference和algorithms三个。analytics就是analyst,inference主要做ab test,algorithms做model。他们也有专门的mle和de岗。
LinkedIn:很多人不知道LinkedIn的ds也是和airbnb一样分track的。他们也有三个track,一个叫strategy and insights,这个就是analytics,第二个track叫做inference and algorithms,从名字就知道更偏ab test和ml,第三个track叫做data engineering,据说这个track比较新现在人还很少。LinkedIn也有software engineer ML,但是和data scientist不在一个org,他们在AI org。LinkedIn家的mle还是很硬核的做很多算法,他们的这个岗有很多phd
Apple:Apple因为都是组里招人所以比较乱,他们也没有track。同样是data scientist,有的组做dashboard有的组做ml engineering。他们家ds和mle有时候也混着用,所以只有看工作描述区分和面试的时候多问问。
Lyft:他们data scientist其实就是analytics,research scientist才是scientist。他们的一个medium blog就说了这个问题,他们本来有analyst和scientist,但发现analyst不好招人,因为有的公司(估计是FB)把analyst叫做scientist然后大家都更喜欢去这种岗。所以他们干脆也把analyst改成scientist title,把scientist改成research。其实工作内容没有任何改变。
Uber:Uber家的product analyst是analytics,data scientist干的活一般是scientist类型的,比如ab test和ml。Uber也有单独的mle。
Amazon:BI Engineer是analytics和data engineer的结合。data scientist做一些analytics也可能做一部分分析相关的ml。research scientist做ml但是coding少。applied scientist是他们家要求最高给钱最多的岗,需要ml和coding都很强。
Twitter:他们就是mle做ml相关的项目,ds还是偏analytics。
Microsoft:M家ds感觉也是看组,有的是analytics,有的做DL。他们还有个data & applied scientist,看工作描述比较硬核,但我也没有面过。
如果你还没有一些面试,但仍想找到暑期实习,可以随时联系Uoffer,为您提供专业的职业发展咨询与职业技能培训服务。