一、数据科学的三个职业方向
1. 机器学习工程师 Machine Learning Engineer
代表了技术含量较高的方向,工作内容主要是开发机器学习系统和用这些系统解决实际问题。一般需要ship production code,做出来的是数据产品。
2. 数据分析师 Data Analyst
工作内容俗称analytics (product analytics or business analytics),从数据中提取insight,估计投资回报比,为产品方向提建议,所用工具一般较基础,比如写SQL query取数据、用R/Python做简单的分析、用Tableau/Excel作图比较常见,能自己开发Dashboard算是analyst里面技术强的;工作需要产生各种形式的报告;在统计层次上,懂基本t-test和线性回归即可。
3. 数据科学家 Data Scientist
很多人说,我想做数据产品,我想做机器学习,而这类职位就是大家想象中的那种。
此类职位工作内容以高级建模为主,会针对复杂的问题来设计技术方案,比如Uber叫车的ETA、各种定价系统、Airbnb和金融行业的Fraud Detection、Amazon物流管理,Meta/Linkedin的社交网络或者ebay/Airbnb/Uber这样供需双方Marketplace市场规模的实验。这些例子,听上去就不是写SQL能解决的,也不是会写代码就能做出来的,都需要比较深的领域知识。
二、三个职业方向的对比
从工资收入高低来看,1和3都很高,2要低一些,尤其是非IT行业,工资明显低很多,工作地点如果也不是热门地区的话,可能只有1和3的一半。
从工作机会多少来看,近期内对1的需求很高,今后几年内也会保持;2散布在各个行业,加起来也不少;3其实是少数派,职位很少,往往只有大公司才需要,中小型公司可能不需要,即使需要的话,有少数几个人也就够了。
从读什么专业、拿什么学位角度来看,1包含“会一些ML的软件工程师”和“会写生产代码的机器学习专家”两种,也就是说,侧重点会有差异,但是机器学习和软件开发技能都需要。有EE或者CS博士学位最佳,统计等计量学科博士,如果辅修了CS master,也合适。如果只有EE/CS硕士学位也可以,但是硕士生们需要额外自学很多机器学习知识才能胜任,只靠在学校里简单上一两门课,可能不够。此外,找工作的时候,也需要一些运气成分才能找到合适的岗位。
2一般是统计、数据科学、商务分析、工业工程等专业的硕士担任。
3一般是统计、运筹、经济、工业工程、EE、CS等专业的博士担任,需要某领域的深刻理解。
三、如何在三个职业方向之间转换?
如果你做的是1,考虑到工资收入高,能接触到系统的核心(比如LinkedIn是如何给大家推荐工作的),你很可能不会主动考虑换岗位,当然,如果有机会往3靠近,做点新东西,或者处理更上层、更有全局观的问题,很多人会考虑。
有人可能会问,硕士生们,在2类岗位工作几年以后,是否可以从事3?这个要看具体情况,但是整体难度非常大。有一个道理相信很多人都明白:基础工作做1000遍,不代表你能从事高级工作,典型的例子是用天天写SQL产生report,写上3年,不代表你能做建模。此外,很多公司看到你的最高学位是硕士,很可能不会考虑你,不给你机会。
3类工作也并非完美,最大的问题在前面说了,工业界职位少,换句话说,你跳槽可能没有几个选择;当然,公司要招有经验的人,合适的candidate也少。如果要往1转,最大的障碍是编程能力如何,能否写production code,如果本身就是EECS出身,那会很容易。