Data Analyst
这个职位对建模能力要求较低, 比较适合刚接触数据科学或者转专业换背景的同学。工作内容偏向于结合数据分析实际商业问题, 并将分析的结果转化为切实可行的商业方案,比如定义评价指标, 为产品方向提意见等等。
岗位所用的工具一般比较基础, 最核心的是用SQL 来获取整理数据, 用R/Python做简单的分析、用Tableau/Excel作图,在统计和模型方便,懂得基本的回归预测模型等即可满足大部分要求。
Data Scientist
这个岗位的工作内容主要是以建模为主,与Data Analyst相比对编程能力要求较高, 不仅需要熟练的SQL 技能, 还对 Python/R 等变成有着较高要求。
除了要求基础统计知识, 对机器学习能力也有要需求, Data Scientist一般能独立的完成数据科学分析问题, 所以还需要对用数据科学解决问题的流程和方法十分了解, 懂得如何将复杂的商业问题转化为统计和机器学习可以解决的问题, 然后据此设计技术方案,比如各种定价系统,金融行业的Fraud Detection,电商的推荐系统等等。
最后 Data Scientist 一般会有不同的领域之分, 不同领域也有一定自身领域知识的要求, 比如产品, 内容, 市场, 用户等等。
Data Engineering
类似于软件工程师, 但是围绕着大数据领域的工程问题。这个岗位对编程技术含量相对较高,工作内容主要是开发大数据的 ETL (提取, 转换, 存储) Pipeline来处理数据,除此之外对于大数据的生态系统及对应工具 (例如: Hadoop, Spark, MapReduce, Splunk, Hive, etc.) 也需要有较好的了解与实践经验。
Research/Machine Learning Scientist
类似于增强版的偏向于研究方向的 Data Scientist, 对研究探索能力有较高要求, 可能需要解决一些不存在现成方法的问题, 或者是需要前沿技术的问题, 能独立读 Paper 确定可行方向或者研究计划, 一般需要有 PhD 学位或者 MS 学位加多年工作经验, 这些职位一般更多的是面向有经验的面试者开放。
做Data Science的优点
作为21世纪“最性感”的行业,数据科学有以下优点:
前景
在全球范围内,数据科学需求量都非常可观, 提供给求职者很多机会。作为领英上增长最快的工作,预计到2026年将创造1150万个数据科学岗位。这使得数据科学成为21世纪“最性感”的行业 。
薪资
数据科学是收入最高的行业之一。以美国为例,根据Glassdoor网站统计,美国的初级数据科学家每年的平均收入都能达到113,000美元。这使得Data Science成为一个利润丰厚的职业选择。
全面提升硬实力
数据科学的工作需要强大的数学统计知识以及编程技巧,掌握这些技能对于个人成长,以及职业发展都打下了坚实的基础。
工作内容有成就感
数据科学帮助各个行业实现冗余任务的自动化,帮助公司作出基于数据理论的明智决策。各行各业的公司都会依赖数据科学为自身或者客户提供帮助,这让数据科学家在公司中享有重要的地位。
薪酬、工作时长
以美国为例,入门级的数据科学家(Data Scientist)的薪水在$90K-$140K左右, 高级数据科学家的薪水可以达到 $250K-$300K, 资深数据科学家可以超过$400K。
数据科学家的平均工作时间通常比较固定,一般是每周40小时左右,但由于项目的原因, 在一些核心部门或者某些时间段可能会有适当加班, 显得比较忙碌, 但一般不会造成困扰。但整体而言, 数据科学家的工作量并不是很大大, 特别是对于有经验的数据科学家。
未来发展路径
数据科学家也是基于技术的职位, 在职业生涯阶段可以从入门机数据科学家逐步进阶为中级数据科学家, 高级数据科学家甚至资深数据科学家。数据科学家的职业中后期也可以转型管理, 变成 Data Science Lead 或者 Data Science Manager, 从而进行更多方向性和领导性的工作。
基于数据科学家技术的积累, 如果有很强的工程实践能力, 可以转型成 Machine Learning Engineer, 如果有很强的分析和研究能力, 也可以转型成为 Machine Learning Scientist等。
常见公司
数据科学的常见公司大致可以分为这几类:
上市公司
上市公司中Google, Facebook, Netflix的薪水和面试难度都是行业里的标杆。此外Amazon, Microsoft, LinkedIn, Bloomberg, Apple也都是值得一去的一流公司。业界流传的“FAANG”就是指的Facebook,Apple,Amazon,Netflix,Google。
独角兽公司
类似Uber, Lyft, Airbnb, Robinhood这样的独角兽公司门槛不低于以上的上市公司,而且工作节奏更快所以很适合更有野心也愿意接受风险的数据科学家。
金融、咨询公司
金融和咨询行业中有一些公司也拥有数据科学部门或者岗位,但通常都是规模较大的公司或者公司业务非常需要数据科学支持,如一些对冲基金:Two Sigma, DE Shaw, Citadel, Hudson River Trading, Jump Trading。银行包括九大投行JP Morgan, Goldman Sachs等等都有数据科学的职位。咨询公司中也有越来越多的数据科学咨询顾问的出现,例如McKinsey,Mercer,Capgemini等等。