Google数据科学家的工作内容与薪酬如何?
Google数据科学家的工作内容主要有三个分支,身处不同团队的数据科学家,可能会侧重不同领域。
数据工程
数据工程的主要工作包括数据环境设置,数据管理,以及数据产品化。其核心是以数据流为重点的软件工程。自动化的基本构建块是通过模块化、注释良好的代码和版本控制来维护数据管道。
数据分析
分析以快速且通常是探索性的方式将原始信息转化为具有商业价值的信息数据。这要求数据分析师具备足够的专业知识,有效地进行探索性分析,并用讲故事的方式呈现结果。数据分析师需要解决许多实际问题,包括但不限于:
· 该项业务的关键指标是什么?
· 该项业务拥有的数据代表了什么?
· 如何将该业务需求转化为数据问题?
· 如何使用数据来帮助阐明自己的观点?
这些问题对数据科学家的专业知识是直接的考验,要求其具备探索性分析数据的能力。
建模和推断
建模和推断是数据科学家通过对数据的深入研究探索潜在模式的过程。主要包括有监督模型,无监督模型,自定义模型在内的三种模式。在将业务问题完全转化为数据科学问题后,数据科学家会用一些现成的模型拟合数据,或者开发新模型来解决或优化问题。
根据相关数据显示,Google支付给工程和数据科学领域具体岗位的薪酬(年薪)区间如下:
软件工程师:10.20万美元至30万美元
工程副总裁:47.50万美元
首席软件工程师:34.10万美元
资深工程师:20.70万美元
工程经理:14.54万美元至30.00万美元
数据科学家:13.30万美元至18.80万美元
相比其他公司,谷歌数据科学家的薪酬具有一定竞争力,而且,随着职级的上升,数据科学家如升值到成为上图的其他职位,则薪酬会有较大提升。
Google数据科学家的面试指南
之前,Google首先会进行技术筛选阶段,求职者与一个数据科学家进行视频会议(Google Hangouts)。这一过程的面试是围绕实验设计、统计学和一个概率编编程题展开的。此外,还会涉及更多的技术讨论,关于求职者过往的研究和工作经验,经历过的问题以及解决这些问题的技术方法。
如果Google取消网络视频面试(简称“电面”),应聘数据科学家岗位的求职者们,则可以直接进入现场面试阶段。
现场面试阶段,求职者会与数据科学家进行的5轮一对一面试,内容主要包括计算统计(Computational Statistics),概率(Probability),产品解释(Product Interpretation),度量和实验(Metrics and Experimentation),建模(Modeling)以及行为问题(Behavioral Questions)。每轮面试大约45分钟,中间有午餐和休息的时间。
在面试中,主要会遇到三种题型:
· 编程面试问题
一项依赖数据结构和算法知识的编程问题。要求求职者在面试的时间限制内为问题提供有效且优化的解决方案。
· 系统设计问题
涉及复杂系统设计的高层次宽泛问题。要求求职者能够与面试官一起确定系统关键组件的内容,并设计一个可扩展的解决方案。
· 一般分析问题
一个数学、设计或基于观点的问题,主要考察求职者的思维逻辑,以及作为员工的行事风格。要求求职者提供几种不同的解决方案,阐述每个解决方案的利弊。
一般来说,求职者的工作和实习经验越丰富,则被问到系统设计和特定领域问题的可能性越大。经验小于 5 年的工程师被问到相关问题的可能性较小。
· Think out Loud
将自己所思考的表达出来,学会主动与面试官沟通思考过程,而不是闷头写代码。
· Don’t Afraid to Ask
不要害怕提问题,而是要多问问题,这样有助于面试时快速进入状态,从而正确理解题目,找出最优解。
· 能保证擅长至少一门语言
不论是Java还是C++还是Python,从而确保不会被面试官问倒。
· 多练习在白板上写代码
这样有利于面试时展示思考过程,体现自己如何一步步优化思路。做到即使在没有任何辅助工具的情况下也能写出正确的Syntax。
虽然Google网络视频面试有望取消,但现场面试对专业知识的考察依然不可松懈哦。