亚马逊数据分析岗位
数据分析师的主要职责是打破数据和决策之间的鸿沟。亚马逊内典型的数据分析岗位有:data analysis, dashboard/report building,以及metric definitions and reviews。同时,数据分析师也需要搭建收集、整合、分析、报告的数据系统。
不同的数据分析岗位主要通过不同的数据类型(比如,Twitch data, Sales data, Alexa data 等等),不同的项目,以及被分配到的小组来区分。数据分析师也需要与其他各种各样的部门合作,包括数据工程,数据科学,和市场营销部门,来给市场调研和商务领域提供有数据支撑的建议。根据不同的部门要求,数据分析师涉及的范围由基础的商业智能分析(比如数据处理、分析和报告)到更偏技术类的岗位比如数据收集。
那么,成为一名亚马逊的数据分析师需要具备怎样的技能?
首先,候选人需要具备数据分析、数据建模、高级商业分析或其他相关领域的行业经验。
基本要求包括:
本科或研究生(博士优先)在金融,商业,经济,工程,数学,统计,计算机科学,运营或相关领域
具有脚本语言(scripting),查询(querying)和数据库工具(例如Linux,R,SAS和/或SQL)的经验
在Python,R或Java等编程语言方面拥有丰富的经验
具有查询关系数据库(SQL)的经验以及处理,优化和分析大数据集的实操经验
熟练使用Microsoft Excel,宏和Access
具有识别指标和KPI,收集数据,进行实验以及平台展示,制作dashboards和scorecards的经验
具有商业智能和自动化自助服务报告工具(如Tableau,Quicksight,Microsoft Power BI或Cognos)的经验。
具有AWS服务(例如RDS,SQS或Lambda)的经验。
看到这里,很多人会好奇,亚马逊的数据分析团队究竟是怎样神一般的存在呢?
作为一家大型综合性技术公司,提供多样化的产品和服务,亚马逊有超过100个团队致力于各个领域。数据分析师与这些团队合作,帮助弥合数据与决策过程之间的鸿沟。通常,数据分析师们通过数据分析来帮助简化决策过程。
根据亚马逊团队的不同,数据分析师的职责可能包括:
Alliance(Twitch):利用先进的分析方法来衡量交易绩效的方式,定义什么问题应该问,并扩展分析方法和工具以支持Twitch不断发展的业务。此外,定义和跟踪KPI,支持战略计划,评估新的商机并通过数据改善/增强决策。
财务运营:开发标准的临时分析(ad hocanalysis)和决策报告。在分析,定义,创建和提供数据,生成指标并提供建议的框架内,构造高级业务问题。自动化标准报告并推动数据治理和标准化。
搜索能力:利用高级分析和预测算法来创建功能强大、以客户为中心的搜索解决方案和技术。与工程和运营团队合作,通过识别和跟踪有关效率和成本的KPI来扩展亚马逊的搜索服务。
教科书团队:构建强大的数据分析解决方案以改善客户体验。使用高级数据挖掘概念,数据建模和分析来定义和度量用于评估业务增长的指标。提取,集成和处理关键数据,以构建数据管道,自动化报告和dashboards,以及将自助服务工具用于内部利益相关者。
防止欺诈和滥用:利用复杂的机器学习概念来减轻和防止欺诈。为新的和现有的指标、报告、分析和dashboards开发和管理可扩展的解决方案,以支持业务需求。实施来自各种来源的定制ETL管道,以提高数据质量和可用性。
购买:使用高级分析概念来确定要在全球亚马逊所有网站上存储多少库存。开发和维护指标,公开和衡量亚马逊购买系统的当前绩效,识别和量化改进机会,并利用亚马逊的海量数据识别和防止意外绩效。与其他团队(尤其是工程,研究,数据科学和业务团队)进行跨职能协作,以进行未来创新。
工程成功(Twitch):与Twitch的工程团队合作,提供数据分析,以改善和塑造成功衡量指标,定义业务影响问题以及扩展分析方法和工具以支持亚马逊不断发展的业务。
所以,到底要经历怎样的重重选拔,才能成为这个团队中的一员?
亚马逊数据分析师面试过程遵循标准的亚马逊“ STAR”(situation,task,action,result)过程,但略有不同。面试过程从HR的初始电话面试开始,紧接着是技术面试,最后是5-6个与招聘经理,团队成员和HR一对一的现场面试。
1.电话面试
这是提交申请后和HR的一个常规介绍性面试。持续45分钟的面试意在探索可能性和适应性。面试专注于了解你的背景,技能,以及和职位相关的工作经验。期间你还能够了解到亚马逊的文化和职位相关内容。
小贴士:亚马逊十分强调领导原则。根据亚马逊的领导原则,遵循“ STAR”模式来调整面试回答非常有帮助。
面试问题举例:
What is the biggest challenge you have overcome?(你克服的最大挑战是什么?)
What is your previous experience with SQL? (你有什么使用SQL的经验?)
Tell me about a time when you disagreed with a manager. How did you handle the situation? What was the result? (举一个你和领导有不同意见的例子,你是如何解决的?结果如何?)
How would you go about making improvements (performance, safety, process) in your workplace? (你将如何对工作场所进行改进(性能,安全性,和过程))
Describe a long term goal and how you plan to achieve it. (描述一个长期目标以及你打算如何实现它。)
2. 技术面试
技术面试是和HR或经理进行的。亚马逊使用一个名为“CollabEdit”的协作服务平台进行所有的技术面试。本轮采访中的问题围绕SQL编码,Excel以及有关亚马逊领导力原则(LP)的问题展开。
3. 现场面试
数据分析师的现场面试与亚马逊的其他现场面试非常相似。候选人将与招聘经理,团队经理,数据分析师,数据工程师和统计的人员进行5或6个一对一的面试。面试轮次之间有午餐休息时间。不同轮次的面试由数据科学概念,SQL编码和著名的亚马逊领导力原则(LP)构成。
面试贴士与技巧
亚马逊数据分析师面试主要由数据科学概念组成。它具有独特的结构,可以用来评估候选人分析亚马逊数据以提供影响决策的新见解的能力。利用亚马逊的“ STAR”模式回答问题可以为面试加分。
亚马逊的面试官期待你可以用以前的工作经验来支持自己的回答。尝试用过去的工作经验来回答每个问题,可能包括你曾经面临的挑战,你所使用的解决方式以及你是如何克服这些挑战的。
下面我们列举了一些面试真题,做完这些面试问题,你可能会对亚马逊数据分析师岗位面试有更直观的了解!
Which functions in SQL do you like the most?
(你最喜欢的SQL的功能)
Explain OLAP cubes and a use case explaining business analytics application.
(解释OLAP多维数据集和它在商业分析上的运用的例子)
What are data normalization and non-normalization?
(什么是数据标准化和非标准化)
What happens to the data of a table with foreign keys when the associated table with primary keys has been updated?
(当被关联的具有主键的表更新时,具有外键的表的数据将发生什么?)
What do you understand by cascading referential integrity?
(通过级联参照完整性,你了解到什么?)
Explain the difference between the linear and logistic regression and use examples.
(解释线性回归和逻辑回归之间的区别,举例说明。)
What is an independent variable and what if I have three independent variables in my model and no dependent variable?
(什么是自变量?如果我的模型中有三个自变量而没有因变量,该怎么办?)
Write an equation for the multivariance or multiple regression model.
(为多元或多次回归模型写一个方程式。)
Given a sample with n observations, how could you test a hypothesis?
(给定具有n个观察值的样本,如何检验假设?)
What are the Assumptions of ANOVA.
(什么是方差分析的假设。)
What test would you use for a small sample?
(你会对小样本进行哪种测试?)
What is the null hypothesis?
(什么是原假设?)
What are type 1 and type 2 errors?
(什么是一类错误和二类错误?)
Use the following tables to write a query to retrieve data for customers who registered in the pen days and spent over $100. Write another query to retrieve data for customers that spent over $100 in the past seven days. The first table is a customer purchase table with five columns: customerid, purchase date, product id, unit price, and units purchased. The second table is a customer details table with two columns: customer id and registration date.
(使用下表编写查询指令,以检索过去10天内注册且花费超过100美元的客户的数据。编写另一个查询指令,以检索过去7天内花费超过100美元的客户的数据。第一个表是一个包含五列的客户购买表:客户ID,购买日期,产品ID,单价和购买单位。第二个表是一个包含两列的客户详细信息表:客户ID和注册日期。)
What is the probability of generating ten consecutive numbers in ascending order out of 100 numbers?
(从100个数字中升序排列生成十个连续数字的概率是多少?)
How would you merge two tables in SQL?
(你会如何在SQL中合并两个表?)
Write a function to calculate the Fibonacci code in any of these languages (VBA, Python, Java).
(编写一个函数以使用任何这些语言(VBA,Python,Java)去计算斐波那契代码。)
希望看完文章的你,行动起来!即使是尚未达到亚马逊的招聘要求,也可以根据job description进行针对性学习,Uoffer也可以针对于自身情况提供各类的课程系统培训!希望行动后的你,可以拿到一份满意的offer!