数据科学是Netflix的DNA,Netflix利用数据科学改善用户体验的方方面面。多年来,Netflix一直利用数据科学作为其内容推荐引擎,以决定制作哪些电影和电视节目来改善用户体验。
Netflix的数据科学角色
Netflix的数据科学家的角色在很大程度上取决于团队。然而,Netflix的一般数据科学家角色贯穿业务分析、统计建模、机器学习和深度学习的实现等领域。Netflix是一家大型公司,数据科学家在个性化和算法、营销分析、产品研究和工具等30多个不同的团队中工作,拥有从基本分析到复杂的机器学习算法的各种技能。
所需技能Netflix只聘用具有至少五年相关经验的有资质的数据科学家。其要求非常具体,招聘人员热衷于对每个工作岗位进行专门招聘。这有助于拥有特定行业经验的人能针对特定的团队角色。其他相关资质包括:
· 统计学、计量经济学、计算机科学、物理学或相关定量领域的高等学位(硕士或博士)。
· 五年以上的相关经验,并且在利用大量数据推动产品创新方面有着可靠的工作业绩。
· 具有分布式分析处理技术(Spark、SQL、Pig、Presto或Hive)的经验,并具有Python、R、Java或Scala方面的强大编程技能。
· 有实际的建立机器学习模型的经验,并且具有良好的影响力。
· 具有在A/B测试、分析观测数据和建模中使用的深层统计技能
· 有在Tableau、R Shiny或D3中创建数据产品和仪表板的经验Netflix的数据科学团队是什么?Netflix的数据科学一词涵盖了与数据科学相关的广泛领域和角色。数据科学家这一头衔是角色和功能的结合,范围从专注于产品分析的数据科学家扩展至数据工程和机器学习功能。
· 个性化算法:与产品和工程团队合作,评估性能,优化个性化算法,用于向Netflix用户推荐电影、电视节目、艺术品和预告片。
· 用户界面数据科学与工程:利用自定义机器学习模型为所有订阅者优化产品的用户体验。
· 产品研究和工具:开发和实施方法,以推进Netflix的大规模实验。这包括开发数据可视化框架、工具和分析应用程序,为其他的团队提供对用户行为和产品性能的洞察。
· 增长数据科学与工程:注重于扩大用户群,围绕关键业务指标,构建和设计高度可伸缩的数据管道以及干净的数据集。
· 营销数据科学工程:创建可靠的分布式数据管道,构建直觉型数据产品,为利益相关者提供跨越行业的数据利用方法,为所有非技术团队提供自助服务。
面试过程