Data Scientist面试会问些什么?
一般来说数据科学家的面试会分为三种类型,编程能力、理论能力与分析能力。
编程能力多以leetcode为主,如下,我们给出一道经典的leetcode题目作为示例:
给定一个数组 prices ,它的第 i 个元素 prices[i] 表示一支给定股票第 i 天的价格。你只能选择 某一天 买入这只股票,并选择在 未来的某一个不同的日子 卖出该股票。设计一个算法来计算你所能获取的最大利润。返回你可以从这笔交易中获取的最大利润。如果你不能获取任何利润,返回 0 。
示例 1:
输入:[7,1,5,3,6,4]
输出:5
解释:在第 2 天(股票价格 = 1)的时候买入,在第 5 天(股票价格 = 6)的时候卖出,最大利润 = 6-1 = 5 。注意利润不能是 7-1 = 6, 因为卖出价格需要大于买入价格;同时,你不能在买入前卖出股票。
示例 2:
输入:prices = [7,6,4,3,1]
输出:0
解释:在这种情况下, 没有交易完成, 所以最大利润为 0。
理论能力一般以考察对于基本概念的理解,如:
xgb和random forest什么区别?
exploration和exploit的区别?
random forest能不能处理imbalanced data?
svm的loss function是啥?
single variable regression中如果我们对调x和y,Rsquare会怎么变?
Dropout Layer是什么,有什么作用?为什么能有这个作用?一般来说Dropout Rate如何选择?
场景分析一般会给出某一特定的场景,然后根据场景进行分析,得出某一结论;例如:
Uber给你的数据集包含了某一个区域(不知道具体位置的一个区域)的所有uber呼叫的时间戳,让你分析预测接下来的1小时内,每个15分钟,会有多少次呼叫?