简单解释一下每种的含义
基础 - transform data to high impact business decisions
核心技能:通过线下数据分析提供有价值的产品决策建议,包括简单的实验设计
进阶 - transform data to algorithm based product solution
核心技能:通过线下算法构建优化产品,包括复杂的实验设计,科研与创新
硬核 - End-to-end transform data to business impact
核心技能:拥有把数据“变成价值/钱”的全部技能,包括创造新方法的技能,并不断提升效果转化率
从上面这张表格我们可以看出数据分析能力是所有数据科学家的底层技能,毕竟对于一个公司来说,最好的算法不是最复杂的,而是最“有价值”最“赚钱”的。此处想多聊一点,数据分析能力不像编程一样有标准答案和单元测试,同一套数据不能力的人完全可能分析出不同方向或不同深度的结果。我认为好的数据分析能力可以再细分为数理统计基础(对数据的敏感度)和系统的产品思路框架(systematic thinking)。简单来说就是知道自己能用什么数据,回答什么问题,也知道哪些数据不可信,哪些问题暂时不能回答。
回到问题本身,数据科学家 (Data Scientist) 的核心技能,是从数据中挖掘和创造商业价值的能力。除了以上分享的框架外我们还可以从公司需求和产品周期来讨论数据科学家的核心技能,比如非算法相关公司的第一个数据科学家,通常最需要的是数据清理和呈现(dashboarding+story telling)技能去build executive dashboard, 而对于一个算法为核心的产品,最需要的责是算法搭建技能, 等等。而具体是哪一个“硬技能”如SQL或“软技能”如data story telling完全不必被局限在任何已有的data skill set里,不断思考,尝试和创造方法本身就是“科学家”的本职工作。