数据科学家实操之路
更多深度文章,请关注:https://yq.aliyun.com/cloud
Kaggle最近进行了一项旨在评估数据科学和机器学习当前发展状况的调查。 他们收到了将近17000份答卷,并利用这些答卷做出了大量的分析。对于调查结果的分析报告,我并不感兴趣,我只是想看看这些调查结果是否对我这种想知道如何成为数据科学家的人来说是否有用。
如果你对分析过程并不感兴趣,而只想看看17000个行业专业人士的说法,那么请跳到本文的最后一节阅读结论。 否则,请继续阅读下文,看看我是如何得出结论的。
1. 导入和预处理
1.1. 导入数据
library(data.table)library(dplyr, warn.conflicts =FALSE)library(ggplot2)library(tibble)
results <- as.tibbl