2018年,这5个数据科学项目能帮你找到工作
找个数据科学的工作不容易,不过我有个好主意能帮你找工作,这就是打造你自己的作品集,利用作品集展示你学到的技能,让未来的老板知道你有多大本事。
你可以把这5个数据科学项目放到作品集里,以此说明自己的能力:
数据清洗
数据科学家往往要耗费高达80%的时间来清理新项目的数据,这是数据科学团队最大的痛点。如果能告诉他们你拥有丰富的数据清理经验,你的价值马上就能体现出来了。现在,找一些需要清理的数据集,创建一个数据清洗项目,开始数据清理吧。
用Python的话,Pandas绝对是首选,如果用的是R,可以使用dplyr这个包。记得要表现出以下几项技能:
导入数据;
合并多个数据集;
检测缺失值;
检测异常值;
插入缺失值;
数据质量验证。
探索性数据分析
数据科学的另一项重要工作是探索性数据分析(EDA,Exploratory Data Analysis )
