如何进阶成为一名数据科学家?
【大咖・来了 第7期】10月24日晚8点观看《智能导购对话机器人实践》
数据科学家-21世纪最性感的工作-可以说是每个数据分析师的最终目标,既然拿到的Stack Overflow调查问卷中含有数据分析师和数据科学家的数据,那本次报告的任务就是横向对比一下数据分析师与数据科学家,让大家对自己的未来的技能树选择能有多一点的数据支持。
假设问题
- 目前处在或者即将处在数据分析师职位的朋友应该打磨自己的哪项技能?
- 数据分析师为自己未来的数据科学家之路应该如何扩充自己的技能树?
问题解析
本次报告尝试横向对比数据分析师与数据科学家,将在两个职业的比较中回答假设问题,这样做的好处是使两种职业更饱满的展现在读者面前,因为问题的针对性比较强,对比的过程中也可以很清晰的解答问题,所以本次报告以这样的形式展现出来
数据分析师与数据科学家
上图中的语言与学历均以占比从高到低排列
薪资
首先拿到这个数据,自然要从大家最关心的工资说起:
首先可以看出来,两个职业在接触编程人员中都有中等的工资水平,数据科学家更是挤进了前十,总的来说是相当不错的薪资水平了
更细致的来看数据分析师与数据科学家的工资情况,科学家工资不管是均值还是中位数都稳超分析师,且高工资处分析师的离散程度远远大于科学家,也就是说数据科学家在高工资处的分布集中度更高
性别
对比前一章报告:Stack Overflow 用户画像分析(https://github.com/AAAlvin/Project_Folder/blob/数据之道%20-%20Stack的用户画像分析.md),不难看出,这两个职业的女性从业率都超过了编程行业的女性(4.8%)均值,且数据科学家甚至达到了两倍的样子,可以说是对女性非常友好的编程相关职业了,其中的原因有可能是很多专业是学习数学或者统计的朋友跨行业自学编程来到数据行业
从不同性别的薪资来看,首先对比其他职业可以看出这两个行业男女工资基本上已经持平,跟其他行业中男性比女性工资高很多的情况形成强烈对比;随后从两个职业的对比中可以看出,从数据分析师进阶到数据科学家,两个职业女性的工资上涨幅度远超男性,女性工资均值和中位数上涨了50%和70%,而男性上涨只有45%和16%
编程语言
输出了数据分析师与数据科学家使用语言蝴蝶图,将目前比较火的R和Python标亮显示,从中可以得出的东西还是非常多的:
首先看数据分析师这边,基本都是使用SQL和R,其次是使用EXCEL中的VBA,而python使用的情况只有不到6%,这和我现在了解到的数据分析师的情况大致相符,基本是多用SQL做数据提取工作,小数据使用EXCEL,数据量比较大的才考虑使用R或python,目前从数据看来,使用R的占了比较大的比重
再从数据科学家这边看,基本上使用python的比例激增到40%,大家应当熟知Python是机器学习的利器,多看中预测结果的准确性,而R多用作统计推断的语言,所以从语言使用占比来说,在科学家这边,机器学习一定是一个绕不开的技能,不然Python激增这么多很难有合理的解释
不难看出的还有一点就是,SQL在科学家中基本不在使用了,而VBA却仍有不小的比例,看来简单的取数据的工作要么科学家已经交给分析师来做,或者自己动手使用python爬虫,而小量的数据仍有可能使用VBA进行前期分析
目前来看处在分析师职位的朋友应当吧更多的精力放在SQL和R上,然后尽力不要丢掉EXCEL,毕竟这个是基础技能而且还非常耐用,然后在为数据科学家做准备的时候,Python是一定要深入学习的语言,同时深刻了解业务和机器学习,这些应该是从该数据集中展现出来的方向
学历
学历柱状图最明显的一点莫过于数据科学家的博士学位明显高于数据分析师和其他职业,可以说是门槛超高的一个职业了,大部分的科学家都接受了相当好的教育,本科以上的学历高达91%
数据分析师的学历基本属于平均偏上的水平,可以看到在硕士学位处35%的占比也很高的
综上数据分析师的学历门槛比较高,而科学家的门槛更高,分析师准备转行科学家的时候,磨练自己技术的同时还需要加强自己的专业知识也就是提升学历,边上班研究业务知识,边申请在职研究生或者博士课程也是可以选在的方向
编程时间相关
从两个行业在不同编程年龄的柱状图来看,编程时间在6年以下的以数据分析师居多,而接触编程语言超过6年后,当熟练掌握了算法和业务之后转行科学家的比例不断上升,看来6年之内分析师们是需要为自己的数据科学家做好技能规划
从上班使用电脑时间来看,基本两者相差不大,都属于业界平均水平,只不过在科学家在5-8小时的时候稍微多一点,超过12小时时候稍微少一点
总结与结论
数据分析师对自己目前的规划与未来的计划:
- 目前扎实掌握SQL与VBA,掌握业务相关知识与R语言,尝试对数据库有更多的了解;
- 技能树深化Python的学习,机器学习或深度学习需要提上日程;
- 有条件的情况下尝试在职研究生,学习统计学知识,掌握更全面、系统的理论知识;
低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。
持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。
转载内容版权归作者及来源网站所有,本站原创内容转载请注明来源。
- 上一篇
图数据库:释放互联数据的力量
【大咖・来了 第7期】10月24日晚8点观看《智能导购对话机器人实践》 【51CTO.com原创稿件】从Hadoop生态圈崛起开始,大数据已经热了十多年,大数据的存储、分析、处理等技术都已经比较成熟。发掘大数据之间的关联,以及关联后隐藏的商业价值,是大数据的真正意义所在,也是技术上的一大难点。 数据库做为组织、存储和管理数据的仓库,是大数据的基础和关键一环。数据库咨询公司 DB Engines 调研结果显⽰,图数据库正成为所有数据库管理系统中增长最快的⼀类。 图数据库更注重关系 图数据库,对于很多人来说还比较陌生。其实,图数据库是用图来存储数据,是最接近高性能的一种用于存储数据的数据结构方式之一。构成一张图的基本元素是节点(点)和关系(边)。节点和关系都可以设置自己的属性。节点经常被用于表示一些实体,但依赖关系也一样可以表示实体。节点之间的关系是图数据库很重要的一部分。通过关系可以找到很多关联的数据,比如节点集合、关系集合以及他们的属性集合。 举个例子,对于社会网络中人与人之间的关系来说,用关系型数据库存储这种数据的效果并不好,其查询复杂、缓慢、超出预期,而图数据库的独特设计恰恰弥补了...
- 下一篇
世界各主要国家及组织的大数据战略
【大咖・来了 第7期】10月24日晚8点观看《智能导购对话机器人实践》 当前大数据应用的成功案例主要集中在欧美发达国家,除技术突破和应用创新之外,大数据正逐渐引起公众意识形态的变革甚至社会结构的深层调整。受到世界各主要国家和地区的广泛关注,纷纷从国家层面提出具体的大数据发展战略。 由于大数据自身内涵发展迅速,随着存储设备、记录工具和分析技术的不断发展,其应用的深度与影响力也日新月异,各国在大数据战略也是基于国家整体发展趋势进行布局。 (1)美国: 2012年3月美国联邦政府推出“大数据研究和发展倡议”,其中对于国家大数据战略的表述如下:“通过收集、处理庞大而复杂的数据信息,从中获得知识和洞见,提升能力,加快科学、工程领域的创新步伐,强化美国国土安全,转变教育和学习模式”。作为响应,同年5月,奥巴马政府发布了“构建21世纪数字政府”战略规划,通过Data.gov平台的建设吸引更多参与者加入,同时以行政管理和预算局牵头推进政府自身的公共数据开放,2015年3月,联邦总务管理局公民服务与科技创新办公室旗下的18F创新小组,会同联邦数字服务中心、白宫科技政策办公室联名发布了关于政府网站的数字化...
相关文章
文章评论
共有0条评论来说两句吧...
文章二维码
点击排行
推荐阅读
最新文章
- CentOS7编译安装Cmake3.16.3,解决mysql等软件编译问题
- CentOS7编译安装Gcc9.2.0,解决mysql等软件编译问题
- Docker快速安装Oracle11G,搭建oracle11g学习环境
- CentOS8编译安装MySQL8.0.19
- MySQL8.0.19开启GTID主从同步CentOS8
- SpringBoot2全家桶,快速入门学习开发网站教程
- CentOS8,CentOS7,CentOS6编译安装Redis5.0.7
- CentOS7,CentOS8安装Elasticsearch6.8.6
- CentOS8安装MyCat,轻松搞定数据库的读写分离、垂直分库、水平分库
- Red5直播服务器,属于Java语言的直播服务器