机器学习工程师与数据科学家的大斗法
本文转载自公众号“读芯术”(ID:AI_Discovery)
随着人工智能的发展,市场上出现了一些新的工作岗位。但对于这些新兴领域的新兴职业,我们很多人难以分辨其间的不同之处,尤其是机器学习工程师和数据科学家的作用有何区别,这很令人困惑。
阅读了不同的文章、博客并观看了一些视频之后,笔者想通过对比二者之间的差异来更清晰地介绍它们。
先类比一下。作家和教授之间有什么区别?可以说这两者都知道一种语言的“规则和语法”,其中一个是讲故事的人,另一个是“规则”的严格实践者。
数据科学家对原始数据进行处理分析,连接点并使用其他可视化工具讲述故事。他们通常具有较广泛的技能,深入了解的知识不超过一两个。他们更多偏向是在创意方面,像一个艺术家。
机器学习工程师则将数据视为必须接收并能以某种适当的形式高效输出的东西。他们的技能需要与实施细节相关的高效。
两者之间可能有很多重叠之处,但数据科学家可以是机器学习工程师,反之则不然。也许随着他们获得更多经验,机器学习工程师就是数据科学家,这样的说法会实现。
机器学习与数据科学的维恩图
就洞察力或学习等方面而言,数据科学需要具有一定商业头脑的人才,而机器学习则需要关于系统预测的人才。例如:
- 数据科学:“在城镇的这一部分,每2英里约有一个加油站”
- 机器学习:“自从看到加油站以来,我们走了两英里,所以现在就要开始寻找另一个加油站”
接着再来看看Netflix的例子。
我们都知道Netflix会根据之前的选择来智能地推荐电影。该推荐系统可与机器学习算法配合使用,从而使用推荐系统提供合适的电影选择。
当谈论Netflix中的数据科学时,我们所要研究的模式包括在特定时间观看的评论者数量、其年龄和性别组成以及许多其他情况。这些决策用于改善业务前景。当企业需要借助数据来回答问题或解决问题时,数据科学家的工作就是从原始数据和非结构化数据中提供有用的见解。
数据科学家需要的技能:
- 统计
- 数据挖掘和清理
- 数据可视化
- 非结构化数据管理技术
- 编程语言,例如R和Python
- 了解SQL数据库
- 使用Hadoop、Hive和Pig等大数据工具
机器学习工程师需要的技能:
- 计算机科学基础
- 统计建模
- 数据评估和建模
- 了解和应用算法
- 自然语言处理
- 数据架构设计
- 文本表示技术
综上可见,数据科学家和机器学习工程师的工作还是有很大区别的,不要混淆它们。确定好自己所具有的技能条件和个人兴趣更适合哪个职位,并有意识地培养自己某个方向的技能,为未来做好准备。
低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。
持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。
转载内容版权归作者及来源网站所有,本站原创内容转载请注明来源。
- 上一篇
华为云郑叶来:优势挡不住趋势,技术创新是主旋律
2020年7月20日,华为云举办TechWave技术峰会。基于华为30年ICT技术积累和长期服务政企客户的经验,华为云阐述了面向未来的使命,为政企提供智能升级的最佳数字基础设施,并重磅发布了七大新品,包括应用平台ROMA、EI工业智能体2.0、GaussDB系列新品、数据使能解决方案、全球独家双零损耗裸金属容器、实时音视频服务(RTC)和华为云会议。 全栈技术创新,使能千行百业 今年突如其来的新冠疫情大大激发了各行各业对数字化、在线化、智能化的需求。Cloud 2.0时代,“云上生活”,“永远在线”成为新常态,数据算法和代码成为政企的核心资产。各方面的变化积累起来正在形成新的趋势,优势挡不住趋势!政企智能升级本质是获取新技术,发展新能力。具备规模化、快速迭代创新能力的云服务将给政企提供智能升级的新动能。 如何将澎湃技术浪涌转化为源源不断的产业升级动能,为业务发展打开更多增长空间?华为云提供基于擎天架构的1个云基础设施底座,3个赋能行业数字化转型的平台,4个面向行业场景化的联接触点,使能千行百业,为政企提供智能升级的最佳数字基础设施。 华为公司副总裁、华为云业务总裁郑叶来表示:“华为云通...
- 下一篇
新常态下软件定义的广域网与分析
随着客户转向云端和安全服务,对SD-WAN分析技术的依赖也在增长。 分析已从可有可无的功能变为必备的功能,尤其是在不断发展的SD-WAN领域,为了应对威胁和不断变化的网络状况,快速处理大量数据变得越来越重要。 “目前,要让SD-WAN发挥其作用,并实现其自动化和智能属性,这就需要具备实时的洞察力,而这种洞察力通常是通过目前许多解决方案所提供的可视性和分析工具实现的,这些解决方案或者是提供一些集成选项,或者通过第三方或生态系统合作伙伴提供。”国际数据公司(IDC)网络基础架构副总裁罗希特·麦赫拉(Rohit Mehra)说。 随着SD-WAN为不断增长的远程办公员工提供服务,这方面现在变得更加重要。国际数据公司最近的调查显示,95%的企业将在两年内使用SD-WAN技术,42%的企业已经部署了该技术。国际数据公司还表示,到2022年,SD-WAN基础设施市场规模将达到45亿美元,从现在到2022年,每年的增长率将超过40%。 麦赫拉说:“随着包括视频和物联网应用等云服务使用的迅速增加,同时在全球持续蔓延的疫情也加速了这些服务和应用的发展,广域网和远程连接仍然是企业IT部门的关键任务。” “...
相关文章
文章评论
共有0条评论来说两句吧...
文章二维码
点击排行
推荐阅读
最新文章
- CentOS关闭SELinux安全模块
- SpringBoot2初体验,简单认识spring boot2并且搭建基础工程
- SpringBoot2整合Redis,开启缓存,提高访问速度
- MySQL8.0.19开启GTID主从同步CentOS8
- Hadoop3单机部署,实现最简伪集群
- 设置Eclipse缩进为4个空格,增强代码规范
- CentOS7,CentOS8安装Elasticsearch6.8.6
- Linux系统CentOS6、CentOS7手动修改IP地址
- CentOS6,7,8上安装Nginx,支持https2.0的开启
- Windows10,CentOS7,CentOS8安装MongoDB4.0.16