2017年数据领域的八大发展趋势
在2017年数据社区将会有大量的机会出现,并伴随一些危机性的挑战,下面是对上述问题的纵观。
1.更多的数据科学家将开始使用深度学习
纵观2016年深度学习领域所取得的主要成就,与那些让深度学习变得更加简单的工具发布,以及直接让现有大数据平台和架构整合在一起的工具。显而易见,数据科学家在2017年已不得不选择深度学习,因为通过它可实现的价值已经愈来愈多。看看时间序列和事件数据(包括异常检测),物联网以及传感器相关的数据分析,语音识别,以及文本挖掘推荐,深度学习的用例还有很多。
2.对数据工程相关技能的需求将会持续上升
《哈佛商业评论》杂志在2012年的时候将数据科学家称为“21世纪最性感的职业”,但愿在2017年里对数据科学家的需求会延续下去,但是人才需求将会主要集中在数据工程师(远多于数据科学家)。许多公司在寻找会编程的数据科学家,从而将会需要更多的可以接触生产系统的数据科学家。这些是独一无二的技能,他们也同样会获得除了薪水之外的快乐。
3.越来越多的公司将会在云端使用托管服务
一项最新的O’Reilly调查显示,一个组织在云端感受完大数据之后,往往会催生出更多类似的大数据服务。
现如今很多公司都接触了能够提供存储、数据处理、可视化、分析以及人工智能的托管服务。虽然业内已存在很多可以解决这些问题的开源组件,但专有的托管服务逐渐被证明成为了大众的选择。因为这些工具将会被服务提供商所管理,机构内部的数据专业人士将能够关注手头的问题而不用考虑需要使用什么样的工具——不过他们得学习如何设计、搭建以及管理在云端运行的应用。
4.并不是所有的东西都会迁移到公共云
遗留系统、敏感的数据、安全、合规以及隐私问题将会需要一个混合的架构。这里同样会存在使用定制甚至是私有云的应用,就像为工业物联网设计的Predix或者AWS的CIA。许多公司将会需要能够应对复杂情况的解决方案架构。
5.数据的民主化:任务因工作更简单而简化
提供自助分析的新工具使得许多数据分析的任务变的更加简单。有一些甚至都不需要编程,同时另外一些工具使得在一个工作流下融合代码、图像和文本变得更加简单。这些并不是统计学家或者数据极客的授权用户们做着常规的数据分析,让数据专家们有了更多的时间去处理复杂的项目或者去优化端到端的传输途径和应用。
在这几年里这一切都在发生,我们发现许多使得先进的分析更加民主化的工具正在兴起(譬如微软的Azure),能够支持对大规模的流数据资源进行采集,还使得先进的机器学习能够得到发展和应用(像谷歌的Cloud Platform和亚马逊的Machine Learning)。
6.储存和计算的分离将会加速
加州大学伯克利分校的AMPlab项目在去年十一月已经完成,但是在Apache Spark和Alluxio背后的团队并不是唯一一个强调存储和计算相分离。正如上面所说的那样,存储在云端的流行项目甚至一些最新的深度学习架构使得这个典范更加突出。
7.笔记本和工作流工具会的得到持续的发展
Jupyter的笔记本因为具有能够提供可以解决包括数据清洗、转换、数字化的仿真、统计学模型和深度学习在内许多问题的多元化架构而被数据科学家们使用和重组。(譬如O’Reilly使用Jupyter笔记本作为Oriole Interactive Tutorials的基础)。它对数据小组来说十分有用,因为在notebook里能够创造和分享包含动态代码、公式、可视化和说明性文本在内的文件。通过将Jupyter和Spark连接,你将能够通过简单接口使用Spark编写Python代码而不是使用Linus的命令输入或是Spark shell。
数据专家们将会一直使用多样化的工具。Beaker笔记本能够支持很多编程语言,现在还有将Spark社区作为目标的复合笔记本。(Spark Notebook、Apache Zeppelin及Databricks Cloud)。但并不是所有的数据专家都使用笔记本:因为笔记本不能适应对复杂数据渠道的管理,工作流工具更加适合这点。数据工程师门喜欢软件开发者使用的工具。随着深度学习和其他新技术进入数据科学和大数据社区,我们估计现存的工具将会得到进一步的发展和优化。
8.数据社区将会进一步找出方法来解决像隐私和伦理道德一样的问题。
由于机器学习的普及化、数据资源的多样化以及算法的复杂化,使得透明度变得越来越难实现。在数据应用中实现公平变得比以往更加具有挑战性。纵观2017年我们希望能够看到涉及以下几个方面的国家政策的讨论:对偏见测试的最佳实践以及偏向的理论导致偏向结果的意识在不断提升。
本文转自d1net(转载)

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。
持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。
转载内容版权归作者及来源网站所有,本站原创内容转载请注明来源。
- 上一篇
无服务器:云计算下一步的演变
行业专家在世界各地的会议中,以及与同事,客户,合作伙伴的沟通交流中,感觉到了业界对无服务器计算的困惑。 人们对于这种新架构如何革新组织处理开发和创新的方式,期望很高,并且稳步增长。 定义无服务器 首先,需要知道“无服务器”本身有点用词不当。当然身在幕后的服务器确实是存在的。但是你会看到,它们被抽象为开发人员不必解决操作上的问题,而是专注于编写代码的创造力。 考虑支持无服务器架构的概念的一种方法是将它们看作位于现有计算,网络和存储资源顶部的三层:结构,框架和功能。 1.无服务器架构从开发者的板块中删除了传统的操作功能和关注点,并允许他们专注于他们擅长的:为应用程序编写漂亮的代码。 2.事件驱动的编程模型为创建代码提供了一个框架。这对于具有大量输入和输出的诸如物联网的适应性应用是理想的。框架用来管理正在编写的代码的原因和结果。 3.作为服务的功能提供组装应用所需的包,模式和参考架构。这是代码,逻辑和大脑背后的效果,并得到适当的反应。 无服务器计算的好处 人们可能已经开始想象无服务器提供的好处: •可扩展性:在无服务器环境中,扩展应用程序以满足用户需求的能力,由托管代码的平台来处理。如果应用...
- 下一篇
十大关键词道破2016年安防状况
2016,注定是个平凡的一年,这一年,安防成长有序,并未出现巨大 波动。2016,更注定是个不平凡的一年,起着承上启下的作用;对上,深入消化了往年的经验及技术积累,对下,则用沉淀而来的新技术、新应用、新机遇开启了属于中国的安防新篇章。在2016年即将离去之时,谨以此文章祭奠过去一年同仁们为之所付出的辛劳与汗水,让我们共同迎接新的辉煌。 1、全球第一 根据a&s发布的2016年全球安防50强名单显示,海康威视2015年度营收跃居全球安防企业榜首(252亿);而霍尼韦尔的消防和安防产品/系统业务营收下降到了第二位,博世安防系统依旧排名第三。 经过多年产品质量提高和技术强有力研发,海康威视已经成为一个端到端的视频监控供应商,能够为各种类型的市场和安防垂直行业量身定制产品和方案,并基于视频监控向着综合解决方案供应商角色转变。现在,海康威视的子公司已经遍布全球各大州的主要国家。海康威视与其竞争对手大华股份(2015年排名上升至全球第四位),以及其他中国安防制造商都正在加快全球安防产业的布局及竞争。 海康威视今天的成就,不仅仅代表了其在全球安防的地位,也是中国安防崛起的代表,同时更是中国改革开放3...
相关文章
文章评论
共有0条评论来说两句吧...
文章二维码
点击排行
推荐阅读
最新文章
- Springboot2将连接池hikari替换为druid,体验最强大的数据库连接池
- CentOS关闭SELinux安全模块
- SpringBoot2更换Tomcat为Jetty,小型站点的福音
- SpringBoot2编写第一个Controller,响应你的http请求并返回结果
- SpringBoot2初体验,简单认识spring boot2并且搭建基础工程
- CentOS7,8上快速安装Gitea,搭建Git服务器
- SpringBoot2配置默认Tomcat设置,开启更多高级功能
- Docker快速安装Oracle11G,搭建oracle11g学习环境
- SpringBoot2整合Redis,开启缓存,提高访问速度
- CentOS8安装MyCat,轻松搞定数据库的读写分离、垂直分库、水平分库