影响大数据、机器学习和人工智能未来发展的8个因素
【大咖・来了 第7期】10月24日晚8点观看《智能导购对话机器人实践》
人工智能和机器学习以及不断增加的数据量正在改变当前的商业和社会格局。这些领域中出现了许多需要CIO注意的主题和问题。
日前,O'Reilly 公司在伦敦Strata举办了一个为期数天的数据会议,与会者为此更好地了解大数据、机器学习(ML)和人工智能的发展方向。这些新兴技术在过去5年中发展迅速,而新技术、流程和应用程序改变了组织管理数据的方式。
此次数据会议提供了一个很好的技术发展晴雨表,与会者可以了解技术在大数据处理方面的作用,以及开发商和用户的关注点。此次大会还阐明了影响大数据、机器学习和人工智能未来发展的8个因素。
1. 5G将刺激机器学习的增长,并产生新的应用和服务
O'Reilly公司数据科学家和会议组织者Ben Lorica在会上表示,他认为5G技术的带宽和灵活性增加以及边缘计算将成为关键的推动因素。他指出,中国在这项技术方面成为全球领先的力量,但许多公司仍在为他们正在进行的5G投资制定商业模式。
2.改变数据科学家的技能组合
谷歌云决策科学家Cassie Kozyrkov在演讲中指出,随着机器学习工具的用户体验得到改善,数据科学家所需的技能将不再专注于专业化,而是更加专注跨孤岛工作的能力,并更加集成到业务方面。
3.线上和线下世界正在融合
阿里巴巴电子商务集团和亚马逊正在尝试推出线下实体商店,而实体商店仍在适应新的网络世界。电子商务团体的线下活动对于实体零售商来说是一种竞争性举动,而实体零售商的在线投资则具有防御性。在这一切全面展开之前,还有很长的路要走,但亚马逊和阿里巴巴等公司在大规模管理数据方面的专业知识为他们提供了关键优势。
4. 内部数据平台正成为增长和创新的关键
Lyft公司和BMW公司的数据科学家在会上的演讲表明,将数据平台置于新产品开发和业务流程管理的中心可以推动创新。虽然对于像Lyft这样的数字原生公司来说,这可能是很自然的事情,但随着数据生成传感器嵌入到产品中,传统的工业公司也不得不参与其中。
5.开放数据需要像开源软件一样认真对待
众所周知,开源软件背后是大数据和机器学习产品和服务的兴起。开放源码的商业和技术案例的重要性多年前就得到了证实。然而,人们对开放数据对创新的重要性的关注却少之又少。
开放式公司数据库提供商OpenCorporations公司联合创始人兼执行官Chris Taggart强调了企业在依赖专有数据集时遇到的问题,指出这些数据源可能是粗略的,并且元数据不会在产品间共享。开放数据更透明,不会将企业锁定在昂贵的商业合同中,而这些合同对于企业来说很难放弃。
6.捕获和管理实时数据的重要性
虽然人工智能和机器学习项目并不总是需要实时或接近实时的数据,但构建能够处理数据的系统的能力可能是一种具有价值的竞争优势形式。随着数据驱动的决策越来越多地嵌入到组织中,竞争优势有时会转移到那些能够对事件作出更快响应的组织中。亚马逊网络服务在这方面的规模和广度表明,实现这一点的工具变得越来越容易和便宜。
7. 法律和道德问题开始改变企业的创新方式
牛津大学Sandra Wachter博士在会上的演讲强调了一个问题,而在未来一两年内,这个问题可能会得到更多讨论。她指出,许多公司现在意识到他们有义务保护个人数据,因为GDPR法规等相关法律已经生效。然而,一个讨论较少的问题也是监管机构仍在努力解决的问题是,推理以及由嵌入式算法需要根据其处理的数据做出的决定。
至少在欧洲,用户有权查看持有的数据,并在不同程度上纠正或删除。但是,由于信用检查和健康保险等领域的数据,企业可能会自动对用户做出假设,因此用户没有相同的补救措施。
8.中小企业如何在大数据和算法决策时代竞争
人们需要思考的一个问题是,没有互联网巨头或全球快速消费品公司的海量数据集的中小公司如何能够在大数据和算法决策时代竞争。大公司利用网络服务的网络效应巩固其领先地位,这对于良性创新圈是一个风险,或许人们已经看到了这种风险。
然而,正如Unravel Data Systems联合创始人兼技术官Shivnath Babu所指出的那样,互联网和应用程序经济仍然能够允许中小公司利用其应用程序和在线活动中的数据,并对市场产生影响。也许这一点以及来自公共数据源的开放数据的兴起,将为新一代初创企业改变世界提供基础,就像谷歌、Facebook、亚马逊公司在过去20年所做的那样。
低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。
持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。
转载内容版权归作者及来源网站所有,本站原创内容转载请注明来源。
- 上一篇
大数据:学Hadoop好还是Spark好?
【大咖・来了 第7期】10月24日晚8点观看《智能导购对话机器人实践》 相信看这篇文章的你们,都和我一样对Hadoop和Apache Spark的选择有一定的疑惑,今天查了不少资料,我们就来谈谈这两种 平台的比较与选择吧,看看对于工作和发展,到底哪个更好。 一、Hadoop与Spark 1.Spark Spark是一个用来实现快速而通用的集群计算的平台。速度方面,Spark扩展了广泛使用的MapReduce计算模型,而且高效地支持更多计算模式,包括交互式查询和流处理。 Spark项目包含多个紧密集成的组件。Spark的核心是一个对由很多计算任务组成的、运行在多个工作机器或者是一个计算集群上的应用进行调度、分发以及监控的计算引擎。 2.Hadoop Hadoop是一个由Apache基金会所开发的分布式系统基础架构。用户可以在不了解分布式底层细节的情况下,开发分布式程序。充分利用集群的威力进行高速运算和存储。Hadoop的框架最核心的设计就是:HDFS和MapReduce。HDFS为海量的数据提供了存储,则MapReduce为海量的数据提供了计算。 二、异与同 解决问题的层面不一样 首先,...
- 下一篇
金融服务领域的大数据:即时分析
【大咖・来了 第7期】10月24日晚8点观看《智能导购对话机器人实践》 近年来,“大数据”这个术语似乎比其他IT术语都更加流行。这不仅是术语的传播,而且还有广泛的应用,并且很多公司似乎都想赶上创新的列车。无论人们称之为“大数据”、“数据科学”、“工业4.0”或任何其他诱人的术语,人们谈论的都是一样的事物:数据。 目前,还没有对大数据的具体定义,但是企业可以根据5个V来测试数据,如果他们拥有所有数据,那么他们其实采用的就是大数据。 这5个V是:数量、速度、种类、准确性、价值。然而,一些企业只停留在原有的3 个V:数量、速度、种类。遗憾的是,这些测试被认为无利可图,因为企业可能会在详细的分析上投入大量投资,但获得的价值很少,因此,启动它毫无意义。 大数据并不是每个商业等式的答案。但是,并非所有类型的数据都可以存储或用作大数据,例如:金融服务提供商每天存储客户银行转账等内容。这些数据不能称为大数据,它是任何一方无法共享或分析的个人数据。金融服务提供商在用户注册时存储用户的ID,这两者都不能称为大数据。这是企业内部数据,应存储在专用的数据仓库服务器中。另一方面,支出交易无疑可以被视为消费者行为...
相关文章
文章评论
共有0条评论来说两句吧...
文章二维码
点击排行
-
Docker使用Oracle官方镜像安装(12C,18C,19C)
- Springboot2将连接池hikari替换为druid,体验最强大的数据库连接池
- CentOS8编译安装MySQL8.0.19
- Docker快速安装Oracle11G,搭建oracle11g学习环境
- SpringBoot2配置默认Tomcat设置,开启更多高级功能
- MySQL8.0.19开启GTID主从同步CentOS8
- CentOS7,8上快速安装Gitea,搭建Git服务器
- Jdk安装(Linux,MacOS,Windows),包含三大操作系统的最全安装
- SpringBoot2编写第一个Controller,响应你的http请求并返回结果