数据科学的现在与未来-低调大师

数据科学的现在与未来

2020-06-18 697

数据科学是截至近年来技术领域中很具热度的方向之一。如果您拥有数据科学或者相关专业的工作经验及学位，那么只要大笔一挥、简历一发，一份薪酬可观的职位就会应手而得。但是，数据科学家能成为AI领域的长青树吗?或者说，几年之后围绕数据科学出现的这股热流终将消退?

在日前的AI播客中，Dun & Bradstreet公司高级副总裁兼首席数据科学家Anthony Scriffignano分享了自己作为数据科学从业者的工作状态，以及人工智能如何改变金融行业的前景、经历与见解。

数据科学的当前定位

在Dun & Bradstreet公司，Scriffgnano主要负责技术创新与开发工作，同时也管理着“世界上规模最大的同类商业数据库”项目。Scriffignano解释道，这套前所未有的数据库持续从全球各个国家(除朝鲜与古巴之外)收集大量数据，日均摄取达数百万次。

这套数据库融合了每一种语言与写入系统，而且由七套不同的集成化数据库共同组成。这一综合性数据系统在跟踪企业数据的同时，亦会对总体风险及发展机遇做出全球性观察分析。以此为基础，该数据库得以实现大规模数据分析，进而检测供应链异常以及客户购买行为中发生的变化。毫无疑问，要从如此庞大的信息库当中提取价值，数据科学将成为我们不可或缺的关键武器。

对于像Dun & Bradstreet这样的组织来说，最大的挑战之一在于如何寻找经验丰富的数据科学家，保证这些既拥有从业背景、又颇具实践经验的人才处理如此巨大的研究数据集。遗憾的是，目前的人才市场还无法满足他们对于数据科学技能的需求。

Scriffignano表示，他相信AI技术正在快速发展，并必将在未来逐渐取代熟练的数据科学家，进而实现技术本身的普遍化与大众化。在Scriffignano看来，成为一名成熟数据科学家所需要的技能，在范围与深度方面都要远远超过机器学习模型开发者。从本质上讲，真正的数据科学家需要专注于立足更广泛的问题从数据中提取价值;相比之下，目前很多自称数据科学家的从业者实际上更像是机器学习工程师，也更多关注机器学习模型开发方面的工作。

Scriffignano认为，我们需要更多关注数据科学家概念中的“科学家”部分。在他看来，数据科学家必须有能力从观察到的数据中提出新的问题或者理论，对这一理论进行实验设计与具体测试，而后得出结论并分享相关结果。Scriffignano注意到，大多数组织只要求数据科学家给出可重复使用的模型，他强调只有将数据科学家视为改进与创新工作中的关键，才能帮助组织迈向成功。他还指出，正是由于不愿放权让数据科学家们接触单纯模型开发之外的新领域，才导致众多组织长期无法真正在数据科学与AI技术领域取得进展。

挑战：治理与伦理

除了从大数据集中获取价值的问题之外，Scriffignano认为，人工智能与数据科学还面临着来自治理与伦理层面的诸多挑战。这一点在涉及个人信息时体现得尤其明显。在建立大型数据库并使用私人信息建立智能模型时，我们该如何保证以负责任的方式使用这些私人信息?

目前世界各国之所以开始以愈发严格的态度审查机器学习模型，一部分原因就是这类模型往往涉及大量隐私性与安全性因素。无论模型关注哪些具体特征，隐私与安全都已经成为无法回避的现实问题。Scriffignano提出一个有趣的观点，认为AI法规终将陷入为了满足需求而努力迎合所有人、又为了迎合所有人而产生更多需求的怪圈或者说泥潭。人们希望进一步提升模型的自定义空间与开发开放式，但又不愿意在隐私权方面做出妥协。

一部分企业与个人将从使用大量数据的模型当中受益，这些模型需要庞大的数据基础以做出更精确的预测，但这同时也将以获取大量私人信息为代价。有些人可能不希望自己的数据被囊括在这些模型当中，而这又反过来导致模型的精度有所下降。结果就是，面对机器学习模型的发展与所需数据量的扩展，总会有人对现状感到不满。

Scriffignano坚信，政府监管机构如果希望在保障国家安全的同时回避与隐私相关的问题，那么最好的办法是对技术发展抱有开放的态度。在世界上的不同地区，法律与法规的制定与细则总会存在很大差异，不同司法管辖区间对于道德伦理的认识同样可能不太一致。这种现象目前已经体现得相当明确：欧洲在道德伦理方面约束得最为严格，中国对隐私保护的关注度不高，而美国则处于二者之间。某些国家更希望强调隐私保护，而另一些国家则更重视国家安全或者经济发展。

正如Scriffignano所提到，其中的核心问题是，机器学习本身并不存在地理界限。在某个区域内完全不可接受的实践，在另一个地区则可能并无不妥。因此，模型的构建位置与使用位置也可以据此有所区分。毕竟模型的传播往往很难控制，所以这种低隐私要求区域生产、高隐私要求区域消费的作法很可能成为未来的通行方案。

在本次播客节目中，Scriffignano还表达了自己对于拟人化AI的厌恶之情。他更愿意选择较为务实的思路，这不禁让我们想起由算法与流程驱动的目前这波AI技术变革。Scriffignano以人工通用智能(AGI)为例，提出了自己的具体观点。他认为，如果我们无法以所掌握的大量数据为基础提出正确的问题，那么人工智能的真正突破永远无法到来。

他还预见出一种未来，认为专业人士将与AI携手并进。只要我们保持警惕，就不必担心彻底被机器或者机器人所取代。为了实现这样的美好未来，我们当然需要保持审慎的心态并高度重视数据伦理与治理问题。只有这样，AI才能真正成为通往全新时代的桥梁。

微信关注我们

原文链接：http://bigdata.51cto.com/art/202006/619190.htm

转载内容版权归作者及来源网站所有！

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。

高效IT：如何利用零代码开发平台快速搭建应用？

近年来，在软件开发技术领域，如何让开发实现“更通用、更低门槛、更高效率”逐渐成为焦点。现在很多企业应用程序的功能模块之间区别不大，为了提升开发效率，将这些功能模块的代码封装成组件，在快速开发平台上只需要拖拽组件就能够完成应用程序的开发工作，这样的平台被称之为零代码开发平台。通过拖曳字段设计应用走近“零代码” “零代码”并不是新概念，但正式被定义是在2014年，研究机构Forrester Research提出了“低代码/零代码”的内涵，即“利用很少或几乎不需要写代码就可以快速开发应用，并可以快速配置和部署的一种技术和工具”。Gartner随后又提出了aPaaS——与低代码/零代码非常吻合的概念。随着这一概念的不断推广，零代码领域呈现了空前蓬勃的发展趋势。一方面，专注于零代码技术的研发公司与日俱增，另一方面，越来越多的企业开始尝试以零代码技术重构业务应用。相较传统的软件开发模式，零代码开发平台的优势在于： l 无需编写代码。一般来说，有业务需求的人不是开发软件的人，具备软件开发能力的人对业务痛点并没有切身体会。在软件开发中，这一矛盾历来已久。零代码开发平台完全颠覆了传统开发模式，可以...

2020-06-18

865

自从冠状病毒危机以来，快速的互联网比以往任何时候都更加重要，但是世界上哪些城市对互联网最友好，并且在5G部署方面处于领先地位? Business Fibre对全球31个最受欢迎的目的地进行了详尽的研究，并应用了一系列指标来确定它们对互联网的友好程度。他们研究了诸如平均数据成本、免费wi-fi点数量、5G覆盖率、拥有免费wi-fi的餐馆数量以及平均下载和上传速度之类的问题。人们旅行时，互联网是保持联系并进行旅行工作的必不可少的工具。那么，哪个是世界上对互联网最友好的城市? 伦敦的免费Wi-Fi热点数量第二高，达到688126，而拥有免费Wi-Fi的餐厅数量最多，达到3981。伦敦在其5G网络及其上载速度方面也表现出色。总体排名第二的是日本东京，其次是巴黎，法国和新加坡。没有澳大利亚城市进入前十名。在排名前十的城市中，有五个位于亚洲，其中日本占据了其中的两个。欧洲位居前十名中的四个，包括阿姆斯特丹，巴塞罗那，纽约是唯一进入该名单的美国城市。韩国首尔以其5G覆盖率达到83个5G地点而遥遥领先。巴塞罗那是平均下载速度最快的城市，为59.2Mbps。阿姆斯特丹是平均上传速度...

2020-06-18

669

资源下载

更多资源

Mario

马里奥是站在游戏界顶峰的超人气多面角色。马里奥靠吃蘑菇成长，特征是大鼻子、头戴帽子、身穿背带裤，还留着胡子。与他的双胞胎兄弟路易基一起，长年担任任天堂的招牌角色。

Spring

Spring框架（Spring Framework）是由Rod Johnson于2002年提出的开源Java企业级应用框架，旨在通过使用JavaBean替代传统EJB实现方式降低企业级编程开发的复杂性。该框架基于简单性、可测试性和松耦合性设计理念，提供核心容器、应用上下文、数据访问集成等模块，支持整合Hibernate、Struts等第三方框架，其适用范围不仅限于服务器端开发，绝大多数Java应用均可从中受益。

Rocky Linux

Rocky Linux（中文名：洛基）是由Gregory Kurtzer于2020年12月发起的企业级Linux发行版，作为CentOS稳定版停止维护后与RHEL（Red Hat Enterprise Linux）完全兼容的开源替代方案，由社区拥有并管理，支持x86_64、aarch64等架构。其通过重新编译RHEL源代码提供长期稳定性，采用模块化包装和SELinux安全架构，默认包含GNOME桌面环境及XFS文件系统，支持十年生命周期更新。

Sublime Text

Sublime Text具有漂亮的用户界面和强大的功能，例如代码缩略图，Python的插件，代码段等。还可自定义键绑定，菜单和工具栏。Sublime Text 的主要功能包括：拼写检查，书签，完整的 Python API ， Goto 功能，即时项目切换，多选择，多窗口等等。Sublime Text 是一个跨平台的编辑器，同时支持Windows、Linux、Mac OS X等操作系统。