从人工智能到云原生 NVIDIA正在布局超算领域
日前,在本周SC21高性能计算大会上最新发布的TOP500榜单上,NVIDIA技术为355套超级计算机系统提供加速,占榜单的70%以上,而新增系统中90% 以上都采用了NVIDIA 的技术。对比6月份发布的TOP500榜单上342个系统(占榜单68%)使用NVIDIA技术,增长趋势明显。
NVIDIA在全球最节能系统Green500榜单上也继续保持领先优势,占据了榜单排名前25名系统中的23套,与6月份持平。平均来看,采用NVIDIA GPU的系统能耗效率比非GPU系统高3.5倍。
除此之外,NVIDIA在本届SC21高性能计算大会上还有不少发布,下面我们一起关注一下。
人工智能助力科学领域
另外,人工智能正带来一场科学计算的革命。近年来,研究高性能计算和机器学习的论文数量激增,从2018年的约600篇增长到2020年的近5000篇。
HPL-AI、MLPerf HPC等新基准也强调了高性能计算和AI工作负载的持续融合。
作为一个融合了高性能计算和人工智能工作负载的新基准,HPL-AI使用了深度学习和许多科学与商业工作的基础——混合精度计算,同时还提供高性能计算基准传统的标准标尺——双精度计算的高度准确性。
MLPerf HPC基准适用于通过AI实现超级计算机模拟加速和增强的计算方式,主要被用来测试高性能计算中心天体物理学、天气和分子动力学三大关键工作负载的性能表现。
NVIDIA通过GPU加速处理、智能网络、GPU优化应用程序和支持AI和高性能计算融合的库来解决整个堆栈的问题。这一方法提升了工作负载的性能表现,并推动了科学突破。
GPU的并行处理能力再加上超过2500个GPU优化应用程序,在多数情况下可以让用户把高性能计算任务的时间从几周减少到几小时。加上NVIDIA持续优化CUDA-X库和GPU加速应用程序,用户GPU架构性能还会有进一步提升。
通过全栈创新,NVIDIA可助力超级计算机在科学应用程序上实现高达16倍的性能提升。
NVIDIA通过NGC目录中的容器提供最新版本的人工智能和高性能计算软件。用户只需在数据中心或云端的超级计算机上拖拽并运行应用程序,即可实现性能的快速提升。
云原生超级计算
NVIDIA还在SC21大会发布了最新云计算原生超级计算机,能够兼顾运算性能与多租户使用的需求,在不牺牲性能的前提下完成多人同时使用的应用方式。
NVIDIA在SC21超级电大会的演说中提到,随着通过GPU进行加速运算,以及Scale Up、Scale Out等扩展,以及导入机器学习,都大幅提升模拟运算的性能。然而这类高性能计算大多以裸机运算的形式进行,不像云计算原生能够以虚拟化、容器化的方式简化管理并满足多租户的使用需求。
NVIDIA通过由Quantum-2交换机、ConnectX-7网卡、BlueField-3资料处理器(DPU)及DOCA软件组成的Quantum-2 400Gbps InfiniBand网络平台,将网络与资料吞吐相关的工作转移至DPU,让运行于云计算原生环境的程序也能完全发挥性能。
在SC21的演说中,NVIDIA也提到了先前在GTC 21秋季展发布的Earth-2超级计算机与地球数字孪生,但并没有提供更多详细信息。
与Atos成立卓越人工智能实验室
人工智能在高性能计算中的应用能帮助研究人员加快模拟速度,同时保持传统模拟方法的准确性。
在此背景下,Atos和NVIDIA宣布成立卓越人工智能实验室(Excellence AI Lab,简称EXAIL),该实验室将汇聚一批科学家和研究人员,助力推进欧洲计算技术、教育和研究的发展。
该实验室的首批研究项目将集中在高性能计算和AI的进步所推动的五大关键领域:气候研究、医疗和基因组学、与量子计算的结合、边缘人工智能/计算机视觉以及网络安全。
Atos公司将利用NVIDIA基于Arm架构的Grace CPU、NVIDIA下一代GPU、Atos BXI E级互联技术和NVIDIA Quantum-2 InfiniBand网络平台,开发一台E级计算级别的BullSequana X超级计算机。
一、预测和解决气候变化问题
为了更准确地预测气候变化,来自Atos和NVIDIA的研究人员将在欧洲最快的超级计算机——Jülich超级计算中心上,运行新的AI和深度学习模型。这种巨型模型可用于预测极端天气事件的演变、及其随全球变暖而发生的变化,而这些将极大地受益于E级计算。
JUWELS Booster系统基于Atos的BullSequana XH2000平台,拥有近2.5 exaflops的AI性能,搭载3744个NVIDIA A100 Tensor Core GPU,并采用NVIDIA Quantum InfiniBand网络,将有助于更深入地了解气候变化,并对飓风、极端降水、炎热和寒潮等事件进行更准确的长期预测。
二、利用高性能计算、量子和AI加速医学研究
利用计算基因组学助力实现医学突破,正在彻底改变药物研发和医疗领域。Atos生命科学卓越中心已经与40家领先机构合作,利用高性能计算、量子计算和AI来推进医学成像、基因组学和制药领域的发展。NVIDIA Clara 医疗应用框架可为基因组学、医学成像和计算化学应用提供超级计算性能。
EXAIL将利用Atos的先进计算解决方案和NVIDIA Clara,帮助医疗研究人员和供应商利用嵌入式、边缘、数据中心和云平台,加速药物研发并设计先进的诊断解决方案。
三、推进量子研究
量子计算有望解决药物研发、气候研究、机器学习、物流和金融等领域的复杂问题。但在量子计算机变得可行之前,还有很多研究工作需要开展。
Atos的量子机器学习是为即将到来的量子计算机时代开发的量子软件开发和模拟设备,使研究人员和工程师能够开发和实验量子软件。它将使用NVIDIA GPU助力大幅提高量子模拟的速度和规模。这将加速量子算法、量子信息科学、新的量子处理器架构以及量子-GPU混合系统架构的研究。
四、加速计算机视觉
利用Atos的边缘设备,例如其在NVIDIA BlueField DPU上运行的BullSequana Edge,EXAIL的研究团队将协力加速计算机视觉和5G无线基础设施。Atos全球六个专门研究计算机视觉的实验室将配备最新NVIDIA Fleet Command技术,用于在分布式边缘基础设施上安全地部署和管理AI应用。
写在最后
在SC21高性能计算大会上可以看出,从科学模拟、数据分析再到机器学习、深度学习等技术的发展和应用,正在推动超级计算中心、云服务提供商和企业重新思考他们的计算架构。有一点值得注意的是,超算不仅被用在科研,也开始在产业应用上取得进展。而NVIDIA在全栈计算方面的布局,使其开始发挥出更广泛的价值。

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。
持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。
转载内容版权归作者及来源网站所有,本站原创内容转载请注明来源。
- 上一篇
DevOps初创公司,这十家值得关注
DevOps是一种软件开发和IT运营的结合体,是一个越来越受欢迎和需求增长的领域。软件和应用是企业IT架构转型以支持更快开发生命周期的一个首要考虑因素,也是当今高效执行和更有效竞争的一个关键要素。 当前市场中涌现了很多专注于DevOps的公司,他们拥有创新的、简化的工具和平台,可用于简化补丁和更新流程、归档和发布代码、配置可扩展的基础设施,同时确保整个过程中的安全性。如今的DevOps平台越来越注重打破开发和运营团队之间的孤岛。 下面就来看看这10家在应用软件开发方面拥有自己一套方法论的DevOps技术初创公司。 CTO.ai——CTO.ai成立于2017年,总部位于加拿大温哥华,主要提供无服务器的基础设施,旨在满足开发团队对衡量软件交付可扩展性方面的需求。CTO.ai提供的命令、管道、服务和洞察力。让开发人员可以轻松地将GitOps和ChatOps工作流程进行集成,以创建更智能的工作流程。据CTO.ai称,现有的DevOps工具可以直接接入CTO.ai的平台,从而在整个DevOps周期中实现自动化。 CTO.ai迄今为止已经在两轮融资中总共筹集了750万美元资金,最近一次是在2019...
- 下一篇
美国防部重启云计算合同竞标亚马逊、谷歌、微软受邀参加
当地时间本周五,负责政府采购事宜的美国总务管理局(GSA)对外表示,美国国防部已向亚马逊、谷歌、微软以及甲骨文等公司发出邀请,以竞标新的商业云计算合同。新的项目名为“云联合作战能力”(Joint Warfighting Cloud Capability, JWCC)。 此前,五角大楼曾发起“联合企业防御基础设施”(Joint Enterprise Defense Infrastructure,简称 JEDI)项目的竞标,最终由亚马逊和微软参与竞争,微软于2019年赢得了这一合同,但随后亚马逊将五角大楼告上法院,美国联邦法院叫停了这一项目的执行,最终五角大楼取消了这一价值上百亿美金的合同。 或许是受上次项目失败的影响,此次的JWCC合同将避免上述情况的出现。GSA在声明中表示:“政府预计将授予两份不定期交付/不确定数量(IDIQ)的合同,分别授予AWS和微软,但也可能将其授予所有能够满足国防部要求的云服务提供商(CSP)。” 对此,受邀参加竞标的谷歌和甲骨文两家公司均作出了表态。甲骨文发言人表示很高兴能加入JWCC合同的竞标。谷歌发言人则指出,该公司计划竞标军事合同,并称美国国防部是世界...
相关文章
文章评论
共有0条评论来说两句吧...
文章二维码
点击排行
推荐阅读
最新文章
- Hadoop3单机部署,实现最简伪集群
- CentOS7,CentOS8安装Elasticsearch6.8.6
- CentOS8,CentOS7,CentOS6编译安装Redis5.0.7
- SpringBoot2编写第一个Controller,响应你的http请求并返回结果
- 2048小游戏-低调大师作品
- SpringBoot2更换Tomcat为Jetty,小型站点的福音
- CentOS7安装Docker,走上虚拟化容器引擎之路
- Docker快速安装Oracle11G,搭建oracle11g学习环境
- CentOS7编译安装Gcc9.2.0,解决mysql等软件编译问题
- CentOS关闭SELinux安全模块