Cray将集成分析套件带入高端超级计算机-低调大师

Cray将集成分析套件带入高端超级计算机

2017-08-01 495

超级计算机制造商Cray近日宣布一款针对其XC超级计算机家族的分析软件套件，包括各种图形分析、深度学习和大数据分析工具。

有了Cray Urika-XC软件套件，分析和人工智能工作负载就可以与科学建模以及模拟一起运行，而无需在系统之间迁移数据。这让用户可以在像天气预报、预测维护、医疗模拟以及欺诈检测等领域中运行融合的分析和模拟工作负载。

"你可以运行高性能计算模拟，然后运行对相同的数据集运行分析处理，而无需迁移这些数据，"Cray公司分析及人工智能产品战略总监Tim Barr表示。另外一个价值定位即简化安装。"不用担心安装、配置或者构建集群的步骤，我们将所有这些复杂性都拿掉了。"

尽管Cray有商业客户，但是其核心客户群是政府机构、学术机构和科研机构。XC系列超级计算机具有集群架构，可以实现每个系统超过500 petaflops的持续性能。1 petaflop相当于每秒一千万亿次浮点运算。该系统采用英特尔至强处理器、英特尔至强Phi处理器以及Nvidia Tesla图形处理单元加速器。

Cray提供的软件包涵盖Cray Graph Engine、Apache Spark、BigDL面向Spark的分布式深度学习框架、分布式Dask并行计算库，用于分析和Python Scala、Java和R语言。Cray表示，将提供对该软件套件的全方位支持。大多数软件都是现成的开源代码，除了Graph Engine，这是一个内存语义图数据库，包括Cray专有的针对大规模图形问题的扩展。

Barr表示，由于要求本地存储，所有并不支持Hadoop。XC没有节点上的磁盘，其Lustre文件系统并不是针对Hadoop Dsitributed File System优化的。"对于Hadoop数据湖来说有有点过了。"

Cray的这个软件包主要瞄准了现有的客户群，"有很多客户需要查看使用率，因为他们在处理器生命周期内投入了重资。这让他们要在已经采购的系统之间迁移更多的工作负载。"

Cray Urika-XC软件套件将在第三季度供货，定价信息未公布。

原文发布时间为：2017年6月22日

本文作者：刘新萍

本文来自云栖社区合作伙伴至顶网，了解相关信息可以关注至顶网。

微信关注我们

原文链接：https://yq.aliyun.com/articles/201290

转载内容版权归作者及来源网站所有！

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。

Spark UDF变长参数的二三事儿

在复杂业务逻辑中，我们经常会用到Spark的UDF，当一个UDF需要传入多列的内容并进行处理时，UDF的传参该怎么做呢? 下面通过变长参数引出，逐一介绍三种可行方法以及一些不可行的尝试... 引子变长参数对于我们来说并不陌生，在Java里我们这么写 publicvoidvarArgs(String...args) 在Scala里我们这么写 defvarArgs(cols:String*):String 而在Spark里，很多时候我们有自己的业务逻辑，现成的functions满足不了我们的需求，而当我们需要处理同一行的多个列，将其经过我们自己的逻辑合并为一个列时，变长参数及其变种实现可以给我们提供帮助。但是在Spark UDF里我们是无法使用变长参数传值的，但之所以本文以变长参数开头，是因为需求起于它，而通过对它进行变换，我们可以使用变长参数或Seq类型来接收参数。下面通过Spark-Shell来做演示，以下三种方法都可以做到多列传参，分别是变长参数(接受array类型) Seq类型参数(接受array类型) Row类型参数(接受struct类型) 变长参数类型的UDF 定义...

2017-08-02

594

1、HDFS文件的权限以及读写操作 HDFS文件的权限：与Linux文件权限类似 r: read; w:write; x:execute，权限x对于文件忽略，对于文件夹表示是否允许访问其内容如果Linux系统用户zhangsan使用hadoop命令创建一个文件，那么这个文件在HDFS中owner就是zhangsan HDFS的权限目的：阻止好人错错事，而不是阻止坏人做坏事。HDFS相信，你告诉我你是谁，我就认为你是谁 HDFS文件的读取： HDFS文件的写入： HDFS文件存储：两个文件，一个文件156M，一个文件128在HDFS里面怎么存储？ –Block为64MB –rapliction默认拷贝3份 HDFS文件存储结构： 2、HDFS下的文件操作（1）列出HDFS文件通过“-ls”命令列出HDFS下的文件 wu@ubuntu:~/opt/hadoop-0.20.2$bin/hadoopdfs-ls （2）列出HDFS目录下某个文档中的文件此处展示的是“-ls 文件名”命令浏览HDFS下名为in的文档中的文件 wu@ubuntu:~/opt/hadoop-0.20.2$...

2017-08-02

617

资源下载

更多资源

Mario

马里奥是站在游戏界顶峰的超人气多面角色。马里奥靠吃蘑菇成长，特征是大鼻子、头戴帽子、身穿背带裤，还留着胡子。与他的双胞胎兄弟路易基一起，长年担任任天堂的招牌角色。

腾讯云软件源

为解决软件依赖安装时官方源访问速度慢的问题，腾讯云为一些软件搭建了缓存服务。您可以通过使用腾讯云软件源站来提升依赖包的安装速度。为了方便用户自由搭建服务架构，目前腾讯云软件源站支持公网访问和内网访问。

Rocky Linux

Rocky Linux（中文名：洛基）是由Gregory Kurtzer于2020年12月发起的企业级Linux发行版，作为CentOS稳定版停止维护后与RHEL（Red Hat Enterprise Linux）完全兼容的开源替代方案，由社区拥有并管理，支持x86_64、aarch64等架构。其通过重新编译RHEL源代码提供长期稳定性，采用模块化包装和SELinux安全架构，默认包含GNOME桌面环境及XFS文件系统，支持十年生命周期更新。

Sublime Text

Sublime Text具有漂亮的用户界面和强大的功能，例如代码缩略图，Python的插件，代码段等。还可自定义键绑定，菜单和工具栏。Sublime Text 的主要功能包括：拼写检查，书签，完整的 Python API ， Goto 功能，即时项目切换，多选择，多窗口等等。Sublime Text 是一个跨平台的编辑器，同时支持Windows、Linux、Mac OS X等操作系统。