人工智能召唤“神龙”,阿里云发布首个云上异构超算集群
人工智能正在召唤“神龙”。3月21日,阿里云发布业内首个公共云异构超算集群——基于弹性裸金属服务器神龙X-Dragon的SCC-GN6,集群性能接近线性增长,将深度学习训练时间缩短至分钟级,可满足无人驾驶、智能推荐、机器翻译等人工智能场景的高性能计算需求。 阿里云发布首个异构超算集群 人工智能特别是深度学习,对算力的要求永无止境。但如果只是堆砌芯片,没有低延时网络、高速读写能力,大规模集群无法发挥出最大的计算性能,性能损耗通常在50%左右。且算力资源并不丰富,有研究显示,到2030年中国研究人员每人平均只能拥有1-2个GPU,大多数研究将受到计算能力的严重限制。 SCC-GN6是首个基于X-Dragon架构的超算异构产品,神龙云服务器与阿里云ECS、GPU云服务器等一起,最多可达512个节点,计算性能依旧接近线性增长,提供堪比超算中心的并行计算资源。 神龙异构超算集群性能接近线性增长 这不仅因为支持节点数量多,更因为集成多项自研技术:软硬结合的X-Dragon架构兼具性能和灵活性,50G RDMA超算网络降低网络延时,百万级IOPS性能的ESSD块存储提供低于百微秒的读写延时,高性能并...
