构建Tensorflow RDMA的Docker镜像-低调大师

构建Tensorflow RDMA的Docker镜像

2019-01-28 839

RDMA是一个远程通讯技术，它通过Kernel bypass等方式降低数据传输中的延迟和CPU消耗。
在分布式训练中，由于多个Worker之间或者Worker和Paramater Server 之间需要大量传输模型变量。当GPU到达一定数量后，受制于网络带宽以及TCP协议的延迟，通讯往往会成为计算性能的瓶颈，而在分布式训练中使用RDMA技术能够非常明显地提高训练速度。

Tensorflow

Tensorflow是谷歌开源的深度学习框架，它有丰富的平台支持和API，也可以非常轻松地构建分布式模型训练。
Tensorflow 在实现里支持RDMA作为其分布式场景的通讯协议，但是官方镜像默认没有支持RDMA。需要重新构建tensorflow，并开启RDMA相关的构建参数。 Tensorflow 对 RDMA的支持和实现协议参见文档： htt

微信关注我们

原文链接：https://yq.aliyun.com/articles/689246

转载内容版权归作者及来源网站所有！

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。

阿里云Kubernetes容器服务上体验Knative

概述 Knative Serving是一种可缩放至零、请求驱动的计算运行环境，构建在 Kubernetes 和 Istio 之上，支持为 serverless 应用、函数提供部署与服务。Knative Serving的目标是为Kubernetes提供扩展功能，用于部署和运行无服务器工作负载。下面讲述一下在阿里云Kubernetes容器服务基础之上，如何快速搭建一套Knative Serving环境并进行自动扩容的体验。搭建Knative Serving 1.准备Kubernetes环境阿里云容器服务Kubernetes 1.11.5目前已经上线，可以通过容器服务管理控制台非常方便地快速创建 Kubernetes 集群。具体过程可以参考创建Kubernetes集群。 2.部署Istio Knative serving运行需要基于Istio，

2019-01-28

871

GPU云主机集成CUDA & NVIDIA DOCKER镜像方案一、预安装前置条件1、系统和内核版本支持2、 CUDA的GPU支持二、NVIDIA驱动环境安装 1、安装CUDA Toolkit2、设置cuda环境变量3、安装 docker-18.06.14、安装NVIDIA docker plugin三、驱动环境检视1、 cuda驱动环境检视2、 cuda设备用例查询3、docker插件安装环境检视4、NVIDIA docker plugin用例测试四、NGC测试1、运行tensorflow容器2、用例功能测试五、GPU云主机产品新增CUDA和NVIDIA-DOCKER自定义镜像功能1、产品交互形态2、CUDA自定义镜像制作方案3、NVIDIA DOCKER自定义镜像制作方案一、预安装前置条件1、系统和内核版本支持 cat /etc/*release uname -a 2、CUDA的GPU支持 lspci | grep -i nvidia 二、环境集成安装1、安装CUDA Toolkitrpm -i cuda-repo-rhel7-9-1-local-9.1.85...

2019-01-28

661

资源下载

更多资源

Mario

马里奥是站在游戏界顶峰的超人气多面角色。马里奥靠吃蘑菇成长，特征是大鼻子、头戴帽子、身穿背带裤，还留着胡子。与他的双胞胎兄弟路易基一起，长年担任任天堂的招牌角色。

腾讯云软件源

为解决软件依赖安装时官方源访问速度慢的问题，腾讯云为一些软件搭建了缓存服务。您可以通过使用腾讯云软件源站来提升依赖包的安装速度。为了方便用户自由搭建服务架构，目前腾讯云软件源站支持公网访问和内网访问。

Spring

Spring框架（Spring Framework）是由Rod Johnson于2002年提出的开源Java企业级应用框架，旨在通过使用JavaBean替代传统EJB实现方式降低企业级编程开发的复杂性。该框架基于简单性、可测试性和松耦合性设计理念，提供核心容器、应用上下文、数据访问集成等模块，支持整合Hibernate、Struts等第三方框架，其适用范围不仅限于服务器端开发，绝大多数Java应用均可从中受益。

WebStorm

WebStorm 是jetbrains公司旗下一款JavaScript 开发工具。目前已经被广大中国JS开发者誉为“Web前端开发神器”、“最强大的HTML5编辑器”、“最智能的JavaScript IDE”等。与IntelliJ IDEA同源，继承了IntelliJ IDEA强大的JS部分的功能。