基于Kubernetes的云上机器学习—GPU弹性扩缩容-低调大师

基于Kubernetes的云上机器学习—GPU弹性扩缩容

2019-04-21 695

前言

在深度学习中，要使用大量GPU进行计算。而GPU往往价格不菲，随着模型变得越复杂，数据量积累，进行深度学习计算需要耗费极大的经济和时间成本。

解决方案

阿里云容器服务提供的深度学习解决方案，基于Kubernetes为核心，支持cluster-autoscaler 进行节点弹性扩缩容。除了CPU，Memory 等基础指标外，还可以以GPU资源维度进行节点弹性扩缩容。
在深度学习常场景里，我们可以实现以下目标：

当出现计算高峰，集群中存量的GPU计算资源不满足需求时，自动按需求使用量弹出实例，加入到集群中。及时应对资源不足。
当计算任务完成，autoScaler 发现弹出的节点GPU资源闲置，我们能够及时回收闲置的GPU节点，节省成本。

如何使用

前提

需要您已创建好容器服务 Kubernetes集群。您可以选择经典版Kubernetes

微信关注我们

原文链接：https://yq.aliyun.com/articles/699244

转载内容版权归作者及来源网站所有！

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。

Kubernetes知识小普及

大部分概念Kubernetes官网都有详细介绍，Kubernetes中文官网 https://kubernetes.io/zh/docs/tutorials/kubernetes-basics/ 官网还提供一个比较好的功能是能在线互动，见互动教程，类似实操命令初步感受。 Kubernetes主要功能基于容器的应用部署、维护和滚动升级负载均衡和服务发现跨机器和跨地区的集群调度自动伸缩无状态服务和有状态服务广泛的 Volume 支持插件机制保证扩展性 Kubernetes是谷歌开源的容器集群管理系统 Kubernetes 提供了很多的功能，它可以简化应用程序的工作流，加快开发速度。使用Kubernetes只需一个部署文件，使用一条命令就可以部署多层容器（前端，后台等）的完整集群。核心概念 Kubernetes 主要由以下几个核心组件组成： etcd 保存了整个集群的状态； apiserver 提供了资源操作的唯一入口，并提供认证、授权、访问控制、API 注册和发现等机制； controller manager 负责维护集群的状态，比如故障检测、自动扩展、滚动更新等； sch...

2019-04-22

871

概述 nexus 是一个仓库管理器，除了最常用创建maven仓库的功能外，他还可以搭建docker仓库yum源仓库npm pip ruby仓库等等，今天我们用这个创建一个yum源仓库安装nexus 首先安装nexus，我使用的是docker方式，首先clone下面这个项目 git clone https://github.com/bboysoulcn/awesome-dockercompose.git 之后进入nexus目录，执行 docker-compose up -d nexus安装完成搭建软件源首先进入nexus 浏览器打开ip:8081 之后登陆，默认账号密码admin admin123 接着点设置->repository->create repository->yum(proxy)写入下面关键参数 name: 随便写remote storage: 我写的是中科大软件源，按照道理所有的软件源同级目录都可以https://mirrors.ustc.edu.cn/centos/ 之后点保存即可设置centos系统软件源我的做法是吧原先的软件源全部放入ba...

2019-04-22

883

资源下载

更多资源

优质分享App

近一个月的开发和优化，本站点的第一个app全新上线。该app采用极致压缩，本体才4.36MB。系统里面做了大量数据访问、缓存优化。方便用户在手机上查看文章。后续会推出HarmonyOS的适配版本。

Mario

马里奥是站在游戏界顶峰的超人气多面角色。马里奥靠吃蘑菇成长，特征是大鼻子、头戴帽子、身穿背带裤，还留着胡子。与他的双胞胎兄弟路易基一起，长年担任任天堂的招牌角色。

腾讯云软件源

为解决软件依赖安装时官方源访问速度慢的问题，腾讯云为一些软件搭建了缓存服务。您可以通过使用腾讯云软件源站来提升依赖包的安装速度。为了方便用户自由搭建服务架构，目前腾讯云软件源站支持公网访问和内网访问。

Spring

Spring框架（Spring Framework）是由Rod Johnson于2002年提出的开源Java企业级应用框架，旨在通过使用JavaBean替代传统EJB实现方式降低企业级编程开发的复杂性。该框架基于简单性、可测试性和松耦合性设计理念，提供核心容器、应用上下文、数据访问集成等模块，支持整合Hibernate、Struts等第三方框架，其适用范围不仅限于服务器端开发，绝大多数Java应用均可从中受益。