基于阿里云容器服务监控 Kubernetes集群GPU指标-低调大师

基于阿里云容器服务监控 Kubernetes集群GPU指标

2018-10-07 921

简介

当您在阿里云容器服务中使用GPU ECS主机构建Kubernetes集群进行AI训练时，经常需要知道每个Pod使用的GPU的使用情况，比如每块显存使用情况、GPU利用率，GPU卡温度等监控信息，本文介绍如何快速在阿里云上构建基于Prometheus + Grafana的GPU监控方案。

Prometheus

Prometheus 是一个开源的服务监控系统和时间序列数据库。从 2012 年开始编写代码，再到 2015 年 github 上开源以来，已经吸引了 20k+ 关注，2016 年 Prometheus 成为继 k8s 后，第二名 CNCF(Cloud Native Computing Foundation) 成员。2018年8月于CNCF毕业。
作为新一代开源解决方案，很多理念与 Google SRE 运维之道不谋而合。

操作

微信关注我们

原文链接：https://yq.aliyun.com/articles/647565

转载内容版权归作者及来源网站所有！

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。

玩转神龙服务器的Hyper-V虚拟化网络配置之保持虚拟机网络连通性

相信已经有同学已经在神龙上部署了Hyper-V了。又可以随心所欲的创建VM玩耍了。但是关于Hyper-V虚拟机的网络配置，相信还有一些同学没有玩过。首先，我们来简单介绍下Hyper-v的三种虚拟交换机的类型：外部交换机这种交换机允许虚拟机访问到真实的物理网络。虚拟机之间和Hyper-V Server (这里是我们的神龙物理机）也可以相互访问。 Hyper-V Server操作系统的直观变化:创建一个虚拟网卡，将真实网卡的所有协议转移到这个网卡上，真实网卡只保留 LLDP 协议和 Hyper-V Extensible Virtual Switch协议。真实网卡充当了虚拟交换机的角色。内部交换机这种交换机允许虚拟机以及Hyper-V Server之间相互访问。除非特殊配置，虚拟机无法访问真实网络。 Hyper-V Server操作系统的直

2018-10-07

865

1.遇到的问题-bash: ls: 未找到命令解决方法如下，可解决export PATH=/usr/local/sbin:/usr/local/bin:/sbin:/bin:/usr/sbin:/usr/bin:/root/bin 2.权限问题./bin/cryptogen:没有权限解决方法chmod +x ./bin/cryptogen 3.问题clean: line 12: tree: command not found解决方法yum -y install tree 4.问题docker-compose --version/usr/lib/python2.7/site-packages/requests/__init__.py:80: RequestsDependencyWarning: urllib3 (1.22) or chardet (2.2.1) doesn't match a supported version!把冲突的包卸掉然后再装一次requests pip uninstall urllib3pip uninstall chardetpip install requ...

2018-10-07

1028

资源下载

更多资源

Mario

马里奥是站在游戏界顶峰的超人气多面角色。马里奥靠吃蘑菇成长，特征是大鼻子、头戴帽子、身穿背带裤，还留着胡子。与他的双胞胎兄弟路易基一起，长年担任任天堂的招牌角色。

Spring

Spring框架（Spring Framework）是由Rod Johnson于2002年提出的开源Java企业级应用框架，旨在通过使用JavaBean替代传统EJB实现方式降低企业级编程开发的复杂性。该框架基于简单性、可测试性和松耦合性设计理念，提供核心容器、应用上下文、数据访问集成等模块，支持整合Hibernate、Struts等第三方框架，其适用范围不仅限于服务器端开发，绝大多数Java应用均可从中受益。

Sublime Text

Sublime Text具有漂亮的用户界面和强大的功能，例如代码缩略图，Python的插件，代码段等。还可自定义键绑定，菜单和工具栏。Sublime Text 的主要功能包括：拼写检查，书签，完整的 Python API ， Goto 功能，即时项目切换，多选择，多窗口等等。Sublime Text 是一个跨平台的编辑器，同时支持Windows、Linux、Mac OS X等操作系统。

WebStorm

WebStorm 是jetbrains公司旗下一款JavaScript 开发工具。目前已经被广大中国JS开发者誉为“Web前端开发神器”、“最强大的HTML5编辑器”、“最智能的JavaScript IDE”等。与IntelliJ IDEA同源，继承了IntelliJ IDEA强大的JS部分的功能。