nvitop —— GPU 进程管理的一站式解决方案
nvitop 是一种交互式 NVIDIA 设备和进程监控工具。它有一个丰富多彩的信息界面,可以不断更新设备和进程的状态。作为资源监控器,它包含许多功能和选项,例如树视图、环境变量查看、进程过滤、进程指标监控等。除此之外,该软件包还为深度学习研究人员提供了 CUDA 设备选择工具nvisel。它还提供方便的 API,允许开发人员编写自己的监控工具。 特性: 信息丰富且精美的输出:显示比nvidia-smi彩色精美方框绘图更多的信息。 监控模式:可以作为资源监控器运行,而不是只打印一次结果。 条形图和历史图 过程排序 过程过滤 通过击键向进程发送信号 GPU 进程及其父进程的树视图屏幕 环境变量屏幕 帮助屏幕 鼠标支持 交互式:在监控模式下响应用户输入(来自键盘和/或鼠标)。(对比gpustat和py3nvml) 高效: 直接使用NVML Python 绑定查询设备状态,而不是解析nvidia-smi的输出(与nvidia-htop相比) 支持稀疏查询并使用来自 cachetools 的 TTLCache 缓存结果(与gpustat相比) 使用curses库显示信息,而不是用ANSI转义代...

