AMD深度学习库MIOpen更新,支持CNN加速
农企的深度学习加速库MIOpen 1.0更新了,它现在已经能支持对CNN的加速。
ROCm全称Radeon Open Compute platform,是AMD在去年12月推出的开源GPU运算平台,MIOpen则是AMD为此开发的软件库,其作用是将程序设计语言和ROCm平台连接,以充分利用GCN架构。
此次更新包括:
- 同时为正向和反向传播优化的深度卷积解算器
- 优化的卷积算法,包括Winograd和快速傅立叶转换
- 为深度学习准备的、优化的GEMM
- 池化、Softmax、激活、梯度算法的批量归一化,以及LR Normalization
- 4D张量NCHW格式
- 支持OpenCL和HIP的框架API
- 对MIOpen驱动的支持,以测试任何正向/反向网络
- 支持Ubuntu 16.04和Fedora 24的二进制封装
ROCm支