使用Python玩转GPU-低调大师

使用Python玩转GPU

2020-05-02 634

问题

随着机器学习对模型运算速度的需求越来越强烈，
一直想进行GPU编程，但一直以来这些都是c++的专利
一想到c++里的各种坑，就提不起劲来，毕竟这样来来回回填坑的投入产出，生产效率就会大打折扣

解决方案

让人欣喜的是，随着Python阵营的不断发展壮大，使用python进行GPU编程也越来越便捷了

那么具体有些什么样的包，能针对GPU做些啥事呢？
看看一些具体的代码，就能大概明白：
首先是pycuda，这是它的一个例子：

mod = SourceModule("""
__global__ void multiply_them(float *dest, float *a, float *b)
{
  const int i = threadIdx.x;
  dest[i] = a[i] * b[i];
}
""")

由上面的代码我们可以看出，pycuda将调用gpu的c++代码做了包装，可以在python里直接使用

再看看numba：

@cuda.jit
def increment_by_one(an_array):
    pos = cuda.grid(1)
    if pos < an_array.size:
        an_array[pos] += 1

我们可以发现，numba更进一步，直接使用装饰器的办法让调用GPU的过程更简洁方便

再看看cupy：

import numpy as np
import cupy as cp

x_gpu = cp.array([1, 2, 3])
l2_gpu = cp.linalg.norm(x_gpu)

cupy的调用方法看起来更加简单清晰，直接将np替换为cp即可

比较

所以，从机器学习全流程的角度我做了下汇总：

原始框架	GPU替代包	支持GPU	C/C++核函数	表达式核函数	装饰器 & Python
cuda	pycuda	n卡	√	×	×
opencl	pyopencl	n卡 + a卡	√	×	×
numpy	numba	n卡	√	√	√
scipy	cupy	n卡	√	√	√
pandas	cudf & modin	n卡	无(自动)
sklearn	cuml & scikit-cuda	n卡	无(自动)

目前cupy和numba对numpy的支持都不全面，可两者结合使用

从上面可以看出，基本上已经涵盖了机器学习的全流程，大部分包只支持cuda，主要都是为方便使用n卡加速
部分包还是只能使用c/c++语言构建核函数，主要还是受限于cuda驱动的capability
所以实际使用门槛并没有降低，只是将核函数包装到python里使用

GPU的主要优势在于大规模的并行计算，所以我又收集了一些并行计算框架，方便日后使用

框架	CPU并行计算	分布式并行计算	GPU并行计算
Multiprocess	√	×	×
joblib	√	×	×
dask	√	√	√
ray	√	√	√

至于机器学习/深度学习框架，那就更不用说了：
xgboost已经开始支持GPU，RandomForest也有GPU的版本，
tensorflow, pytorch默认就是支持GPU的，这里就不再赘述

结论

没有框架时，我们希望有效率的python包能快速解决问题，可框架多了，又会出现选择困难症
各种框架都宣称自己效率高，灵活好用，各种benchmark也让人眼花缭乱，目不暇接
到底用哪个框架合适，我把自己的一些经验也总结下，希望能让大家少踩一些坑：

1.对于一般的并行计算任务，使用joblib就能方便完成；

2.对于需要集群或GPU的计算任务，可以选择dask或ray；
这里推荐下dask，dask于机器学习/深度学习的计算包结合的更紧密，推出了dask_ml用于处理分布式机器学习；

3.如果想快速迁移numpy/pandas的代码到gpu，可以使用cupy + cudf的组合方式；

4.如果有复杂自定义的计算以及为了追求性能，可以使用pycuda + numba的形式；

5.对于numpy的替换到底选用cupy还是numba？
这里没有严格的界限，两者对GPU的调用方式设计，实际都会有一定的编码成本
从cupy的基本例子中可以看出，对于部分调用来说cupy更简洁，但是牺牲了cpu并行和分布式并行的功能为代价
所以目前可以持续关注这两个框架

6.对于替换pandas到底选用cudf还是modin？
modin本身并不是专为cuda并行化而设计，它只是底层支持了dask和ray，由此间接的支持了GPU
且到目前为止对pandas方法的支持还不全面，所以这里推荐选择cudf

思考

总之，python作为机器学习的首选语言，正在不断的开疆拓土，不断的降低并行计算的门槛
短短几年前，还只能用xgboost + spark的方式进行分布式训练，转眼现在就有了多种python解决方案
短短几年前，还只能用c++ cuda的方式进行GPU编程，转眼现在也有了多种纯python的框架支持
短短几年前，将GPU进行集群化、虚拟化管理几乎是不可能的，转眼现在也有了可靠的解决方案
……

但是，到目前为止，还没有一款真正能充分智能化的利用并行能力计算的框架：它能综合cpu+gpu+分布式的计算能力，目标就是为了加速计算，得到结果。期待这样的框架诞生！

相信不久的将来，会有更多更强大的python框架出现，不断的加速自动化的进程
让更多的生产力能从原始的轮子中解放出来，加快人工智能的进化！

微信关注我们

原文链接：https://yq.aliyun.com/articles/758562

转载内容版权归作者及来源网站所有！

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。

2020-05-02 00:00:00

PHP算法系列一：在规定次数中随机分配指定金额

/** *功能：在规定次数中随机分配指定金额 *$total:需要分配的金额 *$num:需要分配的次数 *$min:需要分配的最小金额 */ function randNum($total=200,$num=17,$min=1) { for ($i=1;$i<$num;$i++) { $safe_total = ($total - ($num-$i)*$min) / ($num-$i);//随机安全上限 if($safe_total < $min) $safe_total = $min; $money = round(mt_rand($min*100,$safe_total*100)/100); $total = $total - $money; $data[] = round($money,2); } $data[] = round($total); shuffle($data); return $data; }

737

2020-05-03 00:00:00

【万字长文】别再报班了，一篇文章带你入门Python

【万字长文】别再报班了，一篇文章带你入门Python 最近有许多小伙伴后台联系我，说目前想要学习Python，但是没有一份很好的资料入门。一方面的确现在市面上Python的资料过多，导致新手会不知如何选择，另一个问题很多资料内容也很杂，从1+1到深度学习都包括，纯粹关注Python本身语法的优质教材并不太多。刚好我最近看到一份不错的英文Python入门资料，我将它做了一些整理和翻译写下了本文。这份资料非常纯粹，只有Python的基础语法，专门针对想要学习Python的小白。注释Python中用#表示单行注释，#之后的同行的内容都会被注释掉。 Python中单行注释用#表示，#之后同行字符全部认为被注释。使用三个连续的双引号表示多行注释，两个多行注释标识之间内容会被视作是注释。 """ 与之对应的是多行注释用三个双引号表示，这两段双引号当中的内容都会被视作是注释 """基础变量类型与操作符Python当中的数字定义和其他语言一样：获得一个整数 3 获得一个浮点数 10.0我们分别使用+, -, *, /表示加减乘除四则运算符。 1 + 1 # => 28 - 1 # =&...

3447

资源下载

更多资源

Apache Tomcat7、8、9（Java Web服务器）

Tomcat是Apache 软件基金会（Apache Software Foundation）的Jakarta 项目中的一个核心项目，由Apache、Sun 和其他一些公司及个人共同开发而成。因为Tomcat 技术先进、性能稳定，而且免费，因而深受Java 爱好者的喜爱并得到了部分软件开发商的认可，成为目前比较流行的Web 应用服务器。

Eclipse（集成开发环境）

Eclipse 是一个开放源代码的、基于Java的可扩展开发平台。就其本身而言，它只是一个框架和一组服务，用于通过插件组件构建开发环境。幸运的是，Eclipse 附带了一个标准的插件集，包括Java开发工具（Java Development Kit，JDK）。

Java Development Kit(Java开发工具)

JDK是 Java 语言的软件开发工具包，主要用于移动设备、嵌入式设备上的java应用程序。JDK是整个java开发的核心，它包含了JAVA的运行环境（JVM+Java系统类库）和JAVA工具。

Sublime Text 一个代码编辑器

Sublime Text具有漂亮的用户界面和强大的功能，例如代码缩略图，Python的插件，代码段等。还可自定义键绑定，菜单和工具栏。Sublime Text 的主要功能包括：拼写检查，书签，完整的 Python API ， Goto 功能，即时项目切换，多选择，多窗口等等。Sublime Text 是一个跨平台的编辑器，同时支持Windows、Linux、Mac OS X等操作系统。