如何用云端 GPU 为你的 Python 深度学习加速？

2018-06-20 634

负荷

下午，我用 Python 深度学习框架 Keras 训练了一个包含3层神经网络的回归模型，预测波士顿地区房价。

img_72e01b0bf66d01bdf45ff5cd48b595a7.jpe

这是来自于 “Deep Learning with Python” 书上的一个例子。

img_874ab54c2deeee132d307762a5f23f94.jpe

运行的时候，代码有两个大循环。

第一个把数据跑100遍（epochs），第二个把数据跑500遍。

我的笔记本电脑算起来很吃力，风扇一直在响。

大热天的，看着好可怜。

用笔记本电脑进行机器学习，还是不大合适的。

我要是有一块 GPU 就好了……

此时，突发奇想。

我虽然没有带 nVidia GPU 的设备，不过谁说非要在本地机器运行代码了？

早已是云时代了啊！

能否用云端 GPU 跑机器学习代码，让我的笔记本少花些力气呢？

偶遇

有这个想法，是因为最近在 Youtube 上面，我看到了 Siraj Raval 的一段新视频。

img_f32fe3264341b63f08c7a1e23bdcab52.jpe

这段视频里，他推荐了云端 GPU 提供平台 FloydHub。

img_188a0c3e25a03f545455db598310a626.jpe

我曾经试过 AWS GPU 产品。

那是在一门深度学习网课上。

授课老师跟 AWS 合作，为全体学生免费提供若干小时的 AWS 计算能力，以便大家顺利完成练习和作业。

我记得那么清楚，是因为光如何配置 AWS ，他就专门录了数十分钟的视频。

AWS 虽然已经够简单，但是对于新手来说，还是有些门槛。

img_c2ec94e140819ac09254e11907e7b448.jpe

FloydHub 这个网站，刚好能解决用户痛点。

首先它能够包裹 AWS ，把一切复杂的选择都过滤掉。

其次它内置了几乎全部主流深度学习框架，自带电池，开箱即用；

img_4081a4d7e6f94cf6a0b835054935d5e7.jpe

另外，它提供了丰富而简明的文档，用户可以快速上手。

正如它的主页宣称的：

Focus on what matters. Let FloydHub handle the grunt work.

翻译过来就是：

关注你想做的事儿。脏活累活，扔给 FloydHub 吧。

凡是设计给懒人用的东西，我都喜欢。

我于是立即注册了账户，并且做了邮件验证。

img_2a72d48d3fed25e764ff41457e7e3348.jpe

之后，我免费获得了2个小时的 GPU 时间，可以自由尝试运行机器学习任务。

img_6f6c76651c8efb94a1ed08b6650bc299.jpe

为了能把珍贵的 GPU 运算时间花在刀刃上，我认真地阅读了快速上手教程。

img_fee2795f466e4eb3ed13c1e84be0e5e0.jpe

几分钟后，我确信自己学会了使用方法。

尝试

首先，我到 FloydHub 的个人控制面板上，新建了一个任务，起名叫做 “try-keras-boston-house-regression”。

然后，我在本地的 Jupyter Notebook 里，把代码导出为 Python 脚本文件，如下图所示。

我新建了一个目录，把脚本文件拷贝了进来。

img_b93532288172649b6d055e07b1942908.jpe

这个 Python 脚本，我仅仅在最后加了3行代码：

import pickle

with open('data.pickle', 'wb') as f:
    pickle.dump([all_scores, all_mae_histories], f)

加入这几行代码，是因为我们需要记录运行中的一些数据（即 all_scores 和 all_mae_histories）。

然后，进入终端，利用 cd 命令，进入到这个文件夹。

执行：

pip install floyd-cli

这样，本地的 FloydHub 命令行工具就安装好了。

执行下面命令登录进去：

floyd login

系统会提示你，输入 FloydHub 上的账号信息。

输入正确后，执行：

floyd init try-keras-boston-house-regression

注意这个名称，必须和刚才在控制面板新建的任务名称一致。

配置都完成了，下面直接运行就可以了。

输入：

floyd run --gpu --env tensorflow-1.8 "python 03-house-price.py"

这句话的意思是：

使用 GPU 计算；
运行环境选用 Tensorflow 1.8 版本，及对应的 Keras （2.1.6）。

如果你希望使用其他深度学习框架或版本，可以参考这个链接。

img_67711fa866b92fc93a2c656c70be6288.jpe

FloydHub 对我们的命令，是这样回应的：

img_14b0ed4a58ee568bec45bf76ab00ecb9.jpe

操作结束？

对，就这么简单。

你的任务，已在云端运行了。

结果

然后，我就忙自己的事儿去了。

喝茶，看书，还扫了几眼微信订阅号。

虽然是按时计费，但你不用因为怕多算钱，就死死盯住云端运行过程。

一旦任务结束，它自己会退出运行，不会多扣你一分钟珍贵的 GPU 运行时间。

等我回到电脑前面，发现任务已完成。

img_5932744ce53b1cf3411ba540dcf220e9.jpe

整个儿过程中，GPU 内存着实够忙碌的（占用率一直超过90%）。

不过 GPU 好像很清闲的样子，一直在百分之十几晃悠。

看来，我们的神经网络，层数还是太少了，结构不够复杂。

GPU 跑起来，很不过瘾。

往下翻页，看看输出的结果。

img_3d8d25cf53ddb84d23119e1bb7a56144.jpe

程序的输出，包括 GPU 资源创建、调用的一些记录，这里都有。

打开 Files 标签页，咱们看看结果。

img_4593f2f801f4b6976bbc36f0447e551d.jpe

之前追加3行代码，生成的 pickle 记录文件，就在这里了。

看来，FloydHub 确实帮我们完成了繁复的计算过程。

我的笔记本电脑，一直凉凉快快，等着摘取胜利果实。

选择下载，把这个 pickle 文件下载到本地。跟我们的 Jupyter Notebook 放在一个目录下。

回到 Jupyter Lab 运行界面。

新开一个 ipynb 文件。

我们输入以下代码，查看运行记录是否符合我们的需要。

import pickle
import matplotlib.pyplot as plt
import numpy as np
%matplotlib inline

with open('data.pickle', 'rb') as f:
    [all_scores, all_mae_histories] = pickle.load(f)

num_epochs = 500
average_mae_history = [
    np.mean([x[i] for x in all_mae_histories]) for i in range(num_epochs)
]

plt.plot(range(1, len(average_mae_history) + 1), average_mae_history)
plt.xlabel('Epochs')
plt.ylabel('Validation MAE')
plt.show()

这些代码，只是为了绘图，本身没有任何复杂运算。

这是运行结果：

img_9e4395b9f4c37f8b0f1b1e9c166f7542.jpe

可视化结果与书上的一致。

证明机器学习代码在云端运行过程一切顺利。

我们还可以查看剩余的可用免费时长。

嗯，还剩下1个多小时 GPU 运算时间呢，回头接着玩儿。

Workspace

刚才咱们展示的，是命令行下的使用方法。如果你对于命令行操作很熟悉，建议你使用这种方式。因为控制感更强一些。

但是对于初学者，我推荐你使用另外一种更为简便的方法。

在主页点击上方的 Workspace 标签。

img_b9dac38da70905df5888b77fe02efb75.jpe

你会看到已有的2个样例 Workspace 。

尝试打开其中第一个，看看内容。

点击右上方的 Resume 绿色按钮，你会看到系统在认真地为我们准备环境。

img_97c825d0f52207273e65713ce33f9d1d.jpe

准备工作结束后，你会看到出现了熟悉的 Jupyter lab 界面。

双击左侧文件区域的 dog-breed-classification.ipynb ，打开。

img_82d7f1c183c5bf11a81bd649565a46b1.jpe

这里是个猫狗分辨的完整样例。

咱们执行一下。方式是执行菜单栏里面的 Run -> Restart Kernel and Run All Cells：

img_6107e79f2598a2ef9f22b700e86c1016.jpe

你会发现，跟在本地执行起来，没有什么区别。

img_bc2d40f2d290e90c96a8585fe225156e.jpe

唯一的差别，是你在用 GPU 加速哦！

如果想建立自己的 Workspace ，该怎么办呢？

很简单，回到咱们的 Project 页面下，本例是这个链接。

img_246af2d8d47edbb2db41884cd9e56783.jpe

你会看到，每个项目下，都可以使用 Create Workspace 这个按钮创建新的 Workspace 。

Floydhub 会询问你，使用哪种方式建立新的 Workspace 。

img_25c5999fa7da205329ce97a19d5cc4ca.jpe

这里咱们选择左侧的 Start from scratch 。

下面选择使用的环境。

img_ad2199ae8763466135fbd5e84b3c95f1.jpe

我们将其改成 Tensorflow 1.9 和 GPU 环境。

img_aa660690ce7021163822c3e464ffd8fc.jpe

点击 Create Workspace 按钮，就创建完毕了。

img_1546fe3e18daf061ae95f9ae8357158a.jpe

点击 try-keras-boston-house-regression workspace 这个链接。

我们就可以看到，一个 Jupyter Lab 界面为我们准备好了。

img_bd74229d5709b9e9bdb82f18cd84ab48.jpe

这个环境里面，Tensorflow 和 GPU 的配置都是现成的。

你不用去考虑如何执行 CLI 命令，只需要在其中像平时一样输入 Python 代码，调用 Keras 与 Tensorflow 命令就可以了。

是不是更方便呢？

利用 Floydhub ，开始你的深度学习之旅吧。

小结

做深度学习任务，不一定非得自己购置设备。主要看具体需求。

假如你不需要全天候运行深度学习代码，只是偶尔才遇到计算开销大的任务，这种云端 GPU ，是更为合适的。

你花钱买了深度学习硬件设备，就只有贬值的可能。而且如果利用率低，也是资源浪费。

而同样的租赁价格，你可以获得的计算能力，却是越来越强的。

这就是摩尔定律的威力吧。

你用没用过其他的云端 GPU 服务？价格和易用程度，与 FloydHub 相较如何？

如果你对数据科学感兴趣，欢迎阅读我的系列教程。索引贴为《如何高效入门数据科学？》。

喜欢请点赞。还可以微信关注和置顶我的公众号“玉树芝兰”(nkwangshuyi)。

微信关注我们

原文链接：https://yq.aliyun.com/articles/650048

转载内容版权归作者及来源网站所有！

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。

3.C#WebAPI设置路由和参数2

1.上面已经教大家如何修改全局路由了，那么修改完后我们在post请求的要这样使用，其中model模型我就默认你应该已经建好了，没有创建的话请看上一部分 Post方法的参数，如果提交的请求体需要是phoneNum=123&password=123这样的格式。如果用string AddNew(string phoneNum, string password)这种普通参数会有很多的坑（参考《C#进阶系列—— WebApi 接口参数不再困惑：传参详解》），所以不要用。都用模型对象，public string AddNew2(LoginModel model)，也可以参数标注[FromBody]：public string AddNew2([FromBody]LoginModel model)。（只能有一个参数标注FromBody）。 [HttpPost] public bool Login4(LoginModel model)//也可以参数标注[FromBody]LoginModel model { if (model.phoneNum == "123" && mode...

2018-06-20

767

“新媒体”的核心载体，是高度数字化并可以通向智能化的商业基础设施。央视坚持自主创新、坚持移动优先是主流媒体融合发展的正确方向。创建CCTV5移动客户端，结合AI提升用户粘性，利用平台统筹管理新媒体广告并在未来做到精准营销，是央视新媒体发展实现换道超车、推进媒体融合走向纵深的关键布局，也是推动传统媒体行业与新技术、新媒体深度融合的全方位变革。热点热议 CCTV5手机客户端新媒体：让赛事集锦堪比电影大片作者：飞天战略营蚂蚁金服技术出海，“暖科技”亮相世界顶尖计算机视觉CVPR大会作者：兔子酱玩大了！阿里工程师的年会竟然这样搞？作者：技术小能手知识整理 Redis常见配置作者：幸运券发放安卓巴士Android开发者门户作者：技术小能手 C#（WPF）去除事件中注册的事件处理方法！作者：wangccsy Java 常量池注意点作者：anmypeng1 Node.js中常见的异步/等待设计模式作者：优惠码发放美文回顾 10行代码让你轻松搞定对象检测作者：【方向】使用API Explore 白屏化调用API创建报警规则作者：江米 AI文案通过图灵测试！一秒生成2...

2018-06-20

716

资源下载

更多资源

腾讯云软件源

为解决软件依赖安装时官方源访问速度慢的问题，腾讯云为一些软件搭建了缓存服务。您可以通过使用腾讯云软件源站来提升依赖包的安装速度。为了方便用户自由搭建服务架构，目前腾讯云软件源站支持公网访问和内网访问。

Nacos

Nacos /nɑ:kəʊs/ 是 Dynamic Naming and Configuration Service 的首字母简称，一个易于构建 AI Agent 应用的动态服务发现、配置管理和AI智能体管理平台。Nacos 致力于帮助您发现、配置和管理微服务及AI智能体应用。Nacos 提供了一组简单易用的特性集，帮助您快速实现动态服务发现、服务配置、服务元数据、流量管理。Nacos 帮助您更敏捷和容易地构建、交付和管理微服务平台。

Spring

Spring框架（Spring Framework）是由Rod Johnson于2002年提出的开源Java企业级应用框架，旨在通过使用JavaBean替代传统EJB实现方式降低企业级编程开发的复杂性。该框架基于简单性、可测试性和松耦合性设计理念，提供核心容器、应用上下文、数据访问集成等模块，支持整合Hibernate、Struts等第三方框架，其适用范围不仅限于服务器端开发，绝大多数Java应用均可从中受益。

Rocky Linux

Rocky Linux（中文名：洛基）是由Gregory Kurtzer于2020年12月发起的企业级Linux发行版，作为CentOS稳定版停止维护后与RHEL（Red Hat Enterprise Linux）完全兼容的开源替代方案，由社区拥有并管理，支持x86_64、aarch64等架构。其通过重新编译RHEL源代码提供长期稳定性，采用模块化包装和SELinux安全架构，默认包含GNOME桌面环境及XFS文件系统，支持十年生命周期更新。

如何用云端 GPU 为你的 Python 深度学习加速？

负荷

偶遇

尝试

结果

Workspace

小结

3.C#WebAPI设置路由和参数2

6月21日云栖精选夜读丨CCTV5手机客户端新媒体：让赛事集锦堪比电影大片

相关文章

发表评论

资源下载

腾讯云软件源

Nacos

Spring

Rocky Linux

欢迎您来访！