成为机器学习工程师要知道的多种学习路径（附图）

2017-10-19 664

如果你决心成为一名机器学习工程师的话，在这篇文章中，我们将从简单的线性回归到最新的神经网络，让你了解机器学习的所有方面，你不仅可以学习如何使用它们，还将学习如何从头开始构建它们。

本文的学习路径大部分基于计算机视觉(CV)，因为它是获得各方面知识的最快途径，而从CV中获得的经验可以简单地转移到机器学习的任何一个领域。

我们将使用TensorFlow作为一个机器学习框架，因为它非常好用。TesnorFlow官方地址：https://www.tensorflow.org/

如果你同时学习了理论和实践材料，那么将会得到更好的学习结果和实用的学习材料。

前提要求:Python，你不需要在这方面是专家级别，只要懂得基本知识就好。

1.课程

1.1 约翰霍普金斯大学的实用机器学习；地址：https://www.coursera.org/learn/practical-machine-learning

1.2 斯坦福大学的机器学习；地址：https://www.coursera.org/learn/machine-learning
这两个课程将教给你关于数据科学和机器学习的基本知识。

1.3 CS231n:2017年用于视觉识别的卷积神经网络(2016)；地址:http://cs231n.stanford.edu/
这是你在网上找到的关于机器学习和CV相关的最好课程之一。它能为你进一步的学习调查打下良好的基础。

1.4* 谷歌的深度学习；地址：https://www.udacity.com/course/deep-learning–ud730
可选择的课程。

1.5* CS224d:自然语言处理的深度学习；地址：http://cs224d.stanford.edu/
对于想要使用自然语言处理的人来说，也是可选择的课程。

1.6 * 深度学习的书籍；地址：https://leonardoaraujosantos.gitbooks.io/artificial-inteligence/content/
涵盖许多机器学习的相关知识的手册，可选。

2.实践部分

这个列表包含许多教程和项目，你可以理解它们是如何工作的，并思考如何改进它们。创建这个列表是为了增加你对机器学习的专业知识和兴趣，所以不要害怕，如果有些任务对你来说很困难，你可以在你准备好的时候再开始实践。

2.1 来自Kadenze的简单实用的TensorFlow课程；地址：https://www.kadenze.com/courses/creative-applications-of-deep-learning-with-tensorflow-iv/info

2.2 TensorFlow码元书；地址：https://github.com/nfmcclure/tensorflow_cookbook

2.3 Tensorflow – 101教程集；地址：https://github.com/sjchoi86/Tensorflow-101

2.4 快速的风格转变网络；地址：https://github.com/lengstrom/fast-style-transfer
教你如何使用神经网络将风格从名画类转变为照片类。

2.5 图像分割；地址：https://github.com/MarvinTeichmann/tensorflow-fcn

2.6 使用SSD的对象检测；地址：https://github.com/balancap/SSD-Tensorflow
对象检测的最快(也是最简单的)模型之一。

2.7 用于对象检测和分割的快速蒙版RCNN；地址：https://github.com/CharlesShang/FastMaskRCNN

2.8 强化学习；地址：https://github.com/dennybritz/reinforcement-learning
非常有用的东西，特别是在你想要创建一个机器人或下一个Dota AI上的时候。

2.9 谷歌大脑团队的Magenta项目；地址：https://github.com/tensorflow/magenta/tree/master/magenta/models
这个项目的目的是在神经网络的帮助下创造出引人注目的艺术和音乐作品，它的结果通常都是非常惊人的。

2.10 深度双边学习实时图像增强；地址：https://groups.csail.mit.edu/graphics/hdrnet/
这里包含了谷歌图片增强的新算法。

2.11 自驾车项目；地址：https://github.com/udacity/self-driving-car
想让你的车完全自动吗? -这是一个很好的学习起点。

3.常见问题解答

如果你在问题上卡住了怎么办?
首先，你必须知道机器学习并不是100%准确的——大多数情况只是一个很好的猜测和大量的调优迭代。因此，在大多数情况下，想出一些独特的见解是非常困难的，因为你将花费大量的时间和资源在训练模型上。所以，不要试图自己找到解决办法。

这有一些网站可以帮助你解决一些问题:

我在哪里可以找到新的学习材料?
我使用http://www.gitxiv.com/，http://www.arxiv-sanity.com/还有 https://arxiv.org/这三个网站。gitxiv这个网站不仅可以找到论文，而且还能找到相关代码，因此它对学习者来说更加实用。

我应该使用云或PC/笔记本电脑来计算吗?
云是最适合用于生产模型的密集计算。对于学习和测试，使用CUDA显卡的PC/笔记本电脑要便宜得多。例如，我在我的GTX GeForce 960M和690CUDA内核的笔记本电脑上训练所有模型的。当然，如果你有云的话，你可以使用它。

如何提高模型的超参数的调优?
训练的主要问题是时间。你不能只是坐在那里看训练数据。出于这个原因，我建议你使用网格搜索（Grid Search）。基本上，只需创建超参数和模型架构的集合，然后在流中运行它们，从而保存结果。因此，你可以在晚上进行训练，并在第二天比较结果，然后找到最良好的那个。

你可以在sklearn库看到这个过程是如何完成的。sklearn库地址：http://scikit-learn.org/stable/modules/grid_search.html

本文为编译作品，转载请注明出处，更多内容关注微信公众号：atyun_com

微信关注我们

原文链接：https://yq.aliyun.com/articles/225709

转载内容版权归作者及来源网站所有！

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。

最短编辑距离算法实现

一，算法介绍在CS124课程的第一周提到求解两个字符串相似度的算法---Minimum Edit Distance（最短编辑距离）算法。该算法在NLP（自然语言处理）中也会用到。如何定义相似度呢？任给两个字符串X 和Y，使用以下三种操作将字符串X 变到字符串Y ：①插入(Insert)操作；②删除操作（delete）；③替换操作(substitute) 比如字符串X="intention" ，字符串Y="execution"。从字符串X 转换成字符串Y 如下图所示：定义：插入操作的代价为1，删除操作的代价为1，替换操作的代价为2（称为： Levenshtein distance）。那么，"intention" 变成 "execution" 执行了三次替换，一次删除，一次插入。因此，总代价为8 而这个代价又称为编辑距离，用之来衡量两个字符串的相似程度。显然，若两个字符串越相似，则从一个字符串变到另一个字符串所需要的 “操作” 步骤就越少。二，动态规则求解最短编辑距离为什么能用动态规划来求解呢？ⓐ该问题可以分解成若干个子问题；ⓑ子问题之间具有重叠性（可“查...

2017-10-18

649

语音识别技术是人机交互技术的重要组成部分，而语音识别中的声学模型是语音识别技术中的核心所在，堪称重中之重。阿里巴巴iDST智能语音交互团队最新的LFR-DFSMN模型相对于之前的LFR-LCBLSTM模型可以达到训练加速3倍、识别加速2倍、识别错误率降低20%和最终模型大小压缩50%的效果，实现了语音识别的迭代速度、识别成本、服务质量的全面提升。一、语音识别背景介绍语音识别技术一直都是人机交互技术的重要组成部分。有了语音识别技术，机器就可以像人类一样听懂说话，进而能够思考、理解和反馈。近几年随着深度学习技术的使用，基于深度神经网络的语音识别系统性能获得了极大的提升，开始走向实用化。基于语音识别的语音输入、语音转写、语音检索和语音翻译等技术得到了广泛的应用。阿里巴巴iDST智能语音交互团队一直以来也致力于语音识别技术的研究，同时

2017-10-19

744

资源下载

更多资源

Mario

马里奥是站在游戏界顶峰的超人气多面角色。马里奥靠吃蘑菇成长，特征是大鼻子、头戴帽子、身穿背带裤，还留着胡子。与他的双胞胎兄弟路易基一起，长年担任任天堂的招牌角色。

腾讯云软件源

为解决软件依赖安装时官方源访问速度慢的问题，腾讯云为一些软件搭建了缓存服务。您可以通过使用腾讯云软件源站来提升依赖包的安装速度。为了方便用户自由搭建服务架构，目前腾讯云软件源站支持公网访问和内网访问。

Nacos

Nacos /nɑ:kəʊs/ 是 Dynamic Naming and Configuration Service 的首字母简称，一个易于构建 AI Agent 应用的动态服务发现、配置管理和AI智能体管理平台。Nacos 致力于帮助您发现、配置和管理微服务及AI智能体应用。Nacos 提供了一组简单易用的特性集，帮助您快速实现动态服务发现、服务配置、服务元数据、流量管理。Nacos 帮助您更敏捷和容易地构建、交付和管理微服务平台。

WebStorm

WebStorm 是jetbrains公司旗下一款JavaScript 开发工具。目前已经被广大中国JS开发者誉为“Web前端开发神器”、“最强大的HTML5编辑器”、“最智能的JavaScript IDE”等。与IntelliJ IDEA同源，继承了IntelliJ IDEA强大的JS部分的功能。