吴恩达《Machine Learning Yearning》总结（21-30章）-低调大师

吴恩达《Machine Learning Yearning》总结（21-30章）

2018-06-13 572

21.偏差和方差举例

前提：对于人类而言，可以达到近乎完美的表现（即人类去做分类是误差可以接近0）。

（1）假设算法的表现如下：训练误差率：1%，开发误差率：11%；此时即为高方差（high variance），也被称为过拟合（overfitting）。

（2）假设算法的表现如下：训练误差：15&，开发误差率：16%；此时即为高偏差（high bias），也被称为欠拟合（underfitting）。

（3）假设算法的表现如下：训练误差：15%，开发误差率：30%；此时即为高偏差和高方差。

（4）假设算法的表现如下：训练误差：0.5%，开发误差率：1%；此时算法已经非常完美。

22.与最优误差率比较

举例：当一个连人类都很难完成（如很多噪音的语音识别）的分类任务，人类的误差率达到14%，此时最完美的误差为14%，该误差称为最优误差率，也称为贝叶斯错误率（Bayes error rate）。以上的最优错误率是可以确定的，但是有些问题如电影推荐，很难去确定其最优误差率是多少。

此时偏差和进一步细化：偏差=最优误差率+可避免偏差；其中可避免偏差高时才值得去优化。

23..处理偏差和方差

（1）如果具有较高的可避免偏差，那么可以加大模型的规模（例如增加神经元的层数、每层神经元的个数）。

（2）如果具有较高的方差，那么可以向训练集增加数据。

其他（3）改变网络的架构，这样会带来新的结果。

在增大网络模型时，会带来高方差的风险，但只要通过适当的正则化（如L2）,或者dropout等策略，就不会出现这样的问题。

24.偏差和方差间的均衡

在现如今，往往可以获得足够的数据，并且足够的算力来支撑非常大的网络，所以不会出现此消彼长的情况。

25.减少可避免偏差的技术

（1）加大模型规模（例如层数/神经元个数），此时加入正则化可以抵消方差的增加。

（2）根据误差分析结果修改输入特征。

（3）减少或者去除正则化。这种方式会增加方差。

（4）修改模型架构。这项技术会同时影响方差和偏差。

26.训练集误差分析

在训练集上也做类似于开发集上的误差分析。

27.减少方差的技术

（1）添加更多的训练数据。

（2）加入正则化（L1,L2,Dropout）,该项会增大偏差。

（3）加入提前终止（比如根据开发集提前终止梯度下降），这项技术会增加偏差，一些学者将其归入正则化技术之一。

（4）通过特征选择减少特征的数量和种类，当数据集很小时，特征选择非常有用。

（5）减小模型规模，谨慎使用。

以下两种方式和减少偏差的策略相同

（6）根据误差分析结果修改输入特征。

（7）修改模型架构。

28.诊断偏差与方差：学习曲线

学习1曲线：误差随数据量增加的变化趋势。

学习曲线有一个缺点：当数据量变得越来越多是，将很难预测后续红色曲线的走向。

29.绘制训练误差曲线

训练误差上升说明：比如两张图片算法很容易就分辨出来，其误差为0，当增加到100张时，就不一定都能正确识别了。

30.解读学习曲线：高偏差

观察结果：

（1）随着我们添加更多的训练数据，训练误差只会变得更糟，因此蓝色的训练误差曲线只会保持不动或上升，这表明它只会远离期望的性能水平（绿色的线）。

（2）红色的开发误差曲线通常要高于蓝色的误差曲线，因此只要训练误差高于期望性能水平，通过添加更多数据来让红色开发误差曲线下降到期望性能水平之下也基本不可能。

之前我们讨论的都是曲线的最右端，而通过学习曲线则更加的群面了解算法。

微信关注我们

原文链接：https://yq.aliyun.com/articles/607144

转载内容版权归作者及来源网站所有！

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。

为什么说要重视神经网络加速器

自从以深度学习为代表的神经网络算法的精度大大提升以后，人工智能开始终于又再次火了起来，且有席卷全球之势。根据BBC预测，到2020年，人工智能总体市场将会高达1190亿元的规模，年平均复合增长率也将达到19.7%。庞大的市场潜力就吸引了众多的芯片、算法和应用厂商投身其中。和过去的大多数应用不一样，人工智能在模型训练与推理中需要大量的计算。但受限于其算法和计算本身的特性，过往一直被广泛使用的传统计算芯片却无法满足这些需求，这就要求芯片厂商去为神经网络算法打造专用的芯片，尤其是推理端的芯片，也就是俗称的神经网络加速器。由于这个市场大家几乎都处于同一起跑线，所以很多新兴的和传统的芯片厂商在上面角逐，这就给开发者的芯片选择带来了困扰。为此，我们从概念入手，为大家提供神经网络加速器的（NNA）基本面了解，还有一些厂商的应用范例，希望对大家有所启发。神经网络加速器是趋势在谈神经网络加速器之前，我们先了解一下什么是神经网络。据维基百科，在机器学习和认知科学领域，人工神经网络是一种模仿生物神经网络（动物的中枢神经系统，特别是大脑）的结构和功能的数学模型或计算模型，用于对函数进行估计或近似。神...

2018-06-13

669

原文: 微软新一代输入法框架 TSF - Text Service Framework 小小的研究虽说是转载的，但是其中，有很多我自己的评论，我会用红色的字标出来，参考的博文有： TSF架构：http://blog.csdn.net/mspinyin/article/details/6137709 TSF代码实例：http://www.dotblogs.com.tw/code6421/archive/2010/09/27/17909.aspx TSF的一个C# Wrapper库：http://social.technet.microsoft.com/Forums/office/zh-CN/002efcfc-8d21-4674-b93b-53c8424d448e/vista-api-immgetdescription?forum=2087 下面内容来自第一篇被引用的文章，TSF架构：几个关于TSF的术语 TIP(Text Input Processor), a Text service in TSF Cicero，TSF的开发代号，所以微软内部通常称呼TSF框架为Cicero CUA...

2018-06-14

730

资源下载

更多资源

腾讯云软件源

为解决软件依赖安装时官方源访问速度慢的问题，腾讯云为一些软件搭建了缓存服务。您可以通过使用腾讯云软件源站来提升依赖包的安装速度。为了方便用户自由搭建服务架构，目前腾讯云软件源站支持公网访问和内网访问。

Nacos

Nacos /nɑ:kəʊs/ 是 Dynamic Naming and Configuration Service 的首字母简称，一个易于构建 AI Agent 应用的动态服务发现、配置管理和AI智能体管理平台。Nacos 致力于帮助您发现、配置和管理微服务及AI智能体应用。Nacos 提供了一组简单易用的特性集，帮助您快速实现动态服务发现、服务配置、服务元数据、流量管理。Nacos 帮助您更敏捷和容易地构建、交付和管理微服务平台。

Spring

Spring框架（Spring Framework）是由Rod Johnson于2002年提出的开源Java企业级应用框架，旨在通过使用JavaBean替代传统EJB实现方式降低企业级编程开发的复杂性。该框架基于简单性、可测试性和松耦合性设计理念，提供核心容器、应用上下文、数据访问集成等模块，支持整合Hibernate、Struts等第三方框架，其适用范围不仅限于服务器端开发，绝大多数Java应用均可从中受益。

Sublime Text

Sublime Text具有漂亮的用户界面和强大的功能，例如代码缩略图，Python的插件，代码段等。还可自定义键绑定，菜单和工具栏。Sublime Text 的主要功能包括：拼写检查，书签，完整的 Python API ， Goto 功能，即时项目切换，多选择，多窗口等等。Sublime Text 是一个跨平台的编辑器，同时支持Windows、Linux、Mac OS X等操作系统。