深度学习中的数值计算-低调大师

深度学习中的数值计算

2020-03-29 816

本文首发自公众号：RAIS

前言

本系列文章为《Deep Learning》读书笔记，可以参看原书一起阅读，效果更佳。

数值计算

机器学习算法需要大量的数字计算，并且这些计算包含有一些迭代拟合的过程，在这个计算过程中，由于计算机的局限，无法完全精确的表示，因此总是存在误差的，小的误差经过迭代次数的增多，或者多个误差的叠加，甚至会使得算法不可用，系统失效。

上溢和下溢

下溢：在现有的精度无法表示那么小的数的时候，接近零的数四舍五入为零时，会发生下溢。
上溢：在现有的精度无法表示那么大的数的时候，数过大被近似为无限大的时候，会发生上溢。

解决办法：softmax 函数，也称 归一化指数函数，是逻辑函数的一种推广，将任意实数的 K 维向量映射到另外一个 K 维空间内，使得每一个元素都在 (0, 1) 之间。这里的 归一化 与之前在房价预测中提到的 标准化 不是一个概念（标准化对数据进行某种非线性变换，使其服从某一种分布，归一化对数值的范围进行缩放，不改变数据分布的一种线性变换）。

病态条件（poor conditioning）

这个词我觉得翻译不准确，但是大家都喜欢这么叫暂且先这么叫吧。一般来说这个概念针对的是方程组或矩阵，微小的扰动让方程组的解发生巨大的变化，这样的方程组称为病态方程组，他们的系数组成的矩阵叫病态矩阵。

与之相关的还有一个概念叫 条件数：函数相对于输入的微小变化而变化的程度，可以理解为一种敏感度。计算方法是求矩阵极大和极小特征值之比。

基于梯度的优化方法

这个概念要分几步去理解。对于深度学习算法，往往会定义出很多函数，针对具体的问题，我们往往需要让某些函数的函数值尽可能的小或大，求最大值极值，我们往往求导（针对多个变量，这里的求导包括求偏导和方向导数），也会求梯度。梯度下降 指的是往梯度方向相反方向移动一个小距离来减小函数值的方法。这里还有极小值、极大值、驻点、最大值、最小值等概念，不再赘述。

雅可比矩阵（Jacobian）

在向量分析中，雅可比矩阵是一阶偏导数以一定方式排列成的矩阵，它的重要性是体现了一个可微分方程与给出点的最优线性逼近。

海森矩阵（Hessian）

函数有多维输入时，二维导数有很多，将其合为一个矩阵，就是海森矩阵，等价于梯度的雅可比矩阵。

一个点在每个方向上的二阶导数是不同的，海森的条件数衡量这些二阶导数的变化范围，当海森的条件数变得很差时，梯度下降法也会表现得很差，在 牛顿法 中，我们用海森矩阵指导搜索，来解决上面这个问题。

二阶导数测试：一阶导数等于 0，二阶导数大于零是一个极小值点；一阶导数等于 0，二阶导数小于零是一个极大值。
仅使用梯度信息的优化算法称为 一阶优化算法，使用海森矩阵的优化算法称为 二阶优化算法。

总结

这一部分的内容涉及东西比较多，书中的内容还包括一些推导和解释，看上文看的不是很清楚的请阅读原书，那就不是我的笔力所能讲清楚的了。

到此本书中关于应用数学相关的内容就结束了，这本书确实挺难的，想要放弃了吗？

本文首发自公众号：RAIS

微信关注我们

原文链接：https://my.oschina.net/renyuzhuo/blog/3213637

转载内容版权归作者及来源网站所有！

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。

Spring 和 Spring Boot 之间到底有啥区别？

相信很多小伙伴和我一样，常用Spring 和Spring Boot 但是就是没有研究二者之间到底有什么区别？今天就来大揭秘 ↓ 概述对于 Spring和 SpringBoot到底有什么区别，我听到了很多答案，刚开始迈入学习 SpringBoot的我当时也是一头雾水，随着经验的积累、我慢慢理解了这两个框架到底有什么区别，相信对于用了 SpringBoot很久的同学来说，还不是很理解 SpringBoot到底和 Spring有什么区别，看完文章中的比较，或许你有了不同的答案和看法！什么是Spring 作为 Java开发人员，大家都 Spring都不陌生，简而言之， Spring框架为开发 Java应用程序提供了全面的基础架构支持。它包含一些很好的功能，如依赖注入和开箱即用的模块，如：SpringJDBC、SpringMVC、SpringSecurity、SpringAOP、SpringORM、SpringTest，这些模块缩短应用程序的开发时间，提高了应用开发的效率例如，在 JavaWeb开发的早期阶段，我们需要编写大量的代码来将记录插入到数据库中。但是通过使用 SpringJDBC...

2020-03-29

728

StatefulSet是k8s中有状态应用管理的标准实现,今天就一起来了解下其背后设计的场景与原理,从而了解其适用范围与场景 1. 基础概念首先介绍有状态应用里面的需要考虑的一些基础的事情，然后在下一章我们再去看statefulSet的关键实现 1.1 有状态与无状态在日常开发的应用中，通常可以分为两大类：有状态与无状态，比如web服务通常都是无状态的，web应用数据主要来自后端存储、缓存等中间件，而本身并不保存数; 而诸如redis、es等其数据也是应用自身的一部分，由此可以看出有状态应用本身会包含两部分：应用与数据 1.2 一致性与数据一致性是分布式系统中很常见的问题，上面提到有状态应用包含数据部分，那数据和一致性是不是一个东西呢？答案是并不一定，在诸如zookeeper等应用中，会通过zab协议保证数据写入到集群中的大多数节点, 而在诸如kafka之类的应用其一致性设计要求相对较低，由此可以看出有状态应用数据的一致性，更多的是由对应场景的系统设计而决定 1.3 身份标识在一些应用中身份标识是系统本身组成的一部分，比如zookeeper其通过server的id来影响最终的z...

2020-03-29

802

资源下载

更多资源

腾讯云软件源

为解决软件依赖安装时官方源访问速度慢的问题，腾讯云为一些软件搭建了缓存服务。您可以通过使用腾讯云软件源站来提升依赖包的安装速度。为了方便用户自由搭建服务架构，目前腾讯云软件源站支持公网访问和内网访问。

Nacos

Nacos /nɑ:kəʊs/ 是 Dynamic Naming and Configuration Service 的首字母简称，一个易于构建 AI Agent 应用的动态服务发现、配置管理和AI智能体管理平台。Nacos 致力于帮助您发现、配置和管理微服务及AI智能体应用。Nacos 提供了一组简单易用的特性集，帮助您快速实现动态服务发现、服务配置、服务元数据、流量管理。Nacos 帮助您更敏捷和容易地构建、交付和管理微服务平台。

Rocky Linux

Rocky Linux（中文名：洛基）是由Gregory Kurtzer于2020年12月发起的企业级Linux发行版，作为CentOS稳定版停止维护后与RHEL（Red Hat Enterprise Linux）完全兼容的开源替代方案，由社区拥有并管理，支持x86_64、aarch64等架构。其通过重新编译RHEL源代码提供长期稳定性，采用模块化包装和SELinux安全架构，默认包含GNOME桌面环境及XFS文件系统，支持十年生命周期更新。

WebStorm

WebStorm 是jetbrains公司旗下一款JavaScript 开发工具。目前已经被广大中国JS开发者誉为“Web前端开发神器”、“最强大的HTML5编辑器”、“最智能的JavaScript IDE”等。与IntelliJ IDEA同源，继承了IntelliJ IDEA强大的JS部分的功能。