DL_WITH_PY系统学习（第3章）-低调大师

DL_WITH_PY系统学习（第3章）

2018-05-28 623

img_03e7b9cbd237c246dc041f4bb59a92dc.jpe

本节提示：

1、DL的核心构建

2、Keras的简单介绍

3、搭建DL机器训练环境

4、使用DL模型解决基础问题

3.1 DL的基本构建：layer

layer的定义：以1个或多个tensor作为输入，并且运算出来1个或者多个tensor作为输出的数据处理模型。

   from keras import models
from keras import layters

model = models.Sequentail()
model.add(layers.Dense(32,input_shape=（784，)))
model.add(layers.Dense(32))

  

在这样的代码中，第二层的layer自动以前一层的结果大小为输入大小。

3.2 DL的基本构建：model

model的定义：一个DL的model是一个直接的、非循环的layer的图，是最直接的layers的线性表示方式，单输入并且但输出。

model包含squence和model两种模式，这在之前已经讨论过。

3.3 DL的基本构建:loss function和optimizers

loss function:它表示的是当前训练项目的成功率；

optimizers: 表示，基于当前的loss function，当前的网络采取什么样的方法优化。主要是体现在SGD的具体变化上。

对于不同类型的训练，往往都有默认的很好的optimizers选择，只有当你进行专门的训练的时候，才可能需要采用自己定义的方法。

3.4 DL训练的步骤

3.4.1 定义你的数据集

3.4.2 选择一种layers的组合方式(选择model)

3.4.3 config选择的的model

3.4.4 训练，并且得到结果

在定义的过程中，有一些思考：

a、为什么要使用激活层

否则，原系统就是原始的线性系统，缺乏灵活性。

b、关于损失函数的选择

如果你使用的是binary函数，则

loss='binary_crossentropy'

当你想使用自定义的时候，尝试这个

   model.compile(optimizer=optimizers.RMSprop(lr=0.001),
loss='binary_crossentropy',
metrics=['accuracy'])

  

实际上，很多时候， RMSprop都是一个不错的选择。

3.5 fit()返回的是log，它是一个hash，类似这种结构

['acc','loss','val_acc','val_loss']

3.6 predict

model.predict(x_test)

是对目前一个输入测试用例的实验。

3.7 关于compile中参数的选择，这块的概论非常重要又很模糊

一个典型的compile主要解决3个问题：

optimizer是什么，loss是什么，metrics是什么。而这3个参数的选择，往往都和问题本身有关：

optimizer:优化器，为预定义优化器名或优化器对象

常见的目标函数

rmsprop:绝大多数情况下都是可用的，该优化器通常是面对递归神经网络时的一个良好选择

sgd：（似乎也是可以的）随机梯度下降法，支持动量参数，支持学习衰减率，支持Nesterov动量

loss:( categorical:绝对的;cross entropy 交叉熵)

categorical_crossentropy 最好的选择，onehot

sparse_categorical_crossentropy 当你的标签是integer的时候，选择

binary_crossentropy 2类分类的时候，选择

mse mean squared error 当你的问题是回归问题的时候选择(regression）

而mae为 mean absolute error ，能够只管地显示出你在什么时候出现overfit

可用的目标函数

mean_squared_error或mse
mean_absolute_error或mae
mean_absolute_percentage_error或mape
mean_squared_logarithmic_error或msle
squared_hinge
hinge
categorical_hinge
binary_crossentropy（亦称作对数损失，logloss）
logcosh
categorical_crossentropy：亦称作多类的对数损失，注意使用该目标函数时，需要将标签转化为形如(nb_samples, nb_classes)的二值序列
sparse_categorical_crossentrop：如上，但接受稀疏标签。注意，使用该函数时仍然需要你的标签与输出值的维度相同，你可能需要在标签数据上增加一个维度：np.expand_dims(y,-1)
kullback_leibler_divergence:从预测值概率分布Q到真值概率分布P的信息增益,用以度量两个分布的差异.
poisson：即(predictions - targets * log(predictions))的均值
cosine_proximity：即预测值与真实标签的余弦距离平均值的相反

metrics（列表，包含评估模型在训练和测试时的性能的指标）

acc和accuracy，似乎是一个东西，或者 metrics={'ouput_a': 'accuracy'}

3.8 平滑绘制最后的曲线

从

plt.plot(range(1,len(average_mae_history)+1),average_mae_history)到

def smooth_curve(points,factor=0.9)

smoothed_points = []

for point in points:

if smoothed_points:

previous = smoothed_points[-1]

smoothed_points.append(previous*factor+point*(1-factor))

else:

smothed_points.append(point)

return smoothed_points

应该是有方法的，但是也是要到了多个epoch的时候才会出现这个问题。

来自为知笔记(Wiz)

目前方向：图像拼接融合、图像识别联系方式：jsxyhelu@foxmail.com

微信关注我们

原文链接：https://yq.aliyun.com/articles/649388

转载内容版权归作者及来源网站所有！

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。

AI不是魔法：人工智能的能与不能

如果把AI技术分为「前端的交互技术」和「后端的人工智能技术」。前端的交互技术包括语音识别、图像识别和自然语言处理;后端的人工智能技术就是人工智能的核心算法，包括深度学习算法、记忆预测模型算法等。这些前后端的人工智能技术在应用又可分为四类：语音识别、图像识别、自然语言处理和用户画像。那么在这四类具体应用的实现上AI技术给我们生活带来哪些便利，同时存在哪些局限?下面一一来解构：一、语音识别语音识别语音识别有两个技术方向，一个是语音的识别，另一个是语音的合成。语音识别是指我们自然发出的声音需要机器转换成语言符号，通过识别和理解过程把语音信号转变为响应的文本或命令，然后再与我们交互。语音识别技术可以应用在电话销售上，例如：公司新人特别多，没有经验，拿到单子的可能性很低。怎么才能让新人也能有很优秀的销售能力呢?过去的做法是，把经验总结成册子，让新人去背，很容易就忘了。但如果有了高精度的语音识别能力，就能识别出客户在问什么，然后在屏幕上告诉新人，该怎么回答这个问题。语音识别的第二个方向是语音的合成，是指机器把文字转换成语音，并且能够根据个人需求定制语音，然后念出来。以前的声音是那种匀速...

2018-05-28

556

简介众所周知，人工神经网络(ANN)的设计思路是模仿人脑结构。但是直到10年前，ANN和人类大脑之间唯一的共同点是对实体的命名方式（例如神经元）。由于预测能力较弱并且实际应用的领域较少，这样的神经网络几乎毫无用处。但是随着近十年来技术的飞速进步，神经网络越来越接近人脑，这使得ANN在各个行业中应用得越来越多。本文中，我们将介绍人工神经网络(ANN)领域的两大革新，这些革新使得ANN更接近于人类大脑。目录 ANN领域的两大革新思想实验序列模型的实际应用序列生成器序列到序列NLP模型一些非文本的序列到序列模型 ANN领域的两大革新随着GPU极大地提升了计算能力，我们可以大幅度地增加神经元的深度和广度。然而这样的人工神经网络仍然远远不及大脑的神经元数量。 ANN现在既可以处理输入节点的序列数据，也可以处理输出节点的序列数据。这和我们大脑的工作

2018-05-29

873

资源下载

更多资源

Mario

马里奥是站在游戏界顶峰的超人气多面角色。马里奥靠吃蘑菇成长，特征是大鼻子、头戴帽子、身穿背带裤，还留着胡子。与他的双胞胎兄弟路易基一起，长年担任任天堂的招牌角色。

腾讯云软件源

为解决软件依赖安装时官方源访问速度慢的问题，腾讯云为一些软件搭建了缓存服务。您可以通过使用腾讯云软件源站来提升依赖包的安装速度。为了方便用户自由搭建服务架构，目前腾讯云软件源站支持公网访问和内网访问。

Nacos

Nacos /nɑ:kəʊs/ 是 Dynamic Naming and Configuration Service 的首字母简称，一个易于构建 AI Agent 应用的动态服务发现、配置管理和AI智能体管理平台。Nacos 致力于帮助您发现、配置和管理微服务及AI智能体应用。Nacos 提供了一组简单易用的特性集，帮助您快速实现动态服务发现、服务配置、服务元数据、流量管理。Nacos 帮助您更敏捷和容易地构建、交付和管理微服务平台。

Spring

Spring框架（Spring Framework）是由Rod Johnson于2002年提出的开源Java企业级应用框架，旨在通过使用JavaBean替代传统EJB实现方式降低企业级编程开发的复杂性。该框架基于简单性、可测试性和松耦合性设计理念，提供核心容器、应用上下文、数据访问集成等模块，支持整合Hibernate、Struts等第三方框架，其适用范围不仅限于服务器端开发，绝大多数Java应用均可从中受益。

DL_WITH_PY系统学习（第3章）

常见的目标函数