DJL | DJL 如何正确打开 [ 深度学习 ]

2020-11-03 736

Hi!我是小小，今天带来本周的第三篇，关于一个深度学习框架，基于Java的DJL框架。

前言

很长时间，Java都是一个相当受欢迎的企业编程语言，其框架丰富，生态完善。Java拥有庞大的开发者社区，尽管深度学习应用不断推进和演化，但是相关的深度学习框架对于Java来说相当的稀少，现如今，主要模型都是Python编译和训练，对于Java开发者来说，如果想要学习深度学习，就需要接受一门新的语言的洗礼。为了减少Java开发者学习深度学习的成本，AWS构建了一个Deep Java Library(DJL)，一个为Java开发者定制的开源深度学习框架，其为开发者对接主流深度学习框架，提供了一个接口。

什么是深度学习

在开始之前，先了解机器学习和深度学习基础概念。机器学习是一个利用统计学知识，把数据输入到计算机中进行训练并完成特定目标任务的过程，这种归纳学习方法可以让计算机学习一些特征并进行一系列复杂的任务，比如识别照片中的物体。深度学习是机器学习的一个分支，主要侧重于对于人工神经网络的开发，人工神经网络是通过研究人脑如何学习和实现目标的过程中，归纳出的一套计算逻辑。通过模拟部分人脑神经间信息传递的过程，从而实现各种复杂的任务，深度学习中的深度来源于会在人工神经网络中编制出，构建出许多层，从而进一步对数据信息进行更为深层次的传导。

训练 MNIST 手写数字识别

项目配置

利用 gradle 配置引入依赖包，用DJL的api包和basicdataset包来构建神经网络和数据集，这个案例，使用 MXNet作为深度学习引擎，所以引入mxnet-engine和mxnet-native-auto两个包，依赖如下

plugins {
    id 'java'
}
repositories {                           
    jcenter()
}
dependencies {
    implementation platform("ai.djl:bom:0.8.0")
    implementation "ai.djl:api"
    implementation "ai.djl:basicdataset"
    // MXNet
    runtimeOnly "ai.djl.mxnet:mxnet-engine"
    runtimeOnly "ai.djl.mxnet:mxnet-native-auto"
}

NDArry 和 NDManager

NDArray 是 DJL 存储数据结构和数学运算的基本结构，一个NDArry表达了一个定长的多维数组，NDArry的使用方法，类似于Python的numpy.ndarry。NDManager是NDArry的管理者，其负责管理NDArry的产生和回收过程，这样可以帮助我们更好的对Java内存进行优化，每一个NDArry都会由一个NDManager创造出来，同时他们会在NDManager关闭时一同关闭，

Model

在 DJL 中，训练和推理都是从 Model class 开始构建的，我们在这里主要训练过程中的构建方法，下面我们为 Model 创建一个新的目标，因为 Model 也是继承了 AutoClosable 结构体，用一个 try block实现。

try (Model model = Model.newInstance()) {
    ...
    // 主体训练代码
    ...
}

准备数据

MNIST 数据库包含大量的手写数字的图，通常用来训练图像处理系统，DJL已经把MNIST的数据收集到了 basicdataset 数据里，每个 MNIST 的图的大小是 28 * 28，如果有自己的数据集，同样可以使用同理来收集数据。

数据集导入教程 http://docs.djl.ai/docs/development/how_to_use_dataset.html#how-to-create-your-own-dataset

int batchSize = 32; // 批大小
Mnist trainingDataset = Mnist.builder()
        .optUsage(Usage.TRAIN) // 训练集
        .setSampling(batchSize, true)
        .build();
Mnist validationDataset = Mnist.builder()
        .optUsage(Usage.TEST) // 验证集
        .setSampling(batchSize, true)
        .build();

这段代码分别制作了训练和验证集，同时我们也随机的排列了数据集从而更好的训练，除了这些配置以外，也可以对图片进行进一步的设置，例如设置图片大小，归一化处理。

制作 model 建立 block

当数据集准备就绪以后，就可以构建神经网络，在DJL 中，神经网络是由 Block 代码块构成的，一个Block是一个具备多种神经网络特性的结构，他们可以代表一个操作神经网络的一部分，甚至一个完整的神经网络，然后 block 就可以顺序的执行或者并行。同时 block 本身也可以带参数和子block，这种嵌套结构可以快速的帮助更新一个可维护的神经网络，在训练过程中，每个block附带参数也会实时更新，同时也会更新其子 block。当我们构建这些 block 的过程中，最简单的方式就是把他们一个一个嵌套起来，直接使用准备好的 DJL的 Block 种类，我们就可以快速制作各种神经网络。

block 变体

根据几种基本的神经网络工作模式，我们提供几种Block的变体，

SequentialBlock 是为了输出作为下一个block的输入继续执行到底。
parallelblock 是用于将一个输入并行输入到每一个子block中，同时也将输出结果根据特定的合并方程合并起来。
lambdablock 是帮助用户进行快速操作的一个block，其中不具备任何参数，所以在训练的过程中没有任何部分在训练过程中更新。

构建多层感知机 MLP 神经网络

我们构建一个简单的多层感知机神经网络，多层感知机是一个简单的前向型神经网络，只包含几个全连接层，构建这个网路可以直接使用 sequentialblock

int input = 28 * 28; // 输入层大小
int output = 10; // 输出层大小
int[] hidden = new int[] {128, 64}; // 隐藏层大小
SequentialBlock sequentialBlock = new SequentialBlock();
sequentialBlock.add(Blocks.batchFlattenBlock(input));
for (int hiddenSize : hidden) {
    // 全连接层
    sequentialBlock.add(Linear.builder().setUnits(hiddenSize).build());
    // 激活函数
    sequentialBlock.add(activation);
}
sequentialBlock.add(Linear.builder().setUnits(output).build());

可以使用直接提供好的 MLP Block

Block block = new Mlp(
        Mnist.IMAGE_HEIGHT * Mnist.IMAGE_WIDTH,
        Mnist.NUM_CLASSES,
        new int[] {128, 64});

训练

使用如下几个步骤，完成一个训练过程初始化：我们会对每一个Block的参数进行初始化，初始化每个参数的函数都是由设定的 initializer决定的。前向传播：这一步把输入数据在神经网络中逐层传递，然后产生输出数据。计算损失：我们会根据特定的损失函数 loss 来计算输出和标记结果的偏差。反向传播：在这一步中，利用损失反向求导计算出每一个参数的梯度。更新权重，会根据选择的优化器，更新每一个在 Block 上的参数的值。

精简

DJL 利用了 Trainer 结构体精简了整个过程，开发者只需要创建Trainer 并指定对应的initializer，loss，optimizer即可，这些参数都是由TrainingConfig设定，来看参数的设置。TrainingListener 训练过程设定的监听器，可以实时反馈每个阶段的训练结果，这些结果可以用于记录训练过程或者帮助 debug 神经网络训练过程中遇到的问题。用户可以定制自己的 TrainingListener 来训练过程进行监听

DefaultTrainingConfig config = new DefaultTrainingConfig(Loss.softmaxCrossEntropyLoss())
    .addEvaluator(new Accuracy())
    .addTrainingListeners(TrainingListener.Defaults.logging());
try (Trainer trainer = model.newTrainer(config)){
    // 训练代码
}

训练产生以后，可以定义输入的 Shape，之后可以调用 git函数进行训练，结果会保存在本地目录下

/*
 * MNIST 包含 28x28 灰度图片并导入成 28 * 28 NDArray。
 * 第一个维度是批大小, 在这里我们设置批大小为 1 用于初始化。
 */
Shape inputShape = new Shape(1, Mnist.IMAGE_HEIGHT * Mnist.IMAGE_WIDTH);
int numEpoch = 5;
String outputDir = "/build/model";

// 用输入初始化 trainer
trainer.initialize(inputShape);

TrainingUtils.fit(trainer, numEpoch, trainingSet, validateSet, outputDir, "mlp");

输出的结果图

[INFO ] - Downloading libmxnet.dylib ...
[INFO ] - Training on: cpu().
[INFO ] - Load MXNet Engine Version 1.7.0 in 0.131 ms.
Training:    100% |████████████████████████████████████████| Accuracy: 0.93, SoftmaxCrossEntropyLoss: 0.24, speed: 1235.20 items/sec
Validating:  100% |████████████████████████████████████████|
[INFO ] - Epoch 1 finished.
[INFO ] - Train: Accuracy: 0.93, SoftmaxCrossEntropyLoss: 0.24
[INFO ] - Validate: Accuracy: 0.95, SoftmaxCrossEntropyLoss: 0.14
Training:    100% |████████████████████████████████████████| Accuracy: 0.97, SoftmaxCrossEntropyLoss: 0.10, speed: 2851.06 items/sec
Validating:  100% |████████████████████████████████████████|
[INFO ] - Epoch 2 finished.NG [1m 41s]
[INFO ] - Train: Accuracy: 0.97, SoftmaxCrossEntropyLoss: 0.10
[INFO ] - Validate: Accuracy: 0.97, SoftmaxCrossEntropyLoss: 0.09
[INFO ] - train P50: 12.756 ms, P90: 21.044 ms
[INFO ] - forward P50: 0.375 ms, P90: 0.607 ms
[INFO ] - training-metrics P50: 0.021 ms, P90: 0.034 ms
[INFO ] - backward P50: 0.608 ms, P90: 0.973 ms
[INFO ] - step P50: 0.543 ms, P90: 0.869 ms
[INFO ] - epoch P50: 35.989 s, P90: 35.989 s

训练结束以后，就可以对模型进行识别了和使用了。

关于作者

我是小小，一个生于二线城市活在一线城市的小小，本期结束，我们下期再见。

小明菜市场

关于卫星定位，你想知道的一切

简介：本文将简要介绍卫星定位的原理和应用情况，方便大家对北斗、卫星定位有更多的了解。 5G和北斗，是国之重器。北斗作为卫星定位系统，目前在国际上已处于领先地位，而且已经渗透到我们工作和生活的方方面面。本文将简要介绍卫星定位的原理和应用情况，方便大家对北斗、卫星定位有更多的了解。卫星定位的原理卫星定位系统的英文是Global Navigation Satellite System(GNSS），虽然直接翻译过来是导航卫星系统，但它真正提供的能力是定位，能定位后，导航就变得相对简单了。卫星定位的原理，是利用卫星播发时间信号，当设备接收到后，可以根据信号发射时间和本地时间，计算出信号传输时间，再结合光速获得卫星-设备距离。有了多颗卫星的信号，可以列出一组方程，求解4个未知数：设备的三维坐标x/y/z，以及本地时间与GNSS系统的时间差。式中的代表卫星j的三维坐标，这个坐标可以通过卫星星历计算获得。星历是描述卫星运行轨道的一组参数，卫星轨道是一个椭圆，通过几个参数和时间，可以唯一确定卫星的准确位置。星历的获取有两种方式，一种是卫星直接播发，这种方式的好处是定位过程不依赖卫星信号以...

2020-11-04

570

思维导图文章已收录Github精选，欢迎Star：https://github.com/yehongzhi/learningSummary 概述我们都知道，在生产环境中经常会遇到很多异常，报错信息，需要查看日志信息排查错误。现在的系统大多比较复杂，即使是一个服务背后也是一个集群的机器在运行，如果逐台机器去查看日志显然是很费力的，也不现实。如果能把日志全部收集到一个平台，然后像百度，谷歌一样通过关键字搜索出相关的日志，岂不快哉。于是就有了集中式日志系统。ELK就是其中一款使用最多的开源产品。一、什么是ELK ELK其实是Elasticsearch，Logstash 和 Kibana三个产品的首字母缩写，这三款都是开源产品。 ElasticSearch(简称ES)，是一个实时的分布式搜索和分析引擎，它可以用于全文搜索，结构化搜索以及分析。 Logstash，是一个数据收集引擎，主要用于进行数据收集、解析，并将数据发送给ES。支持的数据源包括本地文件、ElasticSearch、MySQL、Kafka等等。 Kibana，为 Elasticsearch 提供了分析和 Web 可视化界...

2020-11-03

614

资源下载

更多资源

腾讯云软件源

为解决软件依赖安装时官方源访问速度慢的问题，腾讯云为一些软件搭建了缓存服务。您可以通过使用腾讯云软件源站来提升依赖包的安装速度。为了方便用户自由搭建服务架构，目前腾讯云软件源站支持公网访问和内网访问。

Nacos

Nacos /nɑ:kəʊs/ 是 Dynamic Naming and Configuration Service 的首字母简称，一个易于构建 AI Agent 应用的动态服务发现、配置管理和AI智能体管理平台。Nacos 致力于帮助您发现、配置和管理微服务及AI智能体应用。Nacos 提供了一组简单易用的特性集，帮助您快速实现动态服务发现、服务配置、服务元数据、流量管理。Nacos 帮助您更敏捷和容易地构建、交付和管理微服务平台。

Rocky Linux

Rocky Linux（中文名：洛基）是由Gregory Kurtzer于2020年12月发起的企业级Linux发行版，作为CentOS稳定版停止维护后与RHEL（Red Hat Enterprise Linux）完全兼容的开源替代方案，由社区拥有并管理，支持x86_64、aarch64等架构。其通过重新编译RHEL源代码提供长期稳定性，采用模块化包装和SELinux安全架构，默认包含GNOME桌面环境及XFS文件系统，支持十年生命周期更新。

Sublime Text

Sublime Text具有漂亮的用户界面和强大的功能，例如代码缩略图，Python的插件，代码段等。还可自定义键绑定，菜单和工具栏。Sublime Text 的主要功能包括：拼写检查，书签，完整的 Python API ， Goto 功能，即时项目切换，多选择，多窗口等等。Sublime Text 是一个跨平台的编辑器，同时支持Windows、Linux、Mac OS X等操作系统。