10 行代码，实现手写数字识别-低调大师

10 行代码，实现手写数字识别

2018-11-27 819

识别手写的阿拉伯数字，对于人类来说十分简单，但是对于程序来说还是有些复杂的。

不过随着机器学习技术的普及，使用10几行代码，实现一个能够识别手写数字的程序，并不是一件难事。这是因为有太多的机器学习模型可以拿来直接用，比如tensorflow、caffe，在python下都有现成的安装包，写一个识别数字的程序，10几行代码足够了。

然而我想做的，是不借助任何第三方的库，从零开始，完全自己实现一个这样的程序。之所以这么做，是因为自己动手实现，才能深入了解机器学习的原理。

1 模型实现
1.1 原理
熟悉神经网络回归算法的，可以略过这一节了。

学习了一些基本概念，决定使用回归算法。首先下载了著名的MNIST数据集，这个数据集有60000个训练样本，和10000个测试样本。每个数字图片都是2828的灰度图片，所以输入可以认为是一个2828的矩阵，也可以认为是一个28*28=784个像素值。

这里定义一个模型用于判断一个图片数字，每个模型包括每个输入的权重，加一个截距，最后再做个归一。模型的表达式：

Out5= sigmoid(X0W0+ X1W1+……X783*W783+bias)

X0到X783是784个输入，W0到W783是784个权重，bias是一个常量。sigmoid函数可以将较大范围的数挤压到(0,1)区间内，也就是归一。

例如我们用这一组权重和bias来判断数字5，期望当图片是5时输出是1，当不是5时输出是0。然后训练的过程就是根据每个样本的输入，计算Out5的值和正确值（0或1）的差距，然后根据这个差距，调整权重和bias。转换一下公式，就是在努力使得（Out5-正确值）接近于0，即所谓损失最小。

同理，10个数字就要有10套模型，每个判断不同的数字。训练好以后，一个图片来了，用这10套模型进行计算，哪个模型计算的结果更接近于1，就认为这个图片是哪个数字。

1.2 训练
按照上面的思路，使用集算器的SPL（结构化处理语言）来编码实现：

不用再找了，训练模型的所有代码都在这里了，没有用到任何第三方库，下面解析一下：

A1，用游标导入MNIST训练样本，这个是我转换过的格式，可以被集算器直接访问；

A2，定义变量：输入x，权重wei，训练速度v，等；

A3，B3，初始化10组模型（每组是784个权重+1个bias）；

A4，循环取5万个样本进行训练，10模型同时训练；

B4，取出来label，即这个图片是几；

B5，计算正确的10个输出，保存到变量y；

B6，取出来这个图片的28*28个像素点作为输入，C6把每个输入除以255，这是为了归一化；

B7，计算X0W0+ X1W1+……X783*W783+bias

B8，计算sigmoid(B7)

B9，计算B8的偏导，或者叫梯度；

B10，C10，根据B9的值，循环调整10个模型的参数；

A11，训练完毕，把模型保存到文件。

1.3 测试
测试一下这个模型的成功率吧，用 SPL 写了一个测试程序：

运行测试，正确率达到了91.1%，我对这个结果是很满意的，毕竟这只是一个单层模型，我用TensorFlow的单层模型得到的正确率也是91%多一点。下面解析一下代码：

A1，导入模型文件；

A2，把模型提取到变量里；

A3，计数器初始化（用于计算成功率）；

A4，导入MNIST测试样本，这个文件格式是我转换过的；

A5，循环取1万个样本进行测试；

B5，取出来label；

B6，清空输入；

B7，取出来这个图片的28*28个像素点作为输入，每个输入除以255，这是为了归一化；

B8，计算X0W0+ X1W1+……X783*W783+bias

B9，计算sigmoid(B7)

B10，得到最大值，即最可能的那个数字；

B11，判断正确测计数器加一；

A12，A13，测试结束，关闭文件，输出正确率。

1.4 优化
这里要说的优化并不是继续提高正确率，而是提升训练的速度。想提高正确率的同学可以尝试一下这几个手段：

1. 加一个卷积层；

2. 学习速度不要用固定值，而是随着训练次数递减；

3. 权重的初始值不要使用全零，使用正态分布；

我认为单纯追求正确率的意义不大，因为MNIST数据集有些图片本身就有问题，即使人工也不一定能知道写的是数字几。我用集算器显示了几张出错的图片，都是书写十分不规范的，下面这个图片很难看出来是2。

下面说重点，要提高训练速度，可以使用并行或集群。使用SPL语言实现并行很简单，只要使用fork关键字，把上面的代码稍加处理就可以了。

使用了并行之后，训练的时间减少差不多一半，而代码并没有做太多修改。

2 为什么是 SPL 语言？
使用SPL语言在初期可能会有点不适应，用得多了会觉得越来越方便：

1. 支持集合运算，比如例子里用到的784个输入和784个权重的乘法，直接写一个**就可以了，如果使用Java或者C，还要自己实现。

2. 数据的输入输出很方便，可以方便地对文件读写。

3. 调试太方便了，所有变量都直观可见，这一点比python要好用。

4. 可以单步计算，有了改动不用从头重来，Java和C做不到这一点，python虽然可以但也不方便，集算器只要点中相应格执行就可以了。

5. 实现并行和集群很方便，不需要太多的开发工作量。

6. 支持调用和被调用。集算器可以调用第三方java库，Java也可以调用集算器的代码，例如上面的代码就可以被Java调用，实现一个自动填验证码的功能。

这样的编程语言，用在数学计算上，实在是最合适不过了。

154037421300096d9.rar

微信关注我们

原文链接：https://yq.aliyun.com/articles/673777

转载内容版权归作者及来源网站所有！

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。

.NET Core实战项目之CMS 第二章入门篇-快速入门ASP.NET Core看这篇就够了

作者：依乐祝原文链接：https://www.cnblogs.com/yilezhu/p/9985451.html本来这篇只是想简单介绍下ASP.NET Core MVC项目的（毕竟要照顾到很多新手朋友），但是转念一想不如来点猛的（考虑到急性子的朋友），让你通过本文的学习就能快速的入门ASP.NET Core。既然是快速入门所以过多过深的内容我这里就一笔带过了！然后在后面的一些列文章中再慢慢的对其中的概念进行阐述。本文已收录至.NET Core实战项目之CMS 第一章入门篇-开篇及总体规划点击可以查看更多教程。 .NET Core是什么很多朋友看到.NET Core就认为是ASP.NET Core，其实这是有误区的，因为.NET Core 是开放源代码的通用开发平台（是一个“平台”），基于这个开放平台我们可以开发像ASP.NET Core应用程序， Windows 10 通用 Windows 平台 (UWP),Tizen等等,而我们系列教程就是用.NET Core开发ASP.NET Core应用程序。而且由 Microsoft官方团队和 .NET社区成员共同在 GitHub ...

2018-11-27

621

Java 运算符计算机的最基本用途之一就是执行数学运算，作为一门计算机语言，Java也提供了一套丰富的运算符来操纵变量。我们可以把运算符分成以下几组：算术运算符关系运算符位运算符逻辑运算符赋值运算符其他运算符。。。算术运算符算术运算符用在数学表达式中，它们的作用和在数学中的作用一样。下表列出了所有的算术运算符。下面的实例假设整数变量A的值为10，变量B的值为20：操作符描述例子加法 - 相加运算符两侧的值 A + B等于30 减法 - 左操作数减去右操作数 A – B等于-10 乘法 - 相乘操作符两侧的值 A * B等于200/ 除法 - 左操作数除以右操作数 B / A等于2 ％取模 - 左操作数除以右操作数的余数 B%A等于0++ 自增 - 操作数的值增加1 B++ 或 ++B 等于 21-- 自减 - 操作数的值减少1 B-- 或 --B 等于 19。。。关系运算符整站下载软件下面为Java支持的关系运算符整站下载软件下面中的实例整数变量A的值为10，变量B的值为20：运算符描述例子== 检查如果两个操作数的值是否相等，如果相等则条件为真。（A ==...

2018-11-27

721

资源下载

更多资源

Nacos

Nacos /nɑ:kəʊs/ 是 Dynamic Naming and Configuration Service 的首字母简称，一个易于构建 AI Agent 应用的动态服务发现、配置管理和AI智能体管理平台。Nacos 致力于帮助您发现、配置和管理微服务及AI智能体应用。Nacos 提供了一组简单易用的特性集，帮助您快速实现动态服务发现、服务配置、服务元数据、流量管理。Nacos 帮助您更敏捷和容易地构建、交付和管理微服务平台。

Spring

Spring框架（Spring Framework）是由Rod Johnson于2002年提出的开源Java企业级应用框架，旨在通过使用JavaBean替代传统EJB实现方式降低企业级编程开发的复杂性。该框架基于简单性、可测试性和松耦合性设计理念，提供核心容器、应用上下文、数据访问集成等模块，支持整合Hibernate、Struts等第三方框架，其适用范围不仅限于服务器端开发，绝大多数Java应用均可从中受益。

Rocky Linux

Rocky Linux（中文名：洛基）是由Gregory Kurtzer于2020年12月发起的企业级Linux发行版，作为CentOS稳定版停止维护后与RHEL（Red Hat Enterprise Linux）完全兼容的开源替代方案，由社区拥有并管理，支持x86_64、aarch64等架构。其通过重新编译RHEL源代码提供长期稳定性，采用模块化包装和SELinux安全架构，默认包含GNOME桌面环境及XFS文件系统，支持十年生命周期更新。

Sublime Text

Sublime Text具有漂亮的用户界面和强大的功能，例如代码缩略图，Python的插件，代码段等。还可自定义键绑定，菜单和工具栏。Sublime Text 的主要功能包括：拼写检查，书签，完整的 Python API ， Goto 功能，即时项目切换，多选择，多窗口等等。Sublime Text 是一个跨平台的编辑器，同时支持Windows、Linux、Mac OS X等操作系统。