不加班的秘诀：如何通过AOE快速集成NCNN？-低调大师

不加班的秘诀：如何通过AOE快速集成NCNN？

2019-11-19 728

直接集成NCNN的缺点

直接集成NCNN相对麻烦，为SqueezeNet接入NCNN，把相关的模型文件，NCNN的头文件和库，JNI调用，前处理和后处理相关业务逻辑等。把这些内容都放在SqueezeNet Sample工程里。这样简单直接的集成方法，问题也很明显，和业务耦合比较多，不具有通用性，前处理后处理都和SqueezeNcnn这个Sample有关，不能很方便地提供给其他业务组件使用。深入思考一下，如果我们把AI业务，作为一个一个单独的AI组件提供给业务的同学使用，会发生这样的情况：

每个组件都要依赖和包含NCNN的库，而且每个组件的开发同学，都要去熟悉NCNN的接口，写C的调用代码，写JNI。所以我们很自然地会想到要提取一个NCNN的组件出来，提取以后如图所示：

AOE SDK里的NCNN组件

有了AOE SDK,就可以使操作更加简便。在AOE开源SDK里，我们提供了NCNN组件，下面我们从4个方面来讲一讲NCNN组件：

1.NCNN组件的设计
2.对SqueezeNet Sample的改造
3.应用如何接入NCNN组件
4.对NCNN组件的一些思考

NCNN组件的设计

NCNN组件的设计理念是组件里不包含具体的业务逻辑，只包含对NCNN接口的封装和调用。具体的业务逻辑，由业务方在外部实现。在接口定义和设计上，我们参考了TF Lite的源码和接口设计。目前提供的对外调用接口，如下图：

// 加载模型和param
void loadModelAndParam(...)
// 初始化是否成功
boolean isLoadModelSuccess()
// 输入rgba数据
void inputRgba(...)
// 进行推理
void run(...)
// 多输入多输出推理
void runForMultipleInputsOutputs(...)
// 得到推理结果
Tensor getOutputTensor(...)
// 关闭和清理内存
void close()

而机智骚年本人，用的是这个：

├── AndroidManifest.xml
├── cpp
│   └── ncnn
│       ├── c_api_internal.h
│       ├── include
│       ├── interpreter.cpp
│       ├── Interpreter.h
│       ├── jni_util.cpp
│       ├── jni_utils.h
│       ├── nativeinterpreterwrapper_jni.cpp
│       ├── nativeinterpreterwrapper_jni.h
│       ├── tensor_jni.cpp
│       └── tensor_jni.h
├── java
│   └── com
│       └── didi
│           └── aoe
│               └── runtime
│                   └── ncnn
│                       ├── Interpreter.java
│                       ├── NativeInterpreterWrapper.java
│                       └── Tensor.java
└── jniLibs
    ├── arm64-v8a
    │   └── libncnn.a
    └── armeabi-v7a
        └── libncnn.a

●Interpreter，提供给外部调用，提供模型加载，推理这些方法。

●NativeInterpreterWrapper是具体的实现类，里面对native进行调用。

●Tensor，主要是一些数据和native层的交互。

AOE NCNN用的好，任务完成早，奥秘在此。

1.支持多输入多输出。
2.使用ByteBuffer来提升效率。
3.使用Object作为输入和输出（实际支持了Bytebuffer和多维数据组）

光说不练假把式，AOE NCNN的实现过程，且听我细细道来。

如何支持多输入多输出

为了支持多输入和多输出，我们在Native层创建了一个Tensor对象的列表，每个Tensor对象里保存了相关的输入和输出数据。Native层的Tensor对象，通过tensor_jni提供给java层调用，java层维护这个指向native层tensor的“指针”地址。这样在有多输入和多输出的时候，只要拿到这个列表里的对应的Tensor，就可以就行数据的操作了。

ByteBuffer的使用

ByteBuffer，字节缓存区处理子节的，比传统的数组的效率要高。
DirectByteBuffer，使用的是堆外内存，省去了数据到内核的拷贝，因此效率比用ByteBuffer要高。

当然ByteBuffer的使用方法不是我们要说的重点，我们说说使用了ByteBuffer以后，给我们带来的好处：

1. 接口里的字节操作更加便捷，例如里面的putInt，getInt，putFloat，getFloat，flip等一系列接口，可以很方便的对数据进行操作。
2. 和native层做交互，使用DirectByteBuffer，提升了效率。我们可以简单理解为java层和native层可以直接对一块“共享”内存进行操作，减少了中间的字节的拷贝过程。

如何使用Object作为输入和输出

目前我们只支持了ByteBuffer和MultiDimensionalArray。在实际的操作过程中，如果是ByteBuffer，我们会判断是否是direct buffer，来进行不同的读写操作。如果是MultiDimensionalArray，我们会根据不同的数据类型（例如int, float等），维度等，来对数据进行读写操作。

对SqueezeNet Sample的改造

集成AOE NCNN组件以后，让SqueezeNet依赖NCNN Module，SqueezeNet Sample里面只包含了模型文件，前处理和后处理相关的业务逻辑，前处理和后处理可以用java，也可以用c来实现，由具体的业务实现来决定。新的代码结构变得非常简洁，目录如下：

├── AndroidManifest.xml
├── assets
│   └── squeeze
│       ├── model.config
│       ├── squeezenet_v1.1.bin
│       ├── squeezenet_v1.1.id.h
│       ├── squeezenet_v1.1.param.bin
│       └── synset_words.txt
└── java
    └── com
        └── didi
            └── aoe
                └── features
                    └── squeeze
                        └── SqueezeInterpreter.java

↑ Sample也适用于其他的AI业务组件对NCNN组件的调用。

应用如何接入NCNN组件
对NCNN组件的接入，有两种方式

●直接接入

●通过AOE SDK接入

▲两种接入方式比较：

不BATTLE了，我单方面宣布，AOE SDK完胜！

对NCNN组件的总结和思考

通过对NCNN组件的封装，现在业务集成NCNN更加快捷方便了。之前我们一个新的业务集成NCNN，可能需要半天到一天的时间。使用AOE NCNN组件以后，可能只需要1-2小时的时间。当然NCNN组件目前还存在很多不完善的地方，我们对NCNN还需要去加深学习和理解。后面会通过不断的学习，持续的对NCNN组件进行改造和优化。

- - - - - - - - - - - - - - - - - - - - - - - - - - - - A o E - - - - - - - - - - - - - - - - - - - - - - - - - - - -

微信关注我们

原文链接：https://yq.aliyun.com/articles/727639

转载内容版权归作者及来源网站所有！

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。

降本增效利器，阿里云Serverless应用引擎(SAE)节省闲置计算资源最高达 57%！

降本增效是企业IT部门永恒的话题。通过技术手段，可以降低企业每年的IT支出，提高企业的运作效率。企业上云后，借助云的弹性，降低了企业过去购买服务器等各类硬件设备的一次性成本投入，也缩短了企业上线应用的时间。但也出现了新的成本课题：互联网在线应用业务量的频繁波动使得云上计算资源的CPU、负载等资源利用率并不高，即便没有流量访问业务，企业也需要为云上的资源买单，闲置计算资源浪费现象严重。阿里云Serverless应用引擎(SAE)>>> 借助 Serverless 技术，可最大限度的支撑服务器的伸缩需求，即客户只需要为实际的消费，而不是基于预测的资源买单。通过下面这张图，我们就能对Serverless技术的优势一目了然：近日，阿里云首款面向应用的Serverless PaaS 产品 - Serverless应用引擎（SAE）重磅升级，其提供的： “一键启停开发测试环境”功能，实现了按需释放闲置资源，节省成本，需要使用时即可一键秒级拉起。端到端启动时长仅20s，满足突发场景快速扩容的需要。支持0.5core的最小规格，进一步降低了用户的使用成本，部署一套日常环境成...

2019-11-21

797

原标题：这项智能制造技术，竟能为每条产线省下42000美元！一个不起眼的瑕疵有多么可怕？我们常说，“千里之堤，溃于蚁穴”，并非耸人听闻之言。在高速公路事故统计中，70%的事故由轮胎引起，且在高速行驶下的生还率非常低。而在生产力大幅提升的当下，像这样的产品仅靠人工检测是很难做到的，这就需要运用物联网、人工智能等技术。工业制造领域，瑕疵检测一直是生产过程中的重要一环。众所周知，工厂实际生产过程并不能保证生产出来的产品百分之百的完美，或者是产品是螺丝没有拧紧，或者是表面有细小的凹陷和划痕，或者是产品标签忘记粘贴……特别是在电子产品、汽车、航天航空等高科技产业中，如果因为一个不起眼的瑕疵导致安全事故的发生，轻则致使财产受到损失，重则甚至可以发生伤亡事故——无论如何，对于企业而言都是难以承受的伤痛。为确保产品质量，以往工厂往往会耗费上千人力

2019-11-19

605

资源下载

更多资源

Mario

马里奥是站在游戏界顶峰的超人气多面角色。马里奥靠吃蘑菇成长，特征是大鼻子、头戴帽子、身穿背带裤，还留着胡子。与他的双胞胎兄弟路易基一起，长年担任任天堂的招牌角色。

Nacos

Nacos /nɑ:kəʊs/ 是 Dynamic Naming and Configuration Service 的首字母简称，一个易于构建 AI Agent 应用的动态服务发现、配置管理和AI智能体管理平台。Nacos 致力于帮助您发现、配置和管理微服务及AI智能体应用。Nacos 提供了一组简单易用的特性集，帮助您快速实现动态服务发现、服务配置、服务元数据、流量管理。Nacos 帮助您更敏捷和容易地构建、交付和管理微服务平台。

Rocky Linux

Rocky Linux（中文名：洛基）是由Gregory Kurtzer于2020年12月发起的企业级Linux发行版，作为CentOS稳定版停止维护后与RHEL（Red Hat Enterprise Linux）完全兼容的开源替代方案，由社区拥有并管理，支持x86_64、aarch64等架构。其通过重新编译RHEL源代码提供长期稳定性，采用模块化包装和SELinux安全架构，默认包含GNOME桌面环境及XFS文件系统，支持十年生命周期更新。

Sublime Text

Sublime Text具有漂亮的用户界面和强大的功能，例如代码缩略图，Python的插件，代码段等。还可自定义键绑定，菜单和工具栏。Sublime Text 的主要功能包括：拼写检查，书签，完整的 Python API ， Goto 功能，即时项目切换，多选择，多窗口等等。Sublime Text 是一个跨平台的编辑器，同时支持Windows、Linux、Mac OS X等操作系统。