每日一博 | 图解神秘的 NC4HW4-低调大师

每日一博 | 图解神秘的 NC4HW4

2021-04-22 709 89

【GiantPandaCV导语】以卷积和im2col+gemm实现卷积操作举例,来图解深度学习中Tensor的NC4HW4(其实应该是N{C/4+C%4>0?1:0}HW4),写成NC4HW4方便阅读.

什么是NC4HW4？

对于卷积操作, 根据计算机内存排布特点, 按行进行处理.处理完一个通道的数据, 转入下一个通道继续按行处理.

对于一个nchw格式的Tensor来说, 其在计算机中的内存排布是这样的:

使用cpp一次指令处理一个数据, 用来处理卷积操作, 即循环实现乘法相加即可.

现在有一条指令处理4组数据的能力, 比如x86结构的sse指令,arm的neon指令.以及GPGPU的OpenGL和OpenCL,单次处理RGBA四组数据. 如果继续使用nchw内存排布的话, 是这样的.

根据按行处理特点, 对于Feature和kernel的宽不是4倍数进行处理, 会出现错误. 图中的kernel很明显以已经到了第二行的值。那么有没有方法在按行处理的思想上, 一次处理4个数,而不受影响.答案是有的, 即NC4HW4.即把前4个通道合并在一个通道上, 依次类推, 在通道数不够4的情况下进行补0.

经过NC4HW4重排后的Tensor在内存中的排布情况如下:

那么, 此时在进行单次指令处理4组数据的处理,就没有问题了.只不过处理结果也是NC4HW4结构的，需要在结果输出加上NC4HW4转nchw.

NC4HW4中使用im2col+gemm实现卷积:

im2col+gemm在深度学习中是最常用的对卷积进行加速计算的方案。最早在caffe框架中支持。思路如下:

使用im2col+gemm进行计算:

对于NC4HW4内存排布的Tensor来说,同样可以采用im2col+gemm来处理.
有如下卷积,可以使用NC4HW4内存排布方式,使用指令集优化对卷积进行加速.

NCHW转NC4HW4.

NC4HW4对feature进行im2col

NC4HW4对kernel进行im2col

使用SSE,Neon,OpenCL或OpenGL实现Gemm.

最后

欢迎关注我和BBuf及公众号的小伙伴们一块维护的一个深度学习框架Msnhnet: https://github.com/msnh2012/Msnhnet

Screen To Gif 2.28.1 发布，动画录制软件

Screen to Gif 是一款方便好用的小软件，可以用来快速录制屏幕上的指定区域，将其直接保存为 GIF 动画文件。目前，Screen To Gif 2.28.1已完成发布，这是一个 bug 修复版本。具体更新内容如下： Bug 修复打开编辑器窗口会导致一些用户崩溃不遵守gifs 和 apngs 的循环设置上传预设面板没有遵循应用程序的主题 More info 已知的问题更新说明：https://github.com/NickeManarin/ScreenToGif/releases/tag/2.28.1

580

2021-04-22 08:48:00

PcapXray —— 网络取证工具

PcapXray 是一个网络取证工具，它可以捕获网络数据包，并可视化为包括设备标识的网络图，并突出显示重要的通信和文件操作。给定一个 Pcap 文件，PcapXray 可以绘制出一个网络图，显示网络中的主机、网络流量，突出显示重要流量和 Tor 流量以及潜在的恶意流量，包括通信中涉及的数据。支持的组件：网络图设备/流量细节展示与分析恶意流量识别 Tor 流量支持 GUI，可以上传 Pcap 文件并显示网络图特性：结构清晰的代码流考虑内存，数据库不用JSON，而是用SQLite 或其它优秀的数据库前端使用基于 Web 的平台，如 Django 应用稳定支持许多协议

836

资源下载

更多资源

优质分享Android(本站安卓app)

近一个月的开发和优化，本站点的第一个app全新上线。该app采用极致压缩，本体才4.36MB。系统里面做了大量数据访问、缓存优化。方便用户在手机上查看文章。后续会推出HarmonyOS的适配版本。

Mario，低调大师唯一一个Java游戏作品

马里奥是站在游戏界顶峰的超人气多面角色。马里奥靠吃蘑菇成长，特征是大鼻子、头戴帽子、身穿背带裤，还留着胡子。与他的双胞胎兄弟路易基一起，长年担任任天堂的招牌角色。

Oracle Database，又名Oracle RDBMS

Oracle Database，又名Oracle RDBMS，或简称Oracle。是甲骨文公司的一款关系数据库管理系统。它是在数据库领域一直处于领先地位的产品。可以说Oracle数据库系统是目前世界上流行的关系数据库管理系统，系统可移植性好、使用方便、功能强，适用于各类大、中、小、微机环境。它是一种高效率、可靠性好的、适应高吞吐量的数据库方案。

Eclipse（集成开发环境）

Eclipse 是一个开放源代码的、基于Java的可扩展开发平台。就其本身而言，它只是一个框架和一组服务，用于通过插件组件构建开发环境。幸运的是，Eclipse 附带了一个标准的插件集，包括Java开发工具（Java Development Kit，JDK）。