每日一博 | 基于 OneFlow 实现量化感知训练
本文介绍了量化感知训练的原理,基于OneFlow实现了一个量化感知训练Demo,并介绍了在具体实现中的各种细节。 1 后量化以及量化感知训练原理 这里说的量化一般都是指的Google TFLite的量化方案,对应的是Google 的论文Quantization and Training of Neural Networks for Efficient Integer-Arithmetic-Only Inference。虽然TfLite这套量化方案并不是很难,但在实际处理的时候细节还是比较多,一时是很难说清楚的。 所以,这里推荐一系列讲解TFLite后量化和量化感知训练原理的文章,看一下这几篇文章阅读本文就没有任何问题了。 神经网络量化入门--基本原理 神经网络量化入门--后训练量化 神经网络量化入门--量化感知训练 神经网络量化入门--Folding BN ReLU代码实现 这里简单总结一下,无论是TFLite的量化方案还是TensorRT的后量化方案,他们都会基于原始数据和量化数据的数值范围算出一个缩放系数scale和零点zero_point,这个zero_point有可能是0(对应...
