您现在的位置是：首页 > 文章详情

ncnn 发布 20210507 版本，int8 量化推理大幅优化超 500%

日期：2021-05-09点击：902收藏

ncnn是腾讯开源为手机端极致优化的高性能神经网络前向计算框架。

仰赖ncnn社区开发者的贡献，ncnn在2019年年初便已实现int8模型量化和推理。但因后来失去社区开发者的持续投入，ncnn的int8量化推理效率迟迟没有加速。

ncnn github issue区大家关于int8量化后速度的质疑：

引用zhihu用户John Hexa关于《如何看待国内开源项目的不可持续性？》的一段回答：

“开源的生命力并不在于“开源”，而在于为人类好好的、真正的解决掉一个问题。

不是自己提供一个半成品，指望别人完成成品。

而是自己要提供一个成品，让别人可以完成更好的成品。

不是自己提出一个问题，指望别人给你答案。

而是自己给出一个答案，让别人可以找到更好的答案。”

本以为，ncnn的开发者社区足够活跃，可以等到一位愿意为ncnn优化加速int8计算的贡献者。

这确实是我错了。

本次20210507版本，ncnn的int8量化工具和整个int8推理计算架构被进行了彻底重构，作者删除了老旧的kernel实现，亲自写了大量arm neon汇编，4w+行代码，用上armv8.2 dot指令加速。最终，在int8量化和推理加速上，ncnn提供了一个成品，给出了一个答案。

ncnn 20210507版本下载地址(linux/windows/macos/android/ios/webassembly，cpu+gpu)

继续保持优秀的接口稳定性和兼容性

ncnn int8量化工具(ncnn2table)新特性

ncnn int8量化推理新特性

ncnn 20210507版本的其他更新

mobilenet int8模型，ncnn自带的benchncnn评测工具，测试手机：oneplus 7t(qcom855+）

关注公众号

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。

持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。

转载内容版权归作者及来源网站所有，本站原创内容转载请注明来源。

Java分享