苹果开源 FastViT：快速卷积 Transformer 的混合视觉架构-低调大师

苹果开源 FastViT：快速卷积 Transformer 的混合视觉架构

2023-08-16 882

苹果此前在论文《FastViT: A Fast Hybrid Vision Transformer using Structural Reparameterization》中提出的 FastViT 架构已正式开源。

论文地址：https://arxiv.org/pdf/2303.14189.pdf
代码仓库：https://github.com/apple/ml-fastvit

FastViT 有机地结合了 CNN 和 Transformer 的优势，无论在精度或者运行效率上均有了稳定的提升。FastViT 引入了一种新的 Token 混合算子，命名为 RepMixer。从名字来看，它结合了结构重新参数化技术。该算子的作用原理是通过消除网络中的 skip connection 来降低内存访问成本。

FastViT 整体框架图：

实验结果表明，FastViT：

在移动设备上的速度比混合 Transformer 架构 CMT 快 3.5 倍
在 ImageNet 数据集上的精度相同，但速度比 EfficientNet 快 4.9 倍且比 ConvNeXt 快 1.9 倍
在相似的延迟下，FastViT 在 ImageNet 上的 Top-1 精度比 MobileOne 高出 4.2％

参考：https://mp.weixin.qq.com/s/poJur-vOtU2-h2tUe89shA、https://mp.weixin.qq.com/s/uqcWy4sx1NQuqOplsGDUlg

微信关注我们

原文链接：https://www.oschina.net/news/254037

转载内容版权归作者及来源网站所有！

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。

阿里达摩院发布开源版“妙鸭”：FaceChain

FaceChain是一款可以用于打造个人数字形象的深度学习模型工具。用户只需提供最低三张照片即可获得独属于自己的个人形象数字替身。FaceChain支持在梯度的界面中使用模型训练和推理能力，也支持资深开发者使用python脚本进行训练推理。 FaceChain是一个组合模型，使用了包括pytorch和tensorflow在内的机器学习框架，以下是已经验证过的主要环境依赖： python环境：py3.8、py3.10 pytorch版本：torch2.0.0、torch2.0.1 张量流版本：2.7.0，张量流CPU CUDA 版本：11.7 CUDNN 版本：8+ 操作系统版本: Ubuntu 20.04, CentOS 7.9 GPU型号：Nvidia-A10 24G 资源占用 GPU：显存占用约19G 磁盘：推荐装备50GB以上的存储空间算法介绍基本原理个人写真模型的能力来源于稳定扩散模型的文生图功能，输入一段文本或一系列提示词，输出对应的图像。考虑影响个人写真生成效果的主要因素：写真风格信息，以及用户人物信息。在此，分别使用线下训练风格的LoRA模型和线上训练的人脸LoRA...

2023-08-16

1130

视频监控系统涉及到大量的视频数据，需要对这些数据进行存储，以备日后查看或备份。视频监控的存储需求需要根据场所的实际情况进行选择，以保证监控数据的有效存储和日后的调阅、回溯。当前视频监控的存储方式，通常有以下几种： 1）硬盘录像机（DVR）存储：DVR利用硬盘来储存视频数据，具有成本低、容量大、易于管理等优点。 2）网络录像机（NVR）存储：NVR是一种基于网络的视频存储设备，通过网络连接相机或视频服务器，将视频数据存储在硬盘中。NVR具有分布式存储、远程查看、高效率和安全性高等优点。 3）云存储：云存储是一种通过互联网将视频数据存储在云服务器上的存储方式。云存储具有自动备份、远程访问和高可靠性等优势，但需要考虑网络带宽和存储费用等问题。 4）SD卡存储：摄像头可以通过内置或外置的SD卡存储视频数据，具有便携性和易于管理的优点，但存储容量通常较小，需要定期清空或更换SD卡。以上是常见的视频监控存储方式，选择存储方式需要根据实际需求和预算做出权衡。以我们的安防监控视频汇聚平台EasyCVR为例子，EasyCVR支持多种存储方式，支持前端设备硬盘（或SD存储卡）存储、服务器平台存储、本...

2023-08-15

827

资源下载

更多资源

Mario

马里奥是站在游戏界顶峰的超人气多面角色。马里奥靠吃蘑菇成长，特征是大鼻子、头戴帽子、身穿背带裤，还留着胡子。与他的双胞胎兄弟路易基一起，长年担任任天堂的招牌角色。

腾讯云软件源

为解决软件依赖安装时官方源访问速度慢的问题，腾讯云为一些软件搭建了缓存服务。您可以通过使用腾讯云软件源站来提升依赖包的安装速度。为了方便用户自由搭建服务架构，目前腾讯云软件源站支持公网访问和内网访问。

Nacos

Nacos /nɑ:kəʊs/ 是 Dynamic Naming and Configuration Service 的首字母简称，一个易于构建 AI Agent 应用的动态服务发现、配置管理和AI智能体管理平台。Nacos 致力于帮助您发现、配置和管理微服务及AI智能体应用。Nacos 提供了一组简单易用的特性集，帮助您快速实现动态服务发现、服务配置、服务元数据、流量管理。Nacos 帮助您更敏捷和容易地构建、交付和管理微服务平台。

Spring

Spring框架（Spring Framework）是由Rod Johnson于2002年提出的开源Java企业级应用框架，旨在通过使用JavaBean替代传统EJB实现方式降低企业级编程开发的复杂性。该框架基于简单性、可测试性和松耦合性设计理念，提供核心容器、应用上下文、数据访问集成等模块，支持整合Hibernate、Struts等第三方框架，其适用范围不仅限于服务器端开发，绝大多数Java应用均可从中受益。