苹果开源两大模型家族:FastVLM 与 MobileCLIP2
苹果在 Hugging Face 上开源了 FastVLM 和 MobileCLIP2 两大模型家族:
- FastVLM 是一种视觉语言模型(VLM),专为高分辨率图像设计,旨在减少 token 输出并压缩编码时间,可以高效地理解图像和文本之间的关系。
- MobileCLIP2 是 CLIP 模型的轻量化、移动端优化版本,专注于在手机或边缘设备上进行高效推理。
FastVLM系列包含0.5B、1.5B、7B三个参数规模,全部基于新提出的FastViTHD混合视觉编码器,专为高分辨率图像输出更少token、压缩编码时间。FastVLM-7B在DocVQA达到93.2,在ScienceQA达到96.7,表现领先。
MobileCLIP2系列同样上线,提供相应 Hugging Face Collections 页面。
CVPR 2025论文《FastVLM: Efficient Vision Encoding for Vision Language Models》已公开,引用信息随模型仓库一并提供。
https://huggingface.co/collections/apple/fastvlm-68ac97b9cd5cacefdd04872e https://huggingface.co/spaces/apple/fastvlm-webgpu
https://huggingface.co/collections/apple/mobileclip2-68ac947dcb035c54bcd20c47

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。
持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。
转载内容版权归作者及来源网站所有,本站原创内容转载请注明来源。
-
上一篇
美团正式发布并开源 LongCat-Flash-Chat
美团正式发布 LongCat-Flash-Chat,并同步开源。LongCat-Flash 采用创新性混合专家模型(Mixture-of-Experts, MoE)架构,总参数 560 B,激活参数 18.6B~31.3B(平均 27B),实现了计算效率与性能的双重优化。 基准测试评估表明,作为一款非思考型基础模型,LongCat-Flash-Chat 在仅激活少量参数的前提下,性能比肩当下领先的主流模型,尤其在智能体任务中具备突出优势。并且,因为面向推理效率的设计和创新,LongCat-Flash-Chat 具有明显更快的推理速度,更适合于耗时较长的复杂智能体应用。 技术亮点 LongCat-Flash 模型在架构层面引入“零计算专家(Zero-Computation Experts)”机制,总参数量 560 B,每个token 依据上下文需求仅激活 18.6B~31.3 B 参数,实现算力按需分配和高效利用。为控制总算力消耗,训练过程采用 PID 控制器实时微调专家偏置,将单 token 平均激活量稳定在约 27 B。 此外,LongCat-Flash 在层间铺设跨层通道,使 Mo...
-
下一篇
百度“91助手”将于本月底全面停止所有服务
根据91助手官方消息,该应用将于2025年9月27日23:59起全面停止所有服务,包括但不限于手机连接管理、文件传输、应用安装卸载、系统清理等功能。 官方建议用户在此期间及时备份相关数据,服务终止后,用户在91助手的数据将永久丢失,无法再以任何方式找回。此外91助手将向仍处于会员期的用户进行退费,但需要用户主动申请,未主动申请退费的用户将无法获得退款。 作为百度2013年以19亿美元重金收购的标志性资产,其停服不仅意味着一款产品的生命周期终结,更折射出整个移动应用分发行业的深刻变革,以及移动互联网早期红利的终结。 截至发稿,百度方面未作回应。
相关文章
文章评论
共有0条评论来说两句吧...
文章二维码
点击排行
推荐阅读
最新文章
- SpringBoot2全家桶,快速入门学习开发网站教程
- CentOS8编译安装MySQL8.0.19
- 设置Eclipse缩进为4个空格,增强代码规范
- CentOS6,CentOS7官方镜像安装Oracle11G
- SpringBoot2整合MyBatis,连接MySql数据库做增删改查操作
- SpringBoot2整合Redis,开启缓存,提高访问速度
- CentOS8,CentOS7,CentOS6编译安装Redis5.0.7
- CentOS7,CentOS8安装Elasticsearch6.8.6
- Red5直播服务器,属于Java语言的直播服务器
- SpringBoot2编写第一个Controller,响应你的http请求并返回结果