苹果开源两大模型家族：FastVLM 与 MobileCLIP2-低调大师

苹果开源两大模型家族：FastVLM 与 MobileCLIP2

2025-09-01 115

苹果在 Hugging Face 上开源了 FastVLM 和 MobileCLIP2 两大模型家族：

FastVLM 是一种视觉语言模型（VLM），专为高分辨率图像设计，旨在减少 token 输出并压缩编码时间，可以高效地理解图像和文本之间的关系。
MobileCLIP2 是 CLIP 模型的轻量化、移动端优化版本，专注于在手机或边缘设备上进行高效推理。

FastVLM系列包含0.5B、1.5B、7B三个参数规模，全部基于新提出的FastViTHD混合视觉编码器，专为高分辨率图像输出更少token、压缩编码时间。FastVLM-7B在DocVQA达到93.2，在ScienceQA达到96.7，表现领先。

MobileCLIP2系列同样上线，提供相应 Hugging Face Collections 页面。

CVPR 2025论文《FastVLM: Efficient Vision Encoding for Vision Language Models》已公开，引用信息随模型仓库一并提供。

https://huggingface.co/collections/apple/fastvlm-68ac97b9cd5cacefdd04872e https://huggingface.co/spaces/apple/fastvlm-webgpu
https://huggingface.co/collections/apple/mobileclip2-68ac947dcb035c54bcd20c47

微信关注我们

原文链接：https://www.oschina.net/news/369583

转载内容版权归作者及来源网站所有！

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。

美团正式发布并开源 LongCat-Flash-Chat

美团正式发布 LongCat-Flash-Chat，并同步开源。LongCat-Flash 采用创新性混合专家模型（Mixture-of-Experts, MoE）架构，总参数 560 B，激活参数 18.6B~31.3B（平均 27B），实现了计算效率与性能的双重优化。基准测试评估表明，作为一款非思考型基础模型，LongCat-Flash-Chat 在仅激活少量参数的前提下，性能比肩当下领先的主流模型，尤其在智能体任务中具备突出优势。并且，因为面向推理效率的设计和创新，LongCat-Flash-Chat 具有明显更快的推理速度，更适合于耗时较长的复杂智能体应用。技术亮点 LongCat-Flash 模型在架构层面引入“零计算专家（Zero-Computation Experts）”机制，总参数量 560 B，每个token 依据上下文需求仅激活 18.6B~31.3 B 参数，实现算力按需分配和高效利用。为控制总算力消耗，训练过程采用 PID 控制器实时微调专家偏置，将单 token 平均激活量稳定在约 27 B。此外，LongCat-Flash 在层间铺设跨层通道，使 Mo...

2025-09-01

146

根据91助手官方消息，该应用将于2025年9月27日23:59起全面停止所有服务，包括但不限于手机连接管理、文件传输、应用安装卸载、系统清理等功能。官方建议用户在此期间及时备份相关数据，服务终止后，用户在91助手的数据将永久丢失，无法再以任何方式找回。此外91助手将向仍处于会员期的用户进行退费，但需要用户主动申请，未主动申请退费的用户将无法获得退款。作为百度2013年以19亿美元重金收购的标志性资产，其停服不仅意味着一款产品的生命周期终结，更折射出整个移动应用分发行业的深刻变革，以及移动互联网早期红利的终结。截至发稿，百度方面未作回应。

2025-09-01

109

资源下载

更多资源

腾讯云软件源

为解决软件依赖安装时官方源访问速度慢的问题，腾讯云为一些软件搭建了缓存服务。您可以通过使用腾讯云软件源站来提升依赖包的安装速度。为了方便用户自由搭建服务架构，目前腾讯云软件源站支持公网访问和内网访问。

Spring

Spring框架（Spring Framework）是由Rod Johnson于2002年提出的开源Java企业级应用框架，旨在通过使用JavaBean替代传统EJB实现方式降低企业级编程开发的复杂性。该框架基于简单性、可测试性和松耦合性设计理念，提供核心容器、应用上下文、数据访问集成等模块，支持整合Hibernate、Struts等第三方框架，其适用范围不仅限于服务器端开发，绝大多数Java应用均可从中受益。

Rocky Linux

Rocky Linux（中文名：洛基）是由Gregory Kurtzer于2020年12月发起的企业级Linux发行版，作为CentOS稳定版停止维护后与RHEL（Red Hat Enterprise Linux）完全兼容的开源替代方案，由社区拥有并管理，支持x86_64、aarch64等架构。其通过重新编译RHEL源代码提供长期稳定性，采用模块化包装和SELinux安全架构，默认包含GNOME桌面环境及XFS文件系统，支持十年生命周期更新。

Sublime Text

Sublime Text具有漂亮的用户界面和强大的功能，例如代码缩略图，Python的插件，代码段等。还可自定义键绑定，菜单和工具栏。Sublime Text 的主要功能包括：拼写检查，书签，完整的 Python API ， Goto 功能，即时项目切换，多选择，多窗口等等。Sublime Text 是一个跨平台的编辑器，同时支持Windows、Linux、Mac OS X等操作系统。