首页 文章 精选 留言 我的
优秀的个人博客,低调大师

微信关注我们

原文链接:https://www.oschina.net/news/387305/bun-joins-anthropic

转载内容版权归作者及来源网站所有!

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。

商汤联合南洋理工开源多模态模型架构 NEO

商汤科技与南洋理工大学S-Lab联合发布并开源全新多模态模型架构NEO,通过底层架构创新实现视觉与语言的深层统一,在性能、效率和通用性上取得全面突破。 NEO最显著的突破在于其极高的数据效率——仅需3.9亿图像文本示例,相当于业界同等性能模型1/10的数据量,便能开发出顶尖的视觉感知能力。无需依赖海量数据及额外视觉编码器,NEO凭借简洁架构在多项视觉理解任务中追平Qwen2-VL、InternVL3等顶级模块化旗舰模型。 在MMMU、MMB、MMStar、SEED-I、POPE等多项公开权威评测中,NEO均斩获高分,综合性能优于其他原生VLM,真正实现了原生架构"精度无损"。 当前业内主流多模态模型大多遵循"视觉编码器+投影器+语言模型"的模块化范式。这种基于大语言模型的扩展方式虽然实现了图像输入兼容,但本质上仍以语言为中心,图像与语言的融合仅停留在数据层面。这种"拼凑"式设计不仅学习效率低下,更限制了模型在复杂多模态场景下的处理能力,尤其是涉及图像细节捕捉或复杂空间结构理解的任务。 NEO则通过在注意力机制、位置编码和语义映射三个关键维度的底层创新,让模型天生具备统一处理视觉与语言的...

苹果发布开源视频生成模型 STARFlow-V

苹果在 GitHub 发布了名为 STARFlow-V 的开源项目,一款 70 亿参数的视频生成模型。 据介绍,STARFlow-V 基于 Normalizing Flow 架构,在时空潜在空间中运行,采用全局-局部架构,旨在实现高效、高保真度的视频生成。它支持高达 640x480(480p)的分辨率,81 帧(16 FPS,约 5 秒),并证明 Normalizing Flow 模型在视频生成方面可以与视频扩散模型相媲美。 STARFlow-V 是首个基于归一化流的因果视频生成器,支持端到端训练、原生似然估计,并能原生支持文本到视频、图像到视频以及视频到视频的生成任务,无需更改架构或重新训练。 项目地址:https://starflow-v.github.io/

相关文章

发表评论

资源下载

更多资源
Mario

Mario

马里奥是站在游戏界顶峰的超人气多面角色。马里奥靠吃蘑菇成长,特征是大鼻子、头戴帽子、身穿背带裤,还留着胡子。与他的双胞胎兄弟路易基一起,长年担任任天堂的招牌角色。

Nacos

Nacos

Nacos /nɑ:kəʊs/ 是 Dynamic Naming and Configuration Service 的首字母简称,一个易于构建 AI Agent 应用的动态服务发现、配置管理和AI智能体管理平台。Nacos 致力于帮助您发现、配置和管理微服务及AI智能体应用。Nacos 提供了一组简单易用的特性集,帮助您快速实现动态服务发现、服务配置、服务元数据、流量管理。Nacos 帮助您更敏捷和容易地构建、交付和管理微服务平台。

Spring

Spring

Spring框架(Spring Framework)是由Rod Johnson于2002年提出的开源Java企业级应用框架,旨在通过使用JavaBean替代传统EJB实现方式降低企业级编程开发的复杂性。该框架基于简单性、可测试性和松耦合性设计理念,提供核心容器、应用上下文、数据访问集成等模块,支持整合Hibernate、Struts等第三方框架,其适用范围不仅限于服务器端开发,绝大多数Java应用均可从中受益。

Sublime Text

Sublime Text

Sublime Text具有漂亮的用户界面和强大的功能,例如代码缩略图,Python的插件,代码段等。还可自定义键绑定,菜单和工具栏。Sublime Text 的主要功能包括:拼写检查,书签,完整的 Python API , Goto 功能,即时项目切换,多选择,多窗口等等。Sublime Text 是一个跨平台的编辑器,同时支持Windows、Linux、Mac OS X等操作系统。

用户登录
用户注册