首页 文章 精选 留言 我的
优秀的个人博客,低调大师

微信关注我们

原文链接:https://www.oschina.net/news/391630

转载内容版权归作者及来源网站所有!

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。

MiniMax 开源视觉分词器扩展技术 VTP

MiniMax 联合华中科技大学首次开源了其视觉生成的关键技术 VTP (视觉分词器预训练) ,在不修改标准DiT的情况下,通过扩展视觉分词器(Visual Tokenizers),实现了 65.8% 的生成性能提升。 与很多tokenizer工作不同的是,VTP在设定上不对下游的主模型(DiT)训练过程做任何修改,仅通过前置优化tokenizer来实现端到端生成性能的倍数提升。 VTP预训练范式: 一句话来说——VTP把latents易学性和通用表征学习建立起明确关联,从而第一次将tokenizer作为scaling的主角,展现出全面的scaling曲线和扩展方向。VTP提供了一个全新的视角,指导我们除了在主模型上投入更多参数/算力/数据之外,还可以通过tokenizer的scaling来提升整个生成系统的性能。 代码:https://github.com/MiniMax-AI/VTP 论文:https://arxiv.org/abs/2512.13687v1

从豆包手机谈起:端侧智能的愿景与路线图

本文转载自:https://mp.weixin.qq.com/s/s13YBYD9R8y-PK7FO3Suyw 作者:OpenBMB开源社区 近日,字节跳动发布的豆包手机助手在业内激起了广泛讨论。这不仅是一款新智能硬件的亮相,更标志着大模型应用范式的一次重要跃迁——从“Chat(对话)”真正迈向“Action(行动)”。作为长期深耕大模型领域的研究者,我们将豆包手机助手定义为行业首款系统级 GUI Agent。它不再是一个孤立的智能应用,而是深度耦合于操作系统底层、具备跨应用感知与操作能力的“超级中枢”。 如何看待豆包手机助手的当下与未来?藉此机会,我们希望与大家分享我们眼中的手机助手,以及端侧智能的演进愿景与路线图。 豆包手机助手关键技术解析与研判 GUI Agent 无疑是豆包手机助手的核心技术。为透视豆包手机助手的技术本质,我们有必要先回顾 GUI Agent 技术从实验室走向产业界的演进脉络。2023 年至 2025 年间,GUI Agent 技术经历了从“外挂式框架”到“模型原生智能体”的根本性范式转变: GUI Agent 发展的最早期阶段(2023‑2024)采用外挂式...

相关文章

发表评论

资源下载

更多资源
Mario

Mario

马里奥是站在游戏界顶峰的超人气多面角色。马里奥靠吃蘑菇成长,特征是大鼻子、头戴帽子、身穿背带裤,还留着胡子。与他的双胞胎兄弟路易基一起,长年担任任天堂的招牌角色。

Nacos

Nacos

Nacos /nɑ:kəʊs/ 是 Dynamic Naming and Configuration Service 的首字母简称,一个易于构建 AI Agent 应用的动态服务发现、配置管理和AI智能体管理平台。Nacos 致力于帮助您发现、配置和管理微服务及AI智能体应用。Nacos 提供了一组简单易用的特性集,帮助您快速实现动态服务发现、服务配置、服务元数据、流量管理。Nacos 帮助您更敏捷和容易地构建、交付和管理微服务平台。

Spring

Spring

Spring框架(Spring Framework)是由Rod Johnson于2002年提出的开源Java企业级应用框架,旨在通过使用JavaBean替代传统EJB实现方式降低企业级编程开发的复杂性。该框架基于简单性、可测试性和松耦合性设计理念,提供核心容器、应用上下文、数据访问集成等模块,支持整合Hibernate、Struts等第三方框架,其适用范围不仅限于服务器端开发,绝大多数Java应用均可从中受益。

Sublime Text

Sublime Text

Sublime Text具有漂亮的用户界面和强大的功能,例如代码缩略图,Python的插件,代码段等。还可自定义键绑定,菜单和工具栏。Sublime Text 的主要功能包括:拼写检查,书签,完整的 Python API , Goto 功能,即时项目切换,多选择,多窗口等等。Sublime Text 是一个跨平台的编辑器,同时支持Windows、Linux、Mac OS X等操作系统。