Xiaomi MiMo-V2-Pro & Omni & TTS 发布-低调大师

Xiaomi MiMo-V2-Pro & Omni & TTS 发布

2026-03-19 79

小米宣布面向全球推出三款大模型 MiMo-V2-Pro & Omni & TTS。

其中，Xiaomi MiMo-V2-Pro 是专为现实世界中高强度的 Agent 工作场景而打造。拥有超过 1T 的总参数量（42B 激活参数），采用创新的混合注意力架构，并支持 1M 超长上下文长度。

在全球权威大模型综合智能排行榜 Artificial Analysis 上，MiMo-V2-Pro 位列全球第八，国内第二。在 OpenClaw、Claude Code 等智能体框架中，MiMo-V2-Pro 展现出了优秀的端到端任务完成能力，能够在无人工干预的条件下完成复杂工作流编排、长程规划与精准工具调用，并持续可靠地交付最终结果。公告称，MiMo-V2-Pro 整体使用体感已超越 Claude Sonnet 4.6，逼近 Opus 4.6，但模型 API 定价仅为其 1/5。

MiMo-V2-Omni 则是专为现实世界中复杂的多模态交互与执行场景而生。开发团队从底层构建了融合文本、视觉、语音的全模态基座，并以统一架构将“感知”与“行动”深度绑定。

MiMo-V2-Omni 可无缝接入各种 Agent 框架。，目前，MiMo-V2-Omni 模型已正式开放 API 服务，支持 256K 上下文长度，输入 $0.4 / 百万 tokens，输出 $2 / 百万 tokens。

此外，小米还认领了曾占领 OpenRouter 调用量榜单第一的模型 Hunter Alpha。

“在正式发布之前，我们将一个早期测试版本以「Healer Alpha」为代号匿名上架 OpenRouter，没有任何宣传，纯粹让模型能力说话。结果调用量自然攀升至平台前列，并在 OpenClaw 测评榜单 PinchBench 上拿下均分第一，用户和基准双双给出了同一个答案。”

Xiaomi MiMo-V2-TTS 是小米自主研发的语音合成大模型。基于自研 Audio Tokenizer 和多码本语音-文本联合建模架构，经过上亿小时语音数据的大规模预训练与多维度强化学习，实现了高度可控的多粒度语音风格控制。MiMo-V2-TTS 支持从整体风格定调到局部情绪表达的精准调节，能在同一句话内完成语气转折和情感递变；真实还原人类说话的自然韵律；在唱歌时，也能准确表达音高和节奏，自然且富有表现力。

在训练过程中，MiMo-V2-TTS 首先通过超大规模语音-文本混合预训练，在海量数据中习得了强大的跨模态对齐与理解生成的统一能力；在此基础上，通过少量高质量监督数据的微调，模型获得了可泛化的多粒度与多风格指令控制能力。

为进一步激发模型在大规模预训练中积累的高表现力语音生成潜力，团队引入了多维度强化学习，兼顾了稳定性与表现力。具体而言，MiMo-V2-TTS 在强化学习阶段，围绕更自然的韵律、更稳定的音质、更准确的字词表达、更高质量的音色克隆以及不同场景下恰当的语气和表达方式等多个维度持续优化。得益于多层码本建模架构，模型在高保真的离散 token 空间中对语音进行建模，充分保留了原始语音中的丰富信息，使强化学习阶段能够直接利用语音相关奖励信号对模型进行优化，从而让多维奖励信号更有效地作用于生成过程。

微信关注我们

原文链接：https://www.oschina.net/news/411904

转载内容版权归作者及来源网站所有！

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。

deepin 智能助手UOS AI Claw 模式上线：打通国产 IM + Skills 生态

AI 自动操控电脑（Claw 模式）火了，为技术爱好者们打开了新世界的大门，许多人开始尝试这种全新的交互方式。但对于广大普通用户来说，面对命令行配置、环境搭建以及本土软件的适配，往往存在较高的上手门槛，让人感到心有余而力不足。 AI 操控电脑，真的必须这么硬核吗？当然不是！新版 UOS AI 2.13.605 带来了属于我们自己系统级原生“Claw”模式。相比于需要一定技术基础的通用 Claw 方案，UOS AI 用四大核心优势，告诉你什么才是真正的“开箱即用”。 1. 无需懂代码，安装不求人。 OpenClaw：安装像个“清水房”。为了体验养虾的快感，你需要像开发者一样满世界找安装教程，折腾复杂的环境预装、配置各种依赖包。一顿操作猛如虎，最后却卡在莫名的报错里，把热情都耗在了复杂安装和搭建环境上。 UOS AI：安装像个“精装房”。作为底层深度适配的原生组件，UOS AI 早已为你铺好路。应用商店零门槛一键安装，上手即用，拎包入住。省去繁琐复杂的代码折腾，将宝贵的时间统统留给真正的创造。 2. 国产软件支持，配置“一步到位” OpenClaw：配置像个“大迷宫”。从配置飞书，...

2026-03-19

70

各位社区小伙伴：历经三个月对于先行版的升级，我们很高兴地宣布：KaiwuDB 社区（即KWDB）Playground v1.0.0 版本正式发布！🎉🎉🎉 KWDB Playground 是一款专为学习和演示 KaiwuDB 社区版 KWDB 开源多模数据库而设计的轻量级交互式课程平台，它的核心价值只有一句话：打开浏览器，即刻开始学习。过去，想要上手体验 KWDB用户往往要先闯过一道"环境关"------安装 Docker、配置网络、准备数据集等等，每一步都可能成为劝退的理由。Playground 的出现彻底改变了这一局面：平台基于 Docker 容器技术，为每位用户按需分配完全隔离的沙箱环境，随开随用、用完即焚，将原本高耸的准入门槛压至近乎为零。安装体验：多种方式，按需选择随着平台功能的完善，安装方式也经历了系统性的梳理与扩充。Playground v1.0.0 提供四种安装路径，覆盖不同场景和用户习惯：方式一：一键安装脚本（macOS / Linux / Windows，推荐首选） # 安装最新版本 curl -fsSL https://kwdb.tech/playg...

2026-03-18

39

资源下载

更多资源

Mario

马里奥是站在游戏界顶峰的超人气多面角色。马里奥靠吃蘑菇成长，特征是大鼻子、头戴帽子、身穿背带裤，还留着胡子。与他的双胞胎兄弟路易基一起，长年担任任天堂的招牌角色。

Spring

Spring框架（Spring Framework）是由Rod Johnson于2002年提出的开源Java企业级应用框架，旨在通过使用JavaBean替代传统EJB实现方式降低企业级编程开发的复杂性。该框架基于简单性、可测试性和松耦合性设计理念，提供核心容器、应用上下文、数据访问集成等模块，支持整合Hibernate、Struts等第三方框架，其适用范围不仅限于服务器端开发，绝大多数Java应用均可从中受益。

Rocky Linux

Rocky Linux（中文名：洛基）是由Gregory Kurtzer于2020年12月发起的企业级Linux发行版，作为CentOS稳定版停止维护后与RHEL（Red Hat Enterprise Linux）完全兼容的开源替代方案，由社区拥有并管理，支持x86_64、aarch64等架构。其通过重新编译RHEL源代码提供长期稳定性，采用模块化包装和SELinux安全架构，默认包含GNOME桌面环境及XFS文件系统，支持十年生命周期更新。

WebStorm

WebStorm 是jetbrains公司旗下一款JavaScript 开发工具。目前已经被广大中国JS开发者誉为“Web前端开发神器”、“最强大的HTML5编辑器”、“最智能的JavaScript IDE”等。与IntelliJ IDEA同源，继承了IntelliJ IDEA强大的JS部分的功能。