Thinking Machines Lab 发布交互模型：让人机协作像人与人协作一样自然-低调大师

Thinking Machines Lab 发布交互模型：让人机协作像人与人协作一样自然

2026-05-13 9

由 OpenAI 前首席技术官 Mira Murati 等人创立的 Thinking Machines Lab 近日发布了一项重要研究预览——交互模型（Interaction Models）。该模型旨在突破传统"一轮一问"的 AI 交互范式，让人与 AI 的协作方式更接近人与人之间自然的实时对话。

当前主流的大语言模型采用的是轮次制（turn-based）交互架构：用户说完，模型等待，然后生成回复。这种模式下，"在用户完成输入之前，模型对用户正在做什么、怎么做一无所知；在模型生成完成之前，它的感知也处于冻结状态。" Thinking Machines Lab 认为，这形成了一条狭窄的通道，限制了人类知识和意图向模型传递的带宽。

交互模型的核心理念是将交互能力内嵌到模型本身，而非依赖外部脚手架。它使用 200 毫秒的微轮次（micro-turns）持续交错处理输入和生成输出，使输入和输出 token 都被视为流式数据。这一设计带来了多项原生能力：无缝对话管理（追踪发言者是在思考、让渡还是邀请回应）、基于语境的口头和视觉插话、实时翻译中的同步语音、直接的时间感知，以及在说话和倾听的同时并行调用工具、搜索和生成 UI。

架构上，系统由两个组件协同工作：一个实时交互模型持续与用户保持交流，一个异步后台模型处理需要更深层次推理的任务。当遇到无法即时完成的复杂问题时，交互模型会将任务委托给后台模型，并在结果返回时无缝整合。

在基准测试方面，TML-Interaction-Small 模型在 FD-bench v1.5 交互性评测中平均质量得分达到 77.8，远超竞争对手的 46.8-54.3；轮次切换延迟仅为 0.40 秒，而其他模型在 0.57-2.14 秒之间。在 Audio MultiChallenge 智能基准测试中，该模型以 43.4% 的准确率超过了非思考型模型。

值得一提的是，在一些全新设计的评测任务中，交互模型展现了前所未有的能力：TimeSpeak 任务准确率 64.7%（对比 GPT-realtime-2 的 4.3%）、CueSpeak 81.7%（对比 2.9%）、视觉计数 RepCount-A 35.4%（对比 1.3%）。研究团队表示，"现有模型在这些任务上几乎无法有意义地执行"。

目前该模型采用 2760 亿参数 MoE 架构（激活参数 120 亿），仍处于研究预览阶段，长期会话的上下文管理、实时对齐与安全性等方面仍在持续完善中。

参考来源：https://thinkingmachines.ai/blog/interaction-models/

微信关注我们

原文链接：https://www.oschina.net/news/439957/thinkingmachines-ai-interaction-models

转载内容版权归作者及来源网站所有！

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。

OpenAI 和微软同意将收入分成上限设定为 380 亿美元

The Information 援引知情人士消息称，OpenAI 已同意将其与微软根据协议分享的总收入上限设定为 380 亿美元。这一进展源于OpenAI与微软上月重新谈判了合同，为这家ChatGPT开发商与亚马逊和谷歌等科技巨头建立新的合作伙伴关系留出了空间。报道称，这一支付上限或有助于OpenAI在筹备首次公开募股（IPO）过程中向投资者展示更具吸引力的长期前景。部分高管表示，该公司最早可能于今年年底启动IPO。 OpenAI和微软尚未对此事作出回应。微软在 4 月份表示，OpenAI 的收入分成将持续到 2030 年，并且付款比例将与之前商定的比例相同，但会受到总额上限的限制。自 ...

2026-05-13

16

波兰开发者 Maciej Kowalski 近日在其个人博客整理了一系列关于 Python 的"怪异"设计。这些特性看似反直觉，实则反映了 Python 作为一门纯面向对象语言的核心哲学——一切皆对象。 Python 比俄罗斯联邦还老。这是文章给出的第一个冷知识。Python 诞生于 1991 年 2 月 20 日，而苏联解体发生在同年 12 月 26 日。这意味着 Python 实际上比俄罗斯联邦还要"年长"近 10 个月。尽管近年来 Python 因人工智能和数据科学的爆发而风靡全球，甚至波兹南工业大学都已用 Python 取...

2026-05-13

15

资源下载

更多资源

Mario

马里奥是站在游戏界顶峰的超人气多面角色。马里奥靠吃蘑菇成长，特征是大鼻子、头戴帽子、身穿背带裤，还留着胡子。与他的双胞胎兄弟路易基一起，长年担任任天堂的招牌角色。

Nacos

Nacos /nɑ:kəʊs/ 是 Dynamic Naming and Configuration Service 的首字母简称，一个易于构建 AI Agent 应用的动态服务发现、配置管理和AI智能体管理平台。Nacos 致力于帮助您发现、配置和管理微服务及AI智能体应用。Nacos 提供了一组简单易用的特性集，帮助您快速实现动态服务发现、服务配置、服务元数据、流量管理。Nacos 帮助您更敏捷和容易地构建、交付和管理微服务平台。

Rocky Linux

Rocky Linux（中文名：洛基）是由Gregory Kurtzer于2020年12月发起的企业级Linux发行版，作为CentOS稳定版停止维护后与RHEL（Red Hat Enterprise Linux）完全兼容的开源替代方案，由社区拥有并管理，支持x86_64、aarch64等架构。其通过重新编译RHEL源代码提供长期稳定性，采用模块化包装和SELinux安全架构，默认包含GNOME桌面环境及XFS文件系统，支持十年生命周期更新。

WebStorm

WebStorm 是jetbrains公司旗下一款JavaScript 开发工具。目前已经被广大中国JS开发者誉为“Web前端开发神器”、“最强大的HTML5编辑器”、“最智能的JavaScript IDE”等。与IntelliJ IDEA同源，继承了IntelliJ IDEA强大的JS部分的功能。