MiroMind 团队开源 MOOSE-Star：用分层搜索突破科学发现训练的复杂度壁垒-低调大师

MiroMind 团队开源 MOOSE-Star：用分层搜索突破科学发现训练的复杂度壁垒

2026-05-19 44

大语言模型在科学发现领域展现出巨大潜力，但如何直接训练模型完成假设生成——即建模 P(假设*背景)——一直是一个未被充分探索的难题。MiroMind 团队发表在ICML 2026的论文MOOSE-Star指出：直接训练这一条件概率在数学上是难以处理的，因为从庞大知识库中检索和组合灵感的过程存在组合复杂度 O(Nᵏ)，会随着候选数量增长而爆炸。

MOOSE-Star的核心贡献在于打破这一壁垒，实现可追踪且可扩展的训练与推理。其解决方案包含三个关键设计：第一，将假设构建分解为顺序的单一灵感步骤，通过概率方程推导出的子任务进行训练；第二，训练一个专门的灵感检索（Inspiration Retrieval, IR）模型；第三，在推理时对 SPECTER2 聚类的树结构进行分层搜索。得益于这三步，最坏情况下的复杂度从指数级 O(Nᵏ) 降低到对数级 O(log N)。

具体而言，MOOSE-Star基于DeepSeek-R1-Distill-Qwen-7B构建，使用来自32B教师模型的拒绝采样数据进行训练。IR模型在15选1的基准测试中达到54.37%的准确率，远超基线的28.42%和随机选择的6.70%。假设构建模型的综合评分达到5.16（满分未详参，基线为4.34）。

为了支撑这项研究，团队还发布了TOMATO-Star数据集，包含107K条分解后的生物医学论文（训练集108,717条、验证集1,600条），构建该数据集耗费约38,400 GPU小时。配套发布的内容还包括SFT训练数据（包含假设构建、边界组合和IR训练等多个子集）以及三个预训练模型（IR模型、假设构建模型和多任务模型），均已在HuggingFace上开源。

MOOSE-Star的意义不仅在于技术突破，更在于它为AI辅助科学研究提供了一条可扩展的路径。实验表明，随着训练数据和推理预算的增加，MOOSE-Star的性能能够持续扩展，而直接暴力采样则会撞上复杂度的墙。对于需要从海量文献中汲取灵感、生成创新假设的科研场景，这无疑是一个值得关注的方向。

参考来源：https://github.com/ZonglinY/MOOSE-Star、https://arxiv.org/abs/2603.03756

微信关注我们

原文链接：https://www.oschina.net/news/442772

转载内容版权归作者及来源网站所有！

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。

首个古文字 OCR 评测基准 Chronicles-OCR 开源

腾讯混元、SSV数字文化实验室和SSV技术架构部联合安阳师范学院甲骨文信息处理重点实验室、中科院信工所、南开大学，正式推出 Chronicles-OCR——业界首个覆盖"七体之变"完整演化轨迹的中国古文字感知评测基准。数据来源全部来自顶级机构与古文字学专家：甲骨文 → 安阳师范学院甲骨文信息处理重点实验室金文、篆书 → 古文字学博士与研究生团队人工整理隶、楷、行、草 → 故宫博物院文物手写体识别测试数据集整个数据集由领域专家多层级交叉标注，包含 2,800 张严格平衡的高质量图像（每种字体 400 张）。不同...

2026-05-19

44

"Tokenmaxxing"——用尽可能多的Token消耗来实现AI编程成功——正在成为一种流行趋势。但工程管理软件公司Jellyfish的最新数据给这个思路泼了一盆冷水：Token消耗最高的工程师，花费10倍的成本，产能增长却仅有2倍。 Jellyfish在2026年Q1分析了横跨200家公司、约12,000名开发者的数据，重点关注Token消耗与实际产出的关系。结果显示，Token使用量在不同开发者之间差异巨大：具有代表性的普通用户（中位数区间）每月消耗约5,100万Token，而重度用户每月消耗约3.8亿Token&md...

2026-05-19

39

资源下载

更多资源

Mario

马里奥是站在游戏界顶峰的超人气多面角色。马里奥靠吃蘑菇成长，特征是大鼻子、头戴帽子、身穿背带裤，还留着胡子。与他的双胞胎兄弟路易基一起，长年担任任天堂的招牌角色。

腾讯云软件源

为解决软件依赖安装时官方源访问速度慢的问题，腾讯云为一些软件搭建了缓存服务。您可以通过使用腾讯云软件源站来提升依赖包的安装速度。为了方便用户自由搭建服务架构，目前腾讯云软件源站支持公网访问和内网访问。

Spring

Spring框架（Spring Framework）是由Rod Johnson于2002年提出的开源Java企业级应用框架，旨在通过使用JavaBean替代传统EJB实现方式降低企业级编程开发的复杂性。该框架基于简单性、可测试性和松耦合性设计理念，提供核心容器、应用上下文、数据访问集成等模块，支持整合Hibernate、Struts等第三方框架，其适用范围不仅限于服务器端开发，绝大多数Java应用均可从中受益。

Rocky Linux

Rocky Linux（中文名：洛基）是由Gregory Kurtzer于2020年12月发起的企业级Linux发行版，作为CentOS稳定版停止维护后与RHEL（Red Hat Enterprise Linux）完全兼容的开源替代方案，由社区拥有并管理，支持x86_64、aarch64等架构。其通过重新编译RHEL源代码提供长期稳定性，采用模块化包装和SELinux安全架构，默认包含GNOME桌面环境及XFS文件系统，支持十年生命周期更新。