您现在的位置是:首页 > 文章详情

MiniMax 开源新一代 01 系列模型

日期:2025-01-15点击:130

MiniMax 发布并开源了 MiniMax-01 全新系列模型,其中包含:基础语言大模型MiniMax-Text-01和视觉多模态大模型MiniMax-VL-01。

根据介绍,MiniMax-01系列模型首次大规模实现线性注意力机制,传统Transformer架构不再是唯一的选择。这个模型的参数量高达4560亿,其中单次激活459亿。模型综合性能比肩海外顶尖模型,同时能够高效处理全球最长400万token的上下文,是GPT-4o的32倍,Claude-3.5-Sonnet的20倍。

目前,官方给出的标准定价是输入token 1元/百万token,输出token 8元/百万token。

模型结构图如下:

MiniMax 方面称,基于业界主流的文本和多模态理解测评,该模型在大多数任务上追平了海外公认最先进的两个模型,GPT-4o-1120以及Claude-3.5-Sonnet-1022。

在长文任务上,对比了之前长文最好的模型Google的Gemini。结果显示,随着输入长度变长,MiniMax-Text-01是性能衰减最慢的模型,显著优于Google Gemini。

更多详情可查看官方公告

原文链接:https://www.oschina.net/news/329775
关注公众号

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。

持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。

转载内容版权归作者及来源网站所有,本站原创内容转载请注明来源。

文章评论

共有0条评论来说两句吧...

文章二维码

扫描即可查看该文章

点击排行

推荐阅读

最新文章