字节跳动发布开源大语言模型 Seed-OSS
字节跳动的 Seed 团队宣布推出一系列开源大型语言模型 ——Seed-OSS。该系列模型旨在满足国际化(i18n)应用场景的需求,专注于强大的长文本理解、推理能力和灵活的开发者友好特性。
Seed-OSS 系列模型基于流行的因果语言模型架构,采用了 RoPE、GQA 注意力机制、RMSNorm 和 SwiGLU 激活函数。最新发布的 Seed-OSS-36B 模型拥有360亿个参数,具备512K 的长上下文处理能力。尽管该模型仅使用了12万亿个训练数据,其在多个流行的基准测试中表现出色。
Seed-OSS 模型系列包括两种版本:带有合成指令数据的 Seed-OSS-36B-Base 和不带合成指令数据的 Seed-OSS-36B-Base-woSyn。这种设计不仅为开发者提供了高性能的基础模型,还为研究者提供了更为多样化的选择,以确保研究的有效性不受合成数据的影响。
该模型的关键特性之一是 “思考预算” 的灵活控制,允许用户根据需要动态调整推理的长度。这种能力在实际应用场景中大大提高了推理的效率。此外,Seed-OSS 特别优化了推理任务,确保在保持良好一般能力的同时,推理能力也得到了增强。
在发布会上,Seed 团队强调,Seed-OSS 模型不仅适用于学术研究,还可广泛应用于各类开发任务,例如工具使用和问题解决等代理智能任务。模型的训练和评估结果表明,Seed-OSS 在知识问答、数学推理、编程等任务中的表现达到了开源领域的领先水平。
对于希望参与的开发者,Seed 团队提供了详细的快速入门指南。用户只需通过 pip 安装相关依赖,即可轻松下载和使用 Seed-OSS 模型。此外,团队还支持多种量化方式以降低内存使用,提高模型的运行效率。

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。
持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。
转载内容版权归作者及来源网站所有,本站原创内容转载请注明来源。
- 上一篇
PAC2025:鲲鹏平台“挑大梁”,国产算力点燃青春力量
8月的鄂尔多斯,国际会展中心内键盘敲击声密集如潮,一场国产算力生态技术人才的“巅峰对决”——第十二届并行应用挑战赛(PAC 2025)总决赛在此上演。 从2013年创办时的“星星之火”,到如今覆盖全国45座城市、吸引400余家单位参与,PAC大赛早已不是单纯的技术比拼,更成为国产算力平台“鲲鹏”展现实力、培育青年人才的核心舞台。当200多支参赛队伍带着优化方案角逐赛场,我们看到的不仅是一场热闹的赛事,更是国产算力从“能用”向“好用”“广泛用”迈进的坚实步伐。 回溯这一历程,PAC大赛恰如一面镜子:早期参赛方案多基于国外技术体系,而最近两届大赛的显著特征是,参赛作品主要构建在“鲲鹏”全栈创新生态之上。从“跟跑”到“并跑”,再到局部“领跑”,大赛见证了国产算力平台实现从芯片、基础软件到应用生态的完整突破。如今,“鲲鹏”生态的技术自主性与国际主流体系形成有益互补。这场持续十二年的技术马拉松,正以中国方案为全球算力发展注入新动能。 鲲鹏:国产算力的“硬核底座”,让高性能计算告别“卡脖子” “鲲鹏”到底是什么? 简单来说,它是一套完全国产化的高性能计算体系——从底层的ARM架构CPU,到上...
- 下一篇
《GPT-5 家族 SQL 能力评测报告》发布
一、本期导览与核心看点 2025 年 8 月,我们迎来了 AI 发展史上的又一个里程碑 ------ GPT-5 家族的正式发布。 当整个科技界都在讨论其通用能力的飞跃时,SCALE 平台将目光聚焦于 SQL 能力:GPT-5 在 SQL 处理上的表现究竟如何? 本期评测为针对 GPT-5 家族的评测特别版,旨在对其 SQL 相关能力进行一次全面的基准测试。 本期核心看点 旗舰模型表现分析 :gpt-5-chat 的评测结果显示其能力存在特定短板,而 mini 版本在本次测试的综合表现中更为均衡。 全方位的能力评估 :通过多维度多指标的用例评估,分析了 GPT-5 在不同场景下的实际性能,揭示了其理论能力与实践应用的差异。 数据驱动的模型选型 :评测数据表明,不同版本的模型在处理 SQL 能力 上各有千秋。本报告将基于数据,探讨如何进行场景化选型。 二、评测基准说明 为确保本次特别评测的公正性与深度,我们沿用了成熟的三维评测体系。 SQL 理解:考察模型是否精准解析复杂查询逻辑与用户意图。 SQL 优化:考察模型提升查询效率与性能的意识。 方言转换:考察模型在主流数据库之间进行语法迁移...
相关文章
文章评论
共有0条评论来说两句吧...
文章二维码
点击排行
推荐阅读
最新文章
- SpringBoot2初体验,简单认识spring boot2并且搭建基础工程
- CentOS7编译安装Cmake3.16.3,解决mysql等软件编译问题
- CentOS6,CentOS7官方镜像安装Oracle11G
- CentOS7设置SWAP分区,小内存服务器的救世主
- CentOS7,CentOS8安装Elasticsearch6.8.6
- SpringBoot2配置默认Tomcat设置,开启更多高级功能
- SpringBoot2整合Thymeleaf,官方推荐html解决方案
- Docker使用Oracle官方镜像安装(12C,18C,19C)
- SpringBoot2编写第一个Controller,响应你的http请求并返回结果
- CentOS7,8上快速安装Gitea,搭建Git服务器