字节跳动即将发布开源模型 SeedOss-36B
根据Hugging Face Transformers库的信息,字节跳动即将发布一款名为SeedOss-36B的360亿参数稠密开源模型。
相关信息来源于Hugging Face Transformers开源仓库中的一个Pull Request。该Pull Request由GitHub用户“Fazziekey”提交,标题为“Addiing ByteDance Seed Seed-Oss”,旨在为即将推出的Seed Oss模型添加代码支持。
https://github.com/huggingface/transformers/pull/40272
从目前披露的信息来看,SeedOss-36B很可能是一个360亿参数的稠密模型,而非MoE(Mixture-of-Experts)架构。

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。
持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。
转载内容版权归作者及来源网站所有,本站原创内容转载请注明来源。
-
上一篇
DeepSeek V3.1-Base 开源发布
DeepSeek 最新开源模型 V3.1-Base 已上架 HuggingFace,相关信息如下: 模型参数为 685B 基座模型(Base),用于微调和二次开发 基于 DeepSeek V3 架构,包含自定义代码实现 混合精度设计,支持 BF16、FP8(E4M3)、FP32 张量类型 支持 FP8 量化,提升推理效率 采用 Safetensors 安全张量格式 详情查看https://huggingface.co/deepseek-ai/DeepSeek-V3.1-Base
-
下一篇
扎克伯格计划重组 Meta 人工智能部门
Meta 首席执行官马克・扎克伯格正积极调整公司的人工智能业务。为了更好地应对市场竞争,Meta 计划将其人工智能部门 ——Meta超级智能实验室拆分为四个小组。 根据知情人士透露,其中一个小组将专注于人工智能研究,另一个小组将致力于开发名为 “超级智能” 的新一代强大人工智能技术。其他两个小组则分别负责产品开发和基础设施建设,包括数据中心及相关硬件。 这一改革的目的在于优化资源配置,提高人工智能产品的开发效率。然而,随着部门的重组,一些高管可能会离职。此外,由于人工智能部门的规模近年来已扩展至数千人,Meta 正在考虑整体精简,包括裁员或将部分员工调至其他部门。这些讨论仍在进行中,尚未做出最终决定。 Meta 的人工智能战略此前经历了多次动荡,扎克伯格对此表示愈发重视。他愿意投入巨资,进行彻底改革,以在快速发展的人工智能领域保持竞争力。今年6月,Meta 成立了超级智能实验室,专注于打造超越人类大脑的人工智能。为此,Meta 向初创公司 Scale AI 投资了143亿美元,并聘请该公司的首席执行官亚历山大・王担任人工智能首席官。 在过去的几个月里,扎克伯格的决策引发了公司内部的紧张...
相关文章
文章评论
共有0条评论来说两句吧...
文章二维码
点击排行
推荐阅读
最新文章
- SpringBoot2整合MyBatis,连接MySql数据库做增删改查操作
- Linux系统CentOS6、CentOS7手动修改IP地址
- CentOS关闭SELinux安全模块
- CentOS8编译安装MySQL8.0.19
- CentOS6,7,8上安装Nginx,支持https2.0的开启
- Red5直播服务器,属于Java语言的直播服务器
- Dcoker安装(在线仓库),最新的服务器搭配容器使用
- Jdk安装(Linux,MacOS,Windows),包含三大操作系统的最全安装
- SpringBoot2配置默认Tomcat设置,开启更多高级功能
- Windows10,CentOS7,CentOS8安装Nodejs环境