浪潮发布基础大模型“源2.0”,千亿参数全面开源
浪潮信息发布“源2.0”基础大模型,并宣布全面开源。
据介绍,源2.0基础大模型包括1026亿、518亿、21亿等三种参数规模的模型,在编程、推理、逻辑等方面展示出了先进的能力。
算法方面,源2.0提出并采用了一种新型的注意力算法结构:局部注意力过滤增强机制(LFA:Localized Filtering-based Attention)。LFA通过先学习相邻词之间的关联性,然后再计算全局关联性的方法,能够更好地学习到自然语言的局部和全局的语言特征,对于自然语言的关联语义理解更准确、更人性,提升了模型的自然语言表达能力,进而提升了模型精度。
数据方面,源2.0通过使用中英文书籍、百科、论文等高质量中英文资料,降低了互联网语料内容占比,结合高效的数据清洗流程,为大模型训练提供了高质量的专业数据集和逻辑推理数据集。
据称,为了更高效地获得相对匮乏的高质量中文数学及代码数据集,源2.0采用了基于大模型的数据生产及过滤方法,在保证数据的多样性的同时也在每一个类别上提升数据质量,获取了一批高质量的数学与代码预训练数据。
算力方面,源2.0采用了非均匀流水并行的方法,综合运用流水线并行+优化器参数并行+数据并行的策略,让模型在流水并行各阶段的显存占用量分布更均衡,避免出现显存瓶颈导致的训练效率降低的问题,该方法显著降低了大模型对芯片间P2P带宽的需求,为硬件差异较大训练环境提供了一种高性能的训练方法。
源2.0在业界公开的评测上进行了代码生成、数学问题求解、事实问答方面的能力测试,下面是测试结果:
源2.0采用全面开源策略,全系列模型参数和代码均可免费下载使用。

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。
持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。
转载内容版权归作者及来源网站所有,本站原创内容转载请注明来源。
- 上一篇
字节跳动成立新部门 Flow,发力 AI 应用层
36 氪报道称,字节跳动近期成立了一个新AI部门Flow,技术负责人为字节跳动技术副总裁洪定坤。 一位知情人士表示,这一新部门的业务带头人,为字节大模型团队的负责人朱文佳。Flow主要聚焦在AI应用层。在字节圈内,Flow近期发布了活水招聘帖,社会招聘也已经开始一段时间。 在帖中,其表示是字节跳动旗下AI创新业务团队,“目前已经在国内和海外分别上线豆包和Cici两款产品,有多个AI相关创新产品孵化中”。截止发稿前,字节跳动尚无回应。 在11月初,字节各个事业部都进行了不少业务和架构调整,这些调整仍在进行中,当前Flow的架构和汇报线未完全确定。且多位知情人士透露,在此次调整中,字节也从飞书、抖音等各个BU抽调人选,到这一部门做一款新的C端产品。
- 下一篇
《HelloGitHub》第 92 期
兴趣是最好的老师,HelloGitHub 让你对编程感兴趣! 简介 HelloGitHub 分享 GitHub 上有趣、入门级的开源项目。 https://github.com/521xueweihan/HelloGitHub 这里有实战项目、入门教程、黑科技、开源书籍、大厂开源项目等,涵盖多种编程语言 Python、Java、Go、C/C++、Swift...让你在短时间内感受到开源的魅力,对编程产生兴趣! 以下为本期内容|每个月 28 号更新 C 项目 1、activate-linux:将"Activate Windows"水印移植到 Linux 系统。这是一个可以在桌面系统的右下角,显示“激活 Windows” 字样的小工具,就是图一乐。 2、kew:一款 C 语言写的命令行音乐播放器。适用于 Linux 系统的命令行音乐播放器,支持搜索音乐、播放列表、专辑封面等功能。 C# 项目 3、EGamePlay:一款基于 Unity 引擎的灵活战斗框架。这是一个灵活、通用、轻量的游戏战斗/技能框架,配置可选择 ScriptableObject 或 Excel 表格。内含 RPG、回合制...
相关文章
文章评论
共有0条评论来说两句吧...
文章二维码
点击排行
推荐阅读
最新文章
- Docker使用Oracle官方镜像安装(12C,18C,19C)
- Docker安装Oracle12C,快速搭建Oracle学习环境
- CentOS7安装Docker,走上虚拟化容器引擎之路
- Linux系统CentOS6、CentOS7手动修改IP地址
- Docker快速安装Oracle11G,搭建oracle11g学习环境
- CentOS7编译安装Cmake3.16.3,解决mysql等软件编译问题
- CentOS关闭SELinux安全模块
- CentOS7编译安装Gcc9.2.0,解决mysql等软件编译问题
- Hadoop3单机部署,实现最简伪集群
- CentOS6,7,8上安装Nginx,支持https2.0的开启