浪潮发布基础大模型“源2.0”，千亿参数全面开源-低调大师

浪潮发布基础大模型“源2.0”，千亿参数全面开源

2023-11-27 478

浪潮信息发布“源2.0”基础大模型，并宣布全面开源。

据介绍，源2.0基础大模型包括1026亿、518亿、21亿等三种参数规模的模型，在编程、推理、逻辑等方面展示出了先进的能力。

算法方面，源2.0提出并采用了一种新型的注意力算法结构：局部注意力过滤增强机制(LFA：Localized Filtering-based Attention)。LFA通过先学习相邻词之间的关联性，然后再计算全局关联性的方法，能够更好地学习到自然语言的局部和全局的语言特征，对于自然语言的关联语义理解更准确、更人性，提升了模型的自然语言表达能力，进而提升了模型精度。

数据方面，源2.0通过使用中英文书籍、百科、论文等高质量中英文资料，降低了互联网语料内容占比，结合高效的数据清洗流程，为大模型训练提供了高质量的专业数据集和逻辑推理数据集。

据称，为了更高效地获得相对匮乏的高质量中文数学及代码数据集，源2.0采用了基于大模型的数据生产及过滤方法，在保证数据的多样性的同时也在每一个类别上提升数据质量，获取了一批高质量的数学与代码预训练数据。

算力方面，源2.0采用了非均匀流水并行的方法，综合运用流水线并行+优化器参数并行+数据并行的策略，让模型在流水并行各阶段的显存占用量分布更均衡，避免出现显存瓶颈导致的训练效率降低的问题，该方法显著降低了大模型对芯片间P2P带宽的需求，为硬件差异较大训练环境提供了一种高性能的训练方法。

源2.0在业界公开的评测上进行了代码生成、数学问题求解、事实问答方面的能力测试，下面是测试结果：

源2.0采用全面开源策略，全系列模型参数和代码均可免费下载使用。

代码开源链接：https://github.com/IEIT-Yuan/Yuan-2.0
论文链接：https://github.com/IEIT-Yuan/Yuan-2.0/blob/main/docs/Yuan2.0_paper.pdf

微信关注我们

原文链接：https://www.oschina.net/news/268384

转载内容版权归作者及来源网站所有！

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。

字节跳动成立新部门 Flow，发力 AI 应用层

36 氪报道称，字节跳动近期成立了一个新AI部门Flow，技术负责人为字节跳动技术副总裁洪定坤。一位知情人士表示，这一新部门的业务带头人，为字节大模型团队的负责人朱文佳。Flow主要聚焦在AI应用层。在字节圈内，Flow近期发布了活水招聘帖，社会招聘也已经开始一段时间。在帖中，其表示是字节跳动旗下AI创新业务团队，“目前已经在国内和海外分别上线豆包和Cici两款产品，有多个AI相关创新产品孵化中”。截止发稿前，字节跳动尚无回应。在11月初，字节各个事业部都进行了不少业务和架构调整，这些调整仍在进行中，当前Flow的架构和汇报线未完全确定。且多位知情人士透露，在此次调整中，字节也从飞书、抖音等各个BU抽调人选，到这一部门做一款新的C端产品。

2023-11-27

500

兴趣是最好的老师，HelloGitHub 让你对编程感兴趣！简介 HelloGitHub 分享 GitHub 上有趣、入门级的开源项目。 https://github.com/521xueweihan/HelloGitHub 这里有实战项目、入门教程、黑科技、开源书籍、大厂开源项目等，涵盖多种编程语言 Python、Java、Go、C/C++、Swift...让你在短时间内感受到开源的魅力，对编程产生兴趣！以下为本期内容｜每个月 28 号更新 C 项目 1、activate-linux：将"Activate Windows"水印移植到 Linux 系统。这是一个可以在桌面系统的右下角，显示“激活 Windows” 字样的小工具，就是图一乐。 2、kew：一款 C 语言写的命令行音乐播放器。适用于 Linux 系统的命令行音乐播放器，支持搜索音乐、播放列表、专辑封面等功能。 C# 项目 3、EGamePlay：一款基于 Unity 引擎的灵活战斗框架。这是一个灵活、通用、轻量的游戏战斗/技能框架，配置可选择 ScriptableObject 或 Excel 表格。内含 RPG、回合制...

2023-11-28

839

资源下载

更多资源

Nacos

Nacos /nɑ:kəʊs/ 是 Dynamic Naming and Configuration Service 的首字母简称，一个易于构建 AI Agent 应用的动态服务发现、配置管理和AI智能体管理平台。Nacos 致力于帮助您发现、配置和管理微服务及AI智能体应用。Nacos 提供了一组简单易用的特性集，帮助您快速实现动态服务发现、服务配置、服务元数据、流量管理。Nacos 帮助您更敏捷和容易地构建、交付和管理微服务平台。

Spring

Spring框架（Spring Framework）是由Rod Johnson于2002年提出的开源Java企业级应用框架，旨在通过使用JavaBean替代传统EJB实现方式降低企业级编程开发的复杂性。该框架基于简单性、可测试性和松耦合性设计理念，提供核心容器、应用上下文、数据访问集成等模块，支持整合Hibernate、Struts等第三方框架，其适用范围不仅限于服务器端开发，绝大多数Java应用均可从中受益。

Sublime Text

Sublime Text具有漂亮的用户界面和强大的功能，例如代码缩略图，Python的插件，代码段等。还可自定义键绑定，菜单和工具栏。Sublime Text 的主要功能包括：拼写检查，书签，完整的 Python API ， Goto 功能，即时项目切换，多选择，多窗口等等。Sublime Text 是一个跨平台的编辑器，同时支持Windows、Linux、Mac OS X等操作系统。

WebStorm

WebStorm 是jetbrains公司旗下一款JavaScript 开发工具。目前已经被广大中国JS开发者誉为“Web前端开发神器”、“最强大的HTML5编辑器”、“最智能的JavaScript IDE”等。与IntelliJ IDEA同源，继承了IntelliJ IDEA强大的JS部分的功能。