130亿参数，52层网络，昆仑万维开源商用大模型，支持消费级显卡部署-低调大师

130亿参数，52层网络，昆仑万维开源商用大模型，支持消费级显卡部署

2023-11-07 382

10月30日，昆仑万维集团正式发布国内首个全面开源最强百亿级模型Skywork-13B系列。昆仑万维集团的此次同时推出两款天工130亿参数的开源模型，可谓是业内开源最彻底的百亿高质量商用模型：除了开源模型和开源训练数据外，同时支持无需要申请即可商用。

Skywork-13B系列的开源将为大模型的场景应用和社区开源的蓬勃发展提供最佳的技术支持。昆仑万维的算法和模型等开源项目将使得各行业的研究人员和企业的工作达到事半功倍的效果，同时为社会各界对大模型技术的商业落地提供了最诚意的支持。

此次开源的130亿参数模型提供两个版本的大模型：Skywork-13B-Base模型、Skywork-13B-Math模型，以及每个模型的量化版模型，以支持用户在消费级显卡进行部署和推理。

Skywork开源项目的特点有：

Skywork-13B-Base模型
Skywork-13B-Base模型是在经过高质量清洗过滤的3.2万亿个多语言（主要是中文和英文）和代码数据上进行训练的，它在多种评测和各种基准测试上都展现了同等规模模型的最佳效果。

Skywork-13B-Math模型

Skywork-13B-Math模型经过专门的数学能力强化训练，在13B规模中，Skywork-13B-Math模型在GSM8K评测上得分第一，同时 MATH数据集上表现也很好，在 out-of-domain 数据集 CMATH上表现也很优秀，处于13B模型顶尖水平。

Skypile-150B数据集

该数据集是根据我们经过精心过滤的数据处理流程从中文网页中筛选出的高质量数据。本次开源的数据集大小约为600GB，总的token数量约为150B，目前开源最大的中文数据集之一。

除此之外，我们还公开了在训练Skywork-13B模型中使用的评估方法、数据配比研究和训练基础设施调优方案等。我们希望这些开源内容能够进一步启发社区对于大型模型预训练的认知，并推动人工智能通用智能（AGI）的实现。

高质量中文数据集在Huggingface即可下载，详情请见Github官方空间⬇️

Skywork-13B下载地址（Github）：

https://github.com/SkyworkAI/Skywork

模型结构

与LLaMA2-13B模型对比，天工Skywork-13B模型采用相对更加瘦长的网络结构，层数为52层，同时将FFN Dim和Hidden Dim缩小到12288和4608，从而保证模型参数量和原始LLaMA-13B模型相当。根据我们前期实验对比，相对瘦长的网络结构在大Batch Size训练下可以取得更好的泛化效果。Skywork-13B和LLaMA-2-13B模型的对比如下：

训练数据

英文网页数据 39.8% 书籍数据 3.6% 学术论文 3.0% 百科全书 2.9% 其他（年报，文书等） 2.9% 中文网页数据 30.4% 社交媒体数据 5.5% 百科全书 0.8% 其他（年报，文书等） 3.1% 代码 Github 8.0%

训练方法：

此次 Skywork-13B 开源系列模型同时开放了整个模型的训练方法。为了更加精细化利用数据，采用两阶段训练方法，第一阶段使用通用语料进行模型通用能力学习，第二部分加入STEM（科学，技术，工程，数学）相关数据进一步增强模型的推理能力、数学能力、问题解决能力。（详细信息，参考开源社区下载文档）

模型评估

领域数据困惑度评估

语言模型训练的本质上是让预测下一个词更准确。基于这个认知，我们认为评估基础大模型一个重要的方式是评估在各大领域上语言模型生成文章的概率。在模型训练中预测下一个词的概率一般使用Cross Entropy损失函数，整体的损失函数为每个位置预测真实词损失的平均，则有：

其中是文档的长度，即token数，是位置i上真实词的概率，我们知道文档中每一个位置上真实词的概率的联乘则为生成该文档的概率，如此我们就将loss和生成文章的概率联系在了一起。而不同模型因为使用的分词器不同，具有不同的token数，因此对损失函数乘以token数目，这样就仅考虑生成文章的概率部分，不同模型也可以进行比较。我们将标准化后loss取指数转换成perplexity，使得模型的差异更加可读。为了阅读方面后续提到的loss和ppl为模型标准化后的loss和perplexity。

基于上述分析，我们对多个领域筛选出2023年10月份新发布的几百到上千篇高质量文章，并人工进行了核对。保证所有的测试数据不在天工模型以及其他所有模型的训练集中，并且测试数据的来源也足够广泛，质量也高。我们可以选取当前最新的文章评测不同模型的ppl，模型很难作弊。下图列出了不同开源模型，天工Skywork-13B-Base取得最优效果，证明了天工Base模型的基础能力处于国内开源模型中文最强水平。

Benchmark评估

我们评估了各大权威评测benchmark上的结果作为参考，包括C-Eval，MMLU，CMMLU，GSM8K。遵循之前的评估流程，C-Eval、MMLU、CMMLU测试5-shot结果，GSM8K测试8-shot结果。可以看到Skywork-13B-Base模型在中文开源模型中处于前列，在同等参数规模下为最优水平。

最有诚意的支持开源商用：无需申请，即可实现商用

目前开源社区中的中文大模型多数并非是完全可商用，一般开源社区用户通常需要进行复杂的商用授权申请流程，在某些情况，甚至有对公司规模、所在行业、用户数等维度有明确规定不给予商业授权。昆仑万维对Skywork-13B开源的开放性和可商用性高度重视，将授权流程做到极简，取消对行业、公司规模、用户等方面的限制，目的是帮助更多对中文大模型感兴趣的用户和企业在行业中不断探索和进步。因此，此次Skywork-13B开源的同时我们将全面开放Skywork-13B大模型的商用许可，用户在下载模型后同意并遵守《Skywork模型社区许可协议》后，无需再次申请授权即可将大模型进行商业用途，目的是希望用户能够更便捷的去利用Skywork-13B去进行测试并且探索在不同场景下的商业化应用。

注册开放平台了解更多13B产品信息

微信关注我们

原文链接：https://my.oschina.net/u/4806939/blog/10141318

转载内容版权归作者及来源网站所有！

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。

体验问题哪里找？点击链接获取答案~ | 京东云技术团队

用户体验（User Experience，简称UX）是指用户在与产品、系统或服务进行交互的过程中所产生的主观感受和情感反应。它涵盖了用户对产品或服务的使用过程中所体验到的方方面面，包括界面设计、交互流程、功能性、易用性、可靠性、响应速度、视觉美感等。我们为什么需要注重“用户体验”呢？引用《用户体验要素》中一句话：“用户体验就是商机”。良好的用户体验可以提高用户的满意度、提高转化率并直接关系到品牌形象和口碑，进一步赢得竞争优势。基于此，从运营、业务到产品、研发、测试都须开始自查自纠，提升用户满意度。根据近期APP“体验5分钟”的报告，测试人员可以从以下几个方面寻找用户体验问题： 1、安全与合规：根据广告法要求：广告应当真实、准确，不得含有误导性信息。比如模糊关键信息诱导用户点击，或者弱化解绑银行卡、注销账号入口等都不被允许。同时约束默认勾选，包括协议、消息提醒、同步加购、同步产品开通。以个人实名页、资产页为例，用户隐私类信息也不应该支持分享，降低平台安全感。 2、过度营销：在推广和营销活动中过分频繁、过于侵入性、过度夸张或过度推销的行为，这些行为会引起用户的反感。此外，如果营销活动中...

2023-11-07

373

1. 引言从接触领域驱动设计的初学阶段，到实现一个旧系统改造到DDD模型，再到按DDD规范落地的3个的项目。对于领域驱动模型设计研发，从开始的各种疑惑到吸收各种先进的理念，目前在技术实施这一块已经基本比较成熟。在既往经验中总结了一些在开发中遇到的技术问题和解决方案进行分享。因为DDD的建模理论及方法论有比较成熟的教程，如《领域驱动设计》，这里我对DDD的理论部分只做简要回顾，如果需要了解DDD建模和基础的理论知识，请移步相关书籍进行学习。本文主要针对我们团队在DDD落地实践中的一些技术点进行分享。 2. 理论回顾理论部分只做部分提要，关于DDD建模及基础知识相关，可参考 Eric Evans 的《领域驱动设计》一书及其它理论书籍，这里只做部分内容摘抄。 2.1.1 名词领域及划分：领域、子域、核心域、通用域、支撑域，限界上下文；模型：聚合、聚合根、实体、值对象; 实体是指描述了领域中唯一的且可持续变化的抽象模型，有ID标识，有生命周期，有状态（用值对象来描述状态），实体通过ID进行区分；每个实体对象都有唯一的 ID。我们可以对一个实体对象进行多次修改，修改后的数据和原来的...

2023-11-07

432

资源下载

更多资源

Mario

马里奥是站在游戏界顶峰的超人气多面角色。马里奥靠吃蘑菇成长，特征是大鼻子、头戴帽子、身穿背带裤，还留着胡子。与他的双胞胎兄弟路易基一起，长年担任任天堂的招牌角色。

腾讯云软件源

为解决软件依赖安装时官方源访问速度慢的问题，腾讯云为一些软件搭建了缓存服务。您可以通过使用腾讯云软件源站来提升依赖包的安装速度。为了方便用户自由搭建服务架构，目前腾讯云软件源站支持公网访问和内网访问。

Nacos

Nacos /nɑ:kəʊs/ 是 Dynamic Naming and Configuration Service 的首字母简称，一个易于构建 AI Agent 应用的动态服务发现、配置管理和AI智能体管理平台。Nacos 致力于帮助您发现、配置和管理微服务及AI智能体应用。Nacos 提供了一组简单易用的特性集，帮助您快速实现动态服务发现、服务配置、服务元数据、流量管理。Nacos 帮助您更敏捷和容易地构建、交付和管理微服务平台。

WebStorm

WebStorm 是jetbrains公司旗下一款JavaScript 开发工具。目前已经被广大中国JS开发者誉为“Web前端开发神器”、“最强大的HTML5编辑器”、“最智能的JavaScript IDE”等。与IntelliJ IDEA同源，继承了IntelliJ IDEA强大的JS部分的功能。