百川智能发布 53B 大模型,预计今年内追上 GPT-3.5
搜狗创始人王小川创立的百川智能宣布推出新一代大模型 Baichuan-53B;但不同于此前发布的 7B 和 13B 模型,Baichuan-53B 并没有走开源路线。
“模型变大之后没有走开源的这样一种方式,因为大家部署起来成本也会非常的高,就是使用闭源让大家网上调用的方式。在我们的官网,大家已经可以申请内测试用了。在我们的计划里,我们后续 53B 也不会开源。”
目前 Baichuan-53B 已在官网开放内测申请,并将在下个月开放 API。按照计划,今年四季度,百川智能将发布千亿参数的大模型,预计将追上 GPT-3.5 的水平。此外王小川对 Founder Park 透露,百川智能的开源模型也将在今年内发布升级版本。
百川强调了 Baichuan-53B 的三个技术优势:预训练数据、搜索增强和对齐能力,其中前两者与百川团队中丰富的搜索引擎经验有较强相关性。
预训练数据
预训练阶段,王小川表示,此前团队做搜索引擎的经验,让百川能够又快又好地完成前期数据积累,这也是百川此前两款开源模型能够迅速推出的原因之一。
-
百川希望构建一个全面的世界知识体系,覆盖各个领域和学科的知识,通过整合各类信息源,确保文化、科学、技术等方面广泛的知识覆盖。
-
目前百川已经建立了一套系统的数据质量体系,包括低质、优质、类别等,确保整个预训练过程中维持高标准的数据质量,以让数据为最终模型训练的目标服务。
-
为保证数据的多样性并有效处理重复信息,百川设计了一个多粒度的大规模聚类系统。通过使用先进的聚类算法和方法,识别和整合相似或相关的数据,为去重、采样提供支撑。
-
百川还开发了一种细粒度的自动化匹配算法,自动配比各类任务,例如课程学习。从而实现个性化的模型学习,使预训练数据能够更精确地匹配用户需求。
搜索增强
这次 Baichuan-53B 的开发过程中,百川应用了更多搜索相关的技术,实现模型优化与改进。
-
动态响应策略,依赖 Prompt,将指令任务细化为 16 个独立类别,覆盖各种用户指令的场景。
-
智能化搜索词生成,通过对问答样本进行精细化的人工标注,捕捉和理解用户多元化的志林需求。
-
高质量搜索结果筛选,百川构建了一个搜索结果相关性模型,对从搜索内容和知识库中获取的信息进行相关性频分,从而筛选出高质量的搜索引用内容,减少在知识抽取阶段引入的无关、低质量的信息。
-
回答结果的搜索增强,RLHF,让 Baichuan 大模型参照搜索结果,针对用户请求生成高价值且具有实时性的回答。

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。
持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。
转载内容版权归作者及来源网站所有,本站原创内容转载请注明来源。
- 上一篇
助力民族语言文字信息化建设,新一代蒙古文操作系统重磅发布
助力民族语言文字信息化建设,新一代蒙古文操作系统重磅发布 2023-08-09 09:32 · openKylin 8月7日,由内蒙古大学、国防科技大学、麒麟软件联合研制的银河麒麟桌面操作系统(蒙古文版)V10重磅发布!系统采用自主操作系统平台的多语言支撑框架,支持汉、蒙、英三种语言的流畅切换,内嵌奥云智能蒙古文输入法、蒙古文竖排编辑器和蒙古文AI工具箱,从日常家用到办公场景实现蒙古文全面化支持。 openKylin社区咨询委员会主任廖湘科院士、技术委员会主任吴庆波研究员、生态委员会主任李震宁、秘书长余杰研究员出席本次发布会。后续,麒麟团队在蒙古文、藏文等多语言支持方面的相关工作,也将进入到openKylin平台及2.0版本中。 民族语言文字信息处理能力的提升是国家信息化、智能化建设的任务之一,民族信息化建设迫切需要信息处理技术研究提供可靠支撑。发布会上,相关专家领导高屋建瓴,对于银河麒麟桌面操作系统(蒙古文版)V10的发布表达了高度认可和未来希冀。 内蒙古自治区大数据中心主任、内蒙古自治区政务服务局局长吴苏海 “银河麒麟操作系统(蒙古文版)将大幅降低蒙古文用户使用国产操作系统...
- 下一篇
Stability AI 发布 AI 编程工具:StableCode
Stability AI 刚刚宣布了他们首个用于编程的生成式 LLM AI 产品——StableCode。该产品旨在帮助程序员完成日常工作,并为新手开发者提供实用的学习工具。 官方介绍道,StableCode 提供了一种独特的方式,通过使用三种不同的模型来帮助开发者编写代码,从而提示开发效率。 基础模型 (base model)首先使用来自 BigCodestack-dataset (v1.2) 的多种编程语言进行训练,然后使用 Python、Go、Java、Javascript、C、markdown 和 C++ 等流行语言进行进一步训练。总的来说,他们在 HPC 集群上使用 560B token 的代码训练了模型。 建立好基础模型后,Stability AI 针对特定用例调整指令模型 (instruction model),以帮助解决复杂的编程任务。为了实现这一结果,他们在基础模型上训练了约 120,000 个 Alpaca 格式的代码指令/响应对 (instruction/response)。 使用 StableCode Instruct 生成对给定指令的响应的代码 对于那些想要了...
相关文章
文章评论
共有0条评论来说两句吧...
文章二维码
点击排行
推荐阅读
最新文章
- Jdk安装(Linux,MacOS,Windows),包含三大操作系统的最全安装
- Springboot2将连接池hikari替换为druid,体验最强大的数据库连接池
- SpringBoot2初体验,简单认识spring boot2并且搭建基础工程
- Windows10,CentOS7,CentOS8安装MongoDB4.0.16
- Windows10,CentOS7,CentOS8安装Nodejs环境
- SpringBoot2全家桶,快速入门学习开发网站教程
- SpringBoot2配置默认Tomcat设置,开启更多高级功能
- CentOS8编译安装MySQL8.0.19
- SpringBoot2编写第一个Controller,响应你的http请求并返回结果
- Docker使用Oracle官方镜像安装(12C,18C,19C)