深言科技联合清华大学 NLP 实验室开源 LingoWhale-8B 模型
深言科技与清华大学 NLP 实验室共同研发的语鲸LingoWhale-8B模型已面向社会开源。
深言科技(DeepLang AI)由清华大学计算机系自然语言处理实验室(THUNLP)与北京智源人工智能研究院(BAAI)共同孵化,是国内最早开展大模型研发与探索大模型落地的创业公司之一。公司创始团队曾深度参与智源·悟道大模型的研发,目前已发布产品包括世界首个中文及跨语言反向词典WantWords、名句语义检索系统WantQuotes、智能写作工具深言达意等。
根据介绍,LingoWhale-8B模型是拥有约80亿参数的中英双语大语言模型,在C-Eval、MMLU、CMMLU等多个权威的公开评测基准上,在10B以下开源模型中达到领先效果。
LingoWhale-8B是深言科技与清华大学NLP实验室共同推出的语鲸系列大模型中首个开源的中英双语大语言模型。
LingoWhale-8B模型在数万亿token的高质量中英数据上进行预训练,具有强大的基础能力,在多个公开评测基准上均达到领先效果。在预训练阶段,模型使用8K的上下文长度进行训练,能够完成更长上下文的理解和生成任务。LingoWhale-8B模型对学术研究完全开放,开发者通过邮件申请并获得官方商用许可后,即可免费商用。
在开源模型权重的同时,项目团队也提供了符合用户习惯的Huggingface推理接口以及LoRA等参数高效微调示例,便于开发者快速使用LingoWhale-8B模型。
受模型参数量影响,大模型固有的幻觉问题、数学计算能力相对较弱、生成内容有无法预见性等问题在LingoWhale-8B模型中仍然存在。因此建议在使用前了解这些问题,评估可能存在的风险。后续版本的语鲸大模型将会针对此类问题进行持续优化。
测评分析
截至10月24日,在中文领域权威评测C-Eval中,LingoWhale-8B模型的性能仅次于GPT-4。在C-Eval、CMMLU、GAOKAO测评中,性能超过GPT-3.5Turbo,在10B以下尺寸模型中性能处于领先位置。
一些示例:
低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。
持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。
转载内容版权归作者及来源网站所有,本站原创内容转载请注明来源。
- 上一篇
国外 HR:如果看到简历有参与开源贡献的内容,直接扔掉
自称曾负责 FAANG(美国科技巨头)招聘工作的“猎头”在推特发表了如内容: 他表示自己在招人的时候,如果看到开发者的简历出现参与开源贡献的内容,会直接把简历扔掉。他认为,开发者有这么多的空闲时间来不求回报地写代码,对工作的投入程度能有多高? 他继续补充道:“对于初级开发者来说,他们参与开源可以理解。但对于高级开发者来说,这表明他们缺乏成熟度。” 最后他附上了自己拒绝别人求内推的截图:
- 下一篇
复用性风控:软件复用成本的量化管理
复用性(Reusability)是软件工程中一个被频频使用的术语,它一般作为产品的卖点被宣传,或者出现在技术设计文档之中。大部分看到这个概念的的受众只是将其作为一个积极的软件非功能属性去理解,但却忽略了其背后隐藏的风险。本文从另一个角度出发,去分析「复用性」这一概念背后的风险及成因,借助笔者在业务安全和基础安全的一点经验,提出了一个在软件研发流程中,管理「复用性成本风险」的风险管理模型。从模型出发,我们可以认识到实现复用时面临的各项挑战、开发认知谬误、复用成本的形式化定义方法等,希望这些输入能为读者在后续的技术决策和软件研发流程提供些许帮助。 本文主要分为三个部分:第一部分介绍复用性的定义以及不合理复用引入的主要技术债,第二部分分析复用性失效的原因;第三部分为复用性软件资产的构建方和使用方提供一个形式化的度量工具,该工具将奠定后续风险管理模型评估阶段定量分析的基础;第四部分提出一个用于管理「复用性风险」的模型,覆盖软件研发生命周期的全流程,通过事前评估、事中缓释和事后迭代三个环节最大程度地降低由于软件复用带来的软件开发和维护成本。 一、复用性的理想与现实 1.1 复用定义:从代码到系统...
相关文章
文章评论
共有0条评论来说两句吧...
文章二维码
点击排行
推荐阅读
最新文章
- CentOS8安装Docker,最新的服务器搭配容器使用
- CentOS8编译安装MySQL8.0.19
- Windows10,CentOS7,CentOS8安装MongoDB4.0.16
- CentOS7编译安装Cmake3.16.3,解决mysql等软件编译问题
- CentOS7编译安装Gcc9.2.0,解决mysql等软件编译问题
- Docker快速安装Oracle11G,搭建oracle11g学习环境
- CentOS7,CentOS8安装Elasticsearch6.8.6
- CentOS6,7,8上安装Nginx,支持https2.0的开启
- Docker使用Oracle官方镜像安装(12C,18C,19C)
- CentOS7安装Docker,走上虚拟化容器引擎之路