RWKV-5-World 7B 模型开源——最环保、最节能的 AI 模型
2024年1月28日,RWKV开源基金会宣布开源RWKV-5-World 7B模型。
据介绍,“RWKV-5-World 7B”是 RWKV 第五代架构7B参数大模型,也是RWKV迄今为止多语言性能最强的开源大模型。根据性能评测数据显示,在100% attention-free和只训练1.1T tokens的前提下,RWKV-5 7B模型的多语言性能超过Mistral,英文性能看齐LlaMa2。
RWKV模型介绍
RWKV是一种创新的深度学习网络架构,它将Transformer与RNN各自的优点相结合,同时实现高度并行化训练与高效推理,时间复杂度为线性复杂度,在长序列推理场景下具有优于Transformer的性能潜力。
RWKV-v5架构模型能力指标接近Llama2,但推理成本降低2~10倍,训练成本降低2~3倍。
如上图所示,对比RWKV-v4架构,在使用相同训练数据集的情况下,RWKV-v5的多语言能力大幅提升,整体提升约4%。而对比其他同为7B参数的模型,RWKV-5 7B的多语言表现亦处于领先地位。
官方介绍称,在相同参数大小(7B)的模型独立基准测试中,RWKV是世界上最环保、最节能的人工智能模型/架构(以每个token输出为基础):
测试地址:https://ml.energy/leaderboard/
RWKV架构的能源效率源自线性Transformer架构的2~10倍计算效率与Transformer架构的二次缩放。随着模型规模的扩大,RWKV架构的节能特性会越发明显。
下载&试玩 RWKV-5-World 7B
RWKV-5-World 7B 模型在线Demo:https://huggingface.co/spaces/BlinkDL/RWKV-Gradio-2
RWKV-5-World 7B 模型下载地址:

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。
持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。
转载内容版权归作者及来源网站所有,本站原创内容转载请注明来源。
- 上一篇
腾讯 APIJSON 插件 apijson-mongodb 开源,支持文档数据库 MongoDB
腾讯 APIJSON 是一种专为 API 而生的 JSON 网络传输协议 以及 基于这套协议实现的 ORM 库。为各种增删改查提供了完全自动化的万能 API,零代码实时满足千变万化的各种新增和变更需求。 能大幅降低开发和沟通成本,简化开发流程,缩短开发周期。适合中小型前后端分离的项目。 自 2016 年开源 7 年来发展迅速,目前 16K+ Star 位居 400W Java 开源项目前 100。 国内 腾讯、华为、阿里巴巴、字节跳动、美团、拼多多、百度、京东、网易、快手、圆通 等 和 国外 Google, Apple, Microsoft, Amazon, Tesla, Meta(FB), Paypal 等数百个知名大厂员工 Star, 也有 腾讯、华为、字节跳动、Microsoft、Zoom、知乎 等 工程师/专家/架构师 提了 PR/Issue, 还被 腾讯、华为、百度、SHEIN、快手、中兴、传音、圆通、美图 等各大知名厂商用于各类项目。 apijson-mongodb 腾讯APIJSON的 MongoDB 数据库插件,可通过 Maven, Gradle 等远程依赖。 添加依...
- 下一篇
Meta 发布全新代码生成大模型 Code Llama 70B
Meta 今天发布了全新的代码生成大模型 Code Llama 70B。据称其 HumanEval 评分达到 67.8,达到 GPT-4 水准,是目前评分最高的开源大模型。 https://twitter.com/AIatMeta/status/1752013879532782075 Code Llama 70B 是此前 Code Llama 的升级版本,包括三个模型: CodeLlama-70B CodeLlama-70B-Python CodeLlama-70B-Instruct 开源地址:https://huggingface.co/codellama/CodeLlama-70b-hf Code Llama 以 Llama 2 为基础,可以帮助开发者根据提示创建代码,并调试人工编写的代码。 Meta 表示,Code Llama 70B 性能更高,可以处理更多的内容,更好地帮助开发者处理编程时遇到的问题。此外,Code Llama 70B 采用了与 Llama 2 和 Code Llama 相同的 License,可用于研究和商业用途。 扎克伯格表示:“编写代码能力对于 AI 模型...
相关文章
文章评论
共有0条评论来说两句吧...
文章二维码
点击排行
推荐阅读
最新文章
- Docker快速安装Oracle11G,搭建oracle11g学习环境
- Red5直播服务器,属于Java语言的直播服务器
- CentOS7,8上快速安装Gitea,搭建Git服务器
- SpringBoot2整合Thymeleaf,官方推荐html解决方案
- 2048小游戏-低调大师作品
- SpringBoot2整合MyBatis,连接MySql数据库做增删改查操作
- CentOS7,CentOS8安装Elasticsearch6.8.6
- CentOS关闭SELinux安全模块
- Docker使用Oracle官方镜像安装(12C,18C,19C)
- Springboot2将连接池hikari替换为druid,体验最强大的数据库连接池