Meta 发布全新代码生成大模型 Code Llama 70B
Meta 今天发布了全新的代码生成大模型 Code Llama 70B。据称其 HumanEval 评分达到 67.8,达到 GPT-4 水准,是目前评分最高的开源大模型。
Code Llama 70B 是此前 Code Llama 的升级版本,包括三个模型:
- CodeLlama-70B
- CodeLlama-70B-Python
- CodeLlama-70B-Instruct
开源地址:https://huggingface.co/codellama/CodeLlama-70b-hf
Code Llama 以 Llama 2 为基础,可以帮助开发者根据提示创建代码,并调试人工编写的代码。
Meta 表示,Code Llama 70B 性能更高,可以处理更多的内容,更好地帮助开发者处理编程时遇到的问题。此外,Code Llama 70B 采用了与 Llama 2 和 Code Llama 相同的 License,可用于研究和商业用途。
扎克伯格表示:“编写代码能力对于 AI 模型更严谨、更合理地处理其他领域的信息也非常重要。我为这里取得的进展感到自豪,并期待着将这些进展纳入 Llama 3 和未来的模型中。”

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。
持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。
转载内容版权归作者及来源网站所有,本站原创内容转载请注明来源。
- 上一篇
RWKV-5-World 7B 模型开源——最环保、最节能的 AI 模型
2024年1月28日,RWKV开源基金会宣布开源RWKV-5-World 7B模型。 据介绍,“RWKV-5-World 7B”是 RWKV 第五代架构7B参数大模型,也是RWKV迄今为止多语言性能最强的开源大模型。根据性能评测数据显示,在100% attention-free和只训练1.1T tokens的前提下,RWKV-5 7B模型的多语言性能超过Mistral,英文性能看齐LlaMa2。 RWKV模型介绍 RWKV是一种创新的深度学习网络架构,它将Transformer与RNN各自的优点相结合,同时实现高度并行化训练与高效推理,时间复杂度为线性复杂度,在长序列推理场景下具有优于Transformer的性能潜力。 RWKV-v5架构模型能力指标接近Llama2,但推理成本降低2~10倍,训练成本降低2~3倍。 如上图所示,对比RWKV-v4架构,在使用相同训练数据集的情况下,RWKV-v5的多语言能力大幅提升,整体提升约4%。而对比其他同为7B参数的模型,RWKV-5 7B的多语言表现亦处于领先地位。 官方介绍称,在相同参数大小(7B)的模型独立基准测试中,RWKV是世界上最环保...
- 下一篇
🔥🔥 mac 中使用 rz sz 新姿势 🔥🔥
macOS 使用 zmodem ( rz / sz ) 的新方法,支持 iTerm2 等任意有本地 shell 的终端 1、本地安装trzsz-ssh ( tssh ) 开源地址:https://github.com/trzsz/trzsz-ssh Gitee地址:https://gitee.com/trzsz/tssh brew install trzsz-ssh 2、本地安装 lrzsz brew install lrzsz 3、配置 ~/.ssh/config Host * #!! EnableZmodem Yes 4、使用trzsz-ssh ( tssh )登录服务器,用法与 ssh 完全一致: trzsz-ssh ( tssh )额外支持的功能详见文档:https://trzsz.github.io/cn/ssh tssh xxx 5、服务器上安装有 lrzsz ,就可以正常使用 rz / sz 了,不再赘述: rz # 上传文件 sz xxx # 下载文件 6、如果服务器可以安装 trzsz ( trz / tsz ),则可以解锁更多功能: 详见文档...
相关文章
文章评论
共有0条评论来说两句吧...