Mistral AI 发布编程大模型 Codestral：220 亿参数、支持 80 多种语言-低调大师

Mistral AI 发布编程大模型 Codestral：220 亿参数、支持 80 多种语言

2024-05-30 370

Mistral 发布了新的编程大模型 Codestral，并开源模型参数权重。据称 Codestral 在代码基准测试中显著优于 Llama3 70B 等大模型。

Codestral 在 80 多种编程语言的不同数据集上进行了训练，其中包括最流行的语言，如 Python、Java、C、C++、JavaScript 和 Bash。对于不那么主流的语言比如 Swift 和 Fortran 同样表现出色。这种广泛的语言基础确保 Codestral 可以在各种编码环境和项目中为开发者提供帮助。

和其它编程 LLM 类似，Codestral 可以帮助开发者完成各种功能，包括完成函数、编写测试、填充代码等等，降低代码中出现错误和漏洞的风险。

Mistral AI 还通过图表，让 Codestral 22B 对比了 Code Llama 70B、DeepSeek Coder 33B 和 Llama 3 70B 同类大模型，表示 Codestral 的参数虽然只有 220 亿，但上下文长度达到 3.2 万个 tokens，根据进行的几项基准测试，它在 Python、SQL 和其他语言方面的表现普遍更好。

在 SQL spider 基准测试中，Llama 3 70B 的得分率为 67.1%，Codestral 22B 为 63.5%；在 MBPP Python 基准测试中，DeepSeek Code 33B 的得分率为 80.2%，Codestral 22B 为 78.2%。

Codestral 目前处于 Beta 阶段，可以访问 chat.mistral.ai 免费使用。

文档：https://docs.mistral.ai/capabilities/code_generation/

微信关注我们

原文链接：https://www.oschina.net/news/295005/mistral-ai-codestral-llm

转载内容版权归作者及来源网站所有！

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。

【产品面对面】deepin 任务栏与启动器：功能全解析

内容来源：deepin（深度）社区 deepin 历史版本镜像获取（V15等）：DistroWatch.com: Put the fun back into computing. Use Linux, BSD. 大家期待已久的 deepin（深度）社区产品经理面对面活动终于来了。在这个全新的栏目中，我们各个产品的产品经理们将一一登场，为大家介绍 deepin 的各项产品和服务。无论您是深度操作系统的忠实粉丝，还是对我们的软件生态充满好奇，产品经理将带大家一探究竟，深入了解每一个功能的小秘密和使用技巧。不论是老用户还是新朋友，都能从中获得启发，提升使用体验。活动中，我们设置了互动环节，产品经理将会在一周内，来回复所有评论区用户的问题。这是一个难得的机会，通过直接沟通，我们可以更好地了解您的需求。第一期【产品面对面】活动，我们邀请到了 deepin 任务栏&启动器的产品经理——Merlin。据 Merlin 介绍，在deepin V23 RC 版本正式发布后至 deepin V23 Release 版本发布前，暂时不会对deepin 任务栏&启动器进行新功能开发。对于...

2024-05-30

444

腾讯混元大模型App“腾讯元宝”现已正式上线，支持文字、文件、图片输入，目前在安卓市场已经可以下载。相比此前测试阶段的混元小程序版本，面向工作效率场景，腾讯元宝提供了AI搜索、AI总结、AI写作等核心能力；面向日常生活场景，元宝提供了多个特色AI应用，并新增了创建个人智能体等玩法。据了解，元宝将于近期推出腾讯新闻哥、《庆余年》主题等特色智能体。腾讯元宝的核心竞争力是腾讯的生态。在AI 搜索方面，腾讯元宝接入了微信搜一搜、搜狗搜索等搜索引擎，并通过AI搜索增强，提升时新类和知识类问题效果。内容覆盖微信公众号等腾讯生态内容及互联网权威信源。腾讯元宝产品能力升级的背后是腾讯混元底层模型的迭代。2023 年 9 月首次亮相以来，腾讯混元大模型的参数规模已从千亿升级至万亿，预训练语料从万亿升级至7 万亿tokens，并升级为多专家模型结构（MoE），整体性能相比Dense 版本（稠密版本）提升超50%。在多模态方面，腾讯混元文生图大模型是业内首个中文原生DiT架构模型，生成效果相比上代提升超 20%。目前，腾讯内部有超 600 个业务及场景都已经接入腾讯混元。

2024-05-30

500

资源下载

更多资源

腾讯云软件源

为解决软件依赖安装时官方源访问速度慢的问题，腾讯云为一些软件搭建了缓存服务。您可以通过使用腾讯云软件源站来提升依赖包的安装速度。为了方便用户自由搭建服务架构，目前腾讯云软件源站支持公网访问和内网访问。

Nacos

Nacos /nɑ:kəʊs/ 是 Dynamic Naming and Configuration Service 的首字母简称，一个易于构建 AI Agent 应用的动态服务发现、配置管理和AI智能体管理平台。Nacos 致力于帮助您发现、配置和管理微服务及AI智能体应用。Nacos 提供了一组简单易用的特性集，帮助您快速实现动态服务发现、服务配置、服务元数据、流量管理。Nacos 帮助您更敏捷和容易地构建、交付和管理微服务平台。

Rocky Linux

Rocky Linux（中文名：洛基）是由Gregory Kurtzer于2020年12月发起的企业级Linux发行版，作为CentOS稳定版停止维护后与RHEL（Red Hat Enterprise Linux）完全兼容的开源替代方案，由社区拥有并管理，支持x86_64、aarch64等架构。其通过重新编译RHEL源代码提供长期稳定性，采用模块化包装和SELinux安全架构，默认包含GNOME桌面环境及XFS文件系统，支持十年生命周期更新。

WebStorm

WebStorm 是jetbrains公司旗下一款JavaScript 开发工具。目前已经被广大中国JS开发者誉为“Web前端开发神器”、“最强大的HTML5编辑器”、“最智能的JavaScript IDE”等。与IntelliJ IDEA同源，继承了IntelliJ IDEA强大的JS部分的功能。