Mistral AI 开源 Mistral 8x22B Moe 大模型-低调大师

Mistral AI 开源 Mistral 8x22B Moe 大模型

2024-04-10 265 89

Mistral AI 公司刚刚再次用磁力链接开源了一款大模型 —— Mistral 8x22B，模型文件大小为 281.24 GB。

从模型的名字来看，Mistral 8x22B 是去年开源的「mixtral-8x7b」的超级大杯版本，参数规模增长三倍不止——由 8 个 220 亿参数规模 (8×22B) 的专家网络组成。

https://twitter.com/MistralAI/status/1777869263778291896

磁力链接地址：

magnet:?xt=urn:btih:9238b09245d0d8cd915be09927769d5f7584c1c9&dn=mixtral-8x22b&tr=udp%3A%2F%http://2Fopen.demonii.com%3A1337%2Fannounce&tr=http%3A%2F%http://2Ftracker.opentrackr.org%3A1337%2Fannounce

目前 Mistral AI 已经开源的模型如下：

Mistral-Tiny：7B
Mistral-Small：8x7B
Mistral-Medium：8x22B

微信关注我们

原文链接：https://www.oschina.net/news/286974/mistral-8-22b

转载内容版权归作者及来源网站所有！

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。

2024-04-10 10:17:00

斯坦福团队开源端侧大模型 Octopusv2

斯坦福大学研究团队近日推出了一款全新的开源端侧大模型 Octopusv2。论文：Octopus v2: On-device language model for super agent 论文地址：https://arxiv.org/abs/2404.01744 模型主页：https://huggingface.co/NexaAIDev/Octopus-v2 Octopusv2是一款拥有20亿参数的开源语言模型，专为在Android设备上运行而设计，同时也适用于汽车、个人电脑等其他端侧设备，并将实用性扩展到从 Android 系统管理到多个设备的编排等各种应用程序。该模型在准确性和延迟方面的表现超越了GPT-4，并且在上下文长度上减少了95%，显示出了显著的性能优势。此外，Octopus v2 比 Llama7B + RAG 方案快 36 倍。 Octopus-V2-2B模型的开发过程中，研究团队采用了创新的函数token策略，这使得模型在训练和推理阶段能够高效地生成复杂的函数调用。

382

2024-04-10 11:31:00

谷歌发布代码大模型 CodeGemma

谷歌发布了用于辅助编程的代码大模型 CodeGemma。CodeGemma 基于谷歌今年 2 月发布的轻量级开源大模型 Gemma，针对 Gemma 的两个不同参数规模的版本 Gemma 2B 和 Gemma 7B 发布了 CodeGemma 2B 和 CodeGemma 7B（有预训练和指令微调两种）。因此 CodeGemma 有 3 个模型变体： 7B 预训练变体，专门用于补全代码以及利用代码前缀和/或后缀生成代码 70 亿指令微调变体，用于自然语言到代码的聊天和指令遵循先进的 2B 预训练变体，代码补全速度快至 2 倍 CodeGemma 可以执行各种编码任务，例如填充中间代码补全、代码生成、自然语言理解、数学推理和指令遵循。 CodeGemma 具有多项优势：智能代码补全和生成：无论您是在本地工作，还是使用 Google Cloud 资源，都可以填写整行、函数，甚至生成整块代码块。准确性更高：CodeGemma 模型基于 Web 文档、数学和代码中的 5000 亿个词元（主要是英语）数据训练而成，生成的代码不仅语法正确，而且语义上也更有意义，从而减少错误并缩短调试时间。...

350

资源下载

更多资源

优质分享Android(本站安卓app)

近一个月的开发和优化，本站点的第一个app全新上线。该app采用极致压缩，本体才4.36MB。系统里面做了大量数据访问、缓存优化。方便用户在手机上查看文章。后续会推出HarmonyOS的适配版本。

Oracle Database，又名Oracle RDBMS

Oracle Database，又名Oracle RDBMS，或简称Oracle。是甲骨文公司的一款关系数据库管理系统。它是在数据库领域一直处于领先地位的产品。可以说Oracle数据库系统是目前世界上流行的关系数据库管理系统，系统可移植性好、使用方便、功能强，适用于各类大、中、小、微机环境。它是一种高效率、可靠性好的、适应高吞吐量的数据库方案。

Java Development Kit(Java开发工具)

JDK是 Java 语言的软件开发工具包，主要用于移动设备、嵌入式设备上的java应用程序。JDK是整个java开发的核心，它包含了JAVA的运行环境（JVM+Java系统类库）和JAVA工具。

Sublime Text 一个代码编辑器

Sublime Text具有漂亮的用户界面和强大的功能，例如代码缩略图，Python的插件，代码段等。还可自定义键绑定，菜单和工具栏。Sublime Text 的主要功能包括：拼写检查，书签，完整的 Python API ， Goto 功能，即时项目切换，多选择，多窗口等等。Sublime Text 是一个跨平台的编辑器，同时支持Windows、Linux、Mac OS X等操作系统。