英伟达开源 Nemotron-Mini-4B-Instruct 小语言 AI 模型-低调大师

英伟达开源 Nemotron-Mini-4B-Instruct 小语言 AI 模型

2024-09-18 404

英伟达近日开源了一款名为 Nemotron-Mini-4B-Instruct 的小语言模型 (small language model, SLM)。

地址：https://huggingface.co/nvidia/Nemotron-Mini-4B-Instruct

Nemotron-Mini-4B-Instruct 模型专为角色扮演、检索增强生成（RAG）及函数调用等任务设计，是一个小语言模型（SLM），通过蒸馏（distilled）和优化更大的 Nemotron-4 15B 获得。

该模型在 Minitron-4B-Base 模型上微调，采用了 LLM 压缩技术，最显著的特点之一是其能够处理 4096 个上下文窗口词元（token），能够生成更长且更连贯的回复。

Nemotron-Mini-4B-Instruct 以其强大的架构著称，确保了高效性与可扩展性。该模型的 Embedding Size（决定了转化后的向量的维度）尺寸为 3072，多头注意力（Multi-Head Attention）为 32 个，MLP 中间维度为 9216，在处理大规模输入数据集时，仍能以高精度和相关性作出响应。

微信关注我们

原文链接：https://www.oschina.net/news/312455/nvidia-nemotron-mini-4b-instruct

转载内容版权归作者及来源网站所有！

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。

8000 多名 JS 社区成员联名让 Oracle 放弃 JavaScript 商标！包括 JS、Node、npm 创建者等核心人物

https://javascript.tm网站上发起了一项让 Oracle 放弃 JavaScript 商标权的联名呼吁。目前已有包括Node.js 的创造者、JavaScript 的创造者、Svelte 创始人、npm 创建者、Socket 首席执行官、JavaScript spec 编辑在内的 8000 多名 JS 社区成员署名！ 1995 年，Netscape 和 Sun Microsystems 合作开发了 JavaScript；2009 年，Oracle 收购了 Sun Microsystems，并因此获得了JavaScript 商标。这一封公开信，敦促 Oracle 放弃对 JavaScript 商标的控制。文章指出，尽管 JavaScript 是世界上最流行的编程语言之一，但大多数人并不知道它是 Oracle 控制的商标。Oracle 持有 JavaScript 商标但不作为的行为符合商标放弃的法律定义，因为它已经连续三年未使用，且 JavaScript 已经成为一个通用名称，失去了作为商标的意义。Oracle 从未真正提供过名为 JavaScript 的产品，而且最近...

2024-09-18

326

欢迎阅读 OSCHINA 编辑部出品的开源日报，每天更新一期。 # 2024.9.18 今日要闻 Swift 6 发布 Swift 6 的发布为 Swift 语言带来了显著的进步，包括对并发、类型化异常抛出、所有权、C++ 互操作性、嵌入式 Swift 以及 128 位整数的支持和改进。它引入了新的同步库、类型化抛出机制、对不可复制类型的支持以及对嵌入式开发的初步支持。此外，Swift 6 还增强了对 C++ 的互操作性，统一了 Foundation 在所有平台上的实现，并推出了全新的 Swift Testing 库。该版本还提供了对 Linux 和 Windows 平台的全面支持，包括对更多 Linux 发行版和 Windows 架构的支持，以及为 Linux 提供了全静态 SDK。Swift 6 还致力于提高生产效率，通过引入新的生产力增强功能和改进的调试宏，使得开发者能够更高效地编写和调试代码。 8000 多名 JS 社区成员联名让 Oracle 放弃 JavaScript 商标 https://javascript.tm网站上发起了一项让 Oracle 放弃 JavaScri...

2024-09-18

390

资源下载

更多资源

腾讯云软件源

为解决软件依赖安装时官方源访问速度慢的问题，腾讯云为一些软件搭建了缓存服务。您可以通过使用腾讯云软件源站来提升依赖包的安装速度。为了方便用户自由搭建服务架构，目前腾讯云软件源站支持公网访问和内网访问。

Spring

Spring框架（Spring Framework）是由Rod Johnson于2002年提出的开源Java企业级应用框架，旨在通过使用JavaBean替代传统EJB实现方式降低企业级编程开发的复杂性。该框架基于简单性、可测试性和松耦合性设计理念，提供核心容器、应用上下文、数据访问集成等模块，支持整合Hibernate、Struts等第三方框架，其适用范围不仅限于服务器端开发，绝大多数Java应用均可从中受益。

Sublime Text

Sublime Text具有漂亮的用户界面和强大的功能，例如代码缩略图，Python的插件，代码段等。还可自定义键绑定，菜单和工具栏。Sublime Text 的主要功能包括：拼写检查，书签，完整的 Python API ， Goto 功能，即时项目切换，多选择，多窗口等等。Sublime Text 是一个跨平台的编辑器，同时支持Windows、Linux、Mac OS X等操作系统。

WebStorm

WebStorm 是jetbrains公司旗下一款JavaScript 开发工具。目前已经被广大中国JS开发者誉为“Web前端开发神器”、“最强大的HTML5编辑器”、“最智能的JavaScript IDE”等。与IntelliJ IDEA同源，继承了IntelliJ IDEA强大的JS部分的功能。