英伟达发布 AI 芯片 H200-低调大师

英伟达发布 AI 芯片 H200

2023-11-14 290

英伟达昨晚正式发布了 AI 芯片 H100 GPU 的后续产品 HGX H200 GPU，可大幅提高大语言模型的能力。

据悉，HGX H200 GPU 基于英伟达的“Hopper”架构，相比前代产品内存带宽增加了1.4倍，内存容量增加了1.8倍。H200 GPU使用了HBM3e 内存的芯片，能够以每秒 4.8 TB 的速度提供 141GB 的内存。

英伟达表示，H200更大、更快的内存可加快生成式人工智能和大语言模型的速度，与 H100 GPU 相比，H200 在处理 Llama2 等大语言模型时可将推理速度提高 2 倍。

H200 还与已经支持 H100 的系统兼容。英伟达表示，客户在添加H200时不需要做任何改动。亚马逊、谷歌、微软和甲骨文的云计算部门将在明年率先使用到新的 GPU。

预计H200将于2024年第二季度上市，届时将与AMD的MI300X GPU展开竞争。与H200相似，AMD的新芯片相比前代产品拥有更多内存，这对运行大型语言模型的推理计算有帮助。

据美国金融机构Raymond James透露，H100芯片的成本仅为3320美元，但英伟达对其客户的批量价格却高达2.5万至4万美元。这使得H100的利润率可能高达1000%，成为有史以来最赚钱的芯片之一。

在训练大型语言模型时，通常需要数千个H100集群协同工作，因此科技巨头、初创公司和政府机构都在争夺英伟达有限的芯片供应。

由于对其产品的需求看似无穷无尽，英伟达今年的销售额大幅增长，股价上涨了230%，市值突破了1.2万亿美元大关。截至周一收盘，该股收涨0.59%，报486.2美元。

微信关注我们

原文链接：https://www.oschina.net/news/266361

转载内容版权归作者及来源网站所有！

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。

TGFX —— 跨平台 2D 绘图引擎

TGFX (Tencent Graphics)是一个轻量级 2D 图形库，设计用于渲染文本、几何图形和图像。它提供高性能的 API，可在各种 GPU 硬件和软件平台上运行，包括 iOS、Android、macOS、Windows、Linux、Web 等。 TGFX 最初是作为 PAG 项目的核心组件创建的，从 4.0 版开始成为 libpag 库的默认图形引擎。它的主要目标是在保持更小二进制文件大小的同时，为 Skia 图形库提供令人信服的替代方案。随着时间的推移，它已被许多其他产品采用，如 Hippy、腾讯文档和各种视频编辑应用程序。包体优化 TGFX 最终以 400K 左右的大小覆盖了 Skia 近 2M 包体的绝大部分功能。核心优化策略主要有两点：调度优化 TGFX 并不只是做 Skia 的简化，还把一些在业务上调用起来非常复杂的通用性流程进行了抽象封装：在性能和架构方面，还做了这些额外的优化：默认开启了 HardwareBuffer 的支持，来全面加速纹理的提交，包括 Android 端。暴露了引擎内部 Path 对应的 GPU 高速缓存，避免矢量绘制充分进行三角剖分...

2023-11-14

778

国际电信联盟第十三研究组（简称ITU-T SG13）于2023年10月23日-11月3日在瑞士日内瓦召开全体会议，来自世界各国的百余名代表参加会议。会上，由中国信息通信研究院（简称“中国信通院”）牵头提出的ITU-T Y.FaaS-reqts“Cloud computing - Functional requirements of function as a service（云计算-函数即服务功能要求）”国际标准成功立项，并计划于2025年正式发布。本国际标准依托中国信通院牵头制定的行业标准YD/T 3764.9-2021《云计算服务客户信任体系能力要求第9部分：函数即服务》提出。本标准计划给出函数即服务（FaaS）的清晰定义，界定FaaS与服务器无感知（Serverless）计算、云计算之间的关系，梳理FaaS与周边生态的交互关系，并详细列出FaaS的功能要求，同时将通过典型场景下FaaS的应用案例辅助验证本标准的适用性与准确性。 FaaS是Serverless计算最典型的形态，Serverless体现了将基础设施资源抽象成按需使用的服务，用户只需关注应用逻辑，而无需管理复杂的...

2023-11-14

386

资源下载

更多资源

腾讯云软件源

为解决软件依赖安装时官方源访问速度慢的问题，腾讯云为一些软件搭建了缓存服务。您可以通过使用腾讯云软件源站来提升依赖包的安装速度。为了方便用户自由搭建服务架构，目前腾讯云软件源站支持公网访问和内网访问。

Nacos

Nacos /nɑ:kəʊs/ 是 Dynamic Naming and Configuration Service 的首字母简称，一个易于构建 AI Agent 应用的动态服务发现、配置管理和AI智能体管理平台。Nacos 致力于帮助您发现、配置和管理微服务及AI智能体应用。Nacos 提供了一组简单易用的特性集，帮助您快速实现动态服务发现、服务配置、服务元数据、流量管理。Nacos 帮助您更敏捷和容易地构建、交付和管理微服务平台。

Rocky Linux

Rocky Linux（中文名：洛基）是由Gregory Kurtzer于2020年12月发起的企业级Linux发行版，作为CentOS稳定版停止维护后与RHEL（Red Hat Enterprise Linux）完全兼容的开源替代方案，由社区拥有并管理，支持x86_64、aarch64等架构。其通过重新编译RHEL源代码提供长期稳定性，采用模块化包装和SELinux安全架构，默认包含GNOME桌面环境及XFS文件系统，支持十年生命周期更新。

Sublime Text

Sublime Text具有漂亮的用户界面和强大的功能，例如代码缩略图，Python的插件，代码段等。还可自定义键绑定，菜单和工具栏。Sublime Text 的主要功能包括：拼写检查，书签，完整的 Python API ， Goto 功能，即时项目切换，多选择，多窗口等等。Sublime Text 是一个跨平台的编辑器，同时支持Windows、Linux、Mac OS X等操作系统。