首页 文章 精选 留言 我的
优秀的个人博客,低调大师

微信关注我们

原文链接:https://www.oschina.net/news/356026

转载内容版权归作者及来源网站所有!

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。

国家互联网信息办公室:中国已有 433 款大模型完成备案

在2025上海世界移动通信大会(MWC上海2025)开幕式上,国家互联网信息办公室副主任王京涛在致辞中指出,截至目前,中国已经有433款大模型完成备案,上线提供服务。 王京涛表示,目前中国已成为全球最大的互联网市场,拥有全球最多的网民和移动互联网的用户,以及最活跃的数字技术和应用创新生态,建成了全球规模最大、技术领先、性能优越的网络基础设施。在追求自身发展的同时,中国也积极地推进各国共享互联网发展机遇。 面向未来,中国要坚持发展与安全并重研究,加强发展战略、治理规则和技术标准的对接协调,推动人工智能朝着有益、安全、公平的方向健康、有序发展。要尊重各国网络主权,尊重各国的互联网发展道路和治理模式,共同构筑和平、开放、安全、合作、有序的网络空间。 王京涛还表示,以人工智能为代表的新的数字技术,给人类生产生活带来前所未有的机遇的同时,不同地区、国家、群体间享受数字红利的差距依然较大。对此,他建议,秉持人类共同体理念,广泛开展人工智能国际合作,帮助发展中国家加强能力建设,提高人工智能的技术的可及性,弥合全球智能鸿沟,释放更多的智能红利。

DeepEP —— 开源 EP 通信库

DeepEP 是专为Mixture-of-Experts (MoE)和 expert parallelism (EP)定制的通信库。它提供高吞吐量和低延迟的all-to-allGPU 内核,也就是所谓的 MoE 调度和组合。该库还支持低精度操作,包括 FP8。 为了与 DeepSeek-V3论文中提出的 group-limited gating algorithm 保持一致,DeepEP 提供了一组针对非对称域带宽转发(例如将数据从 NVLink 域转发到 RDMA 域)进行优化的内核。这些内核提供高吞吐量,使其适合训练和推理预填充任务。此外,它们还支持 SM (Streaming Multiprocessors)数量控制。 对于延迟敏感的推理解码,DeepEP 包含一组具有纯 RDMA 的低延迟内核,以最大限度地减少延迟。该库还引入了一种 hook-based 通信计算重叠方法,该方法不占用任何 SM 资源。 要求 Hopper GPU(以后可能支持更多架构或设备) Python 3.8 及以上版本 CUDA 12.3 及以上版本 PyTorch 2.1 及以上版本 用于节点内通信的...

相关文章

发表评论

资源下载

更多资源
Mario

Mario

马里奥是站在游戏界顶峰的超人气多面角色。马里奥靠吃蘑菇成长,特征是大鼻子、头戴帽子、身穿背带裤,还留着胡子。与他的双胞胎兄弟路易基一起,长年担任任天堂的招牌角色。

Apache Tomcat

Apache Tomcat

Tomcat是Apache 软件基金会(Apache Software Foundation)的Jakarta 项目中的一个核心项目,由Apache、Sun 和其他一些公司及个人共同开发而成。因为Tomcat 技术先进、性能稳定,而且免费,因而深受Java 爱好者的喜爱并得到了部分软件开发商的认可,成为目前比较流行的Web 应用服务器。

Eclipse

Eclipse

Eclipse 是一个开放源代码的、基于Java的可扩展开发平台。就其本身而言,它只是一个框架和一组服务,用于通过插件组件构建开发环境。幸运的是,Eclipse 附带了一个标准的插件集,包括Java开发工具(Java Development Kit,JDK)。

JDK

JDK

JDK是 Java 语言的软件开发工具包,主要用于移动设备、嵌入式设备上的java应用程序。JDK是整个java开发的核心,它包含了JAVA的运行环境(JVM+Java系统类库)和JAVA工具。