华为 AI 模型运行专利公布
天眼查 App 资料显示,华为技术有限公司申请的“AI模型的运行方法、装置、程序产品和存储介质”专利于 9 月 5 日公布。
摘要显示,本公开提供了一种AI模型的运行方法、装置、程序产品和存储介质,属于机器学习技术领域。该方法应用于主机,主机包括处理器,并连接计算卡,该方法包括:处理器确定AI模型相邻的两组输入数据中在第二数据组中但不在第一数据组中的第一数据,第二数据组在第一数据组之后训练,将第一数据对应的第一嵌入向量预取至处理器的第一内存,并确定第一数据对应的第一嵌入向量信息,在第二数据组在计算卡上处理过程中,根据第一嵌入向量信息将第一嵌入向量从第一内存预取至计算卡的第二内存。采用本公开所示的方案,能够减少嵌入向量搬运带来的处理延时。

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。
持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。
转载内容版权归作者及来源网站所有,本站原创内容转载请注明来源。
-
上一篇
Snow 编程语言 v0.9.0 发布: 面向对象与虚拟调用全面落地
更新内容 新增功能 引入虚函数表(VirtualTable)与 Instance 运行时对象,支持基于继承链的虚拟调用与多态;新增 @Class::method 调用语法。 结构体继承能力:父类字段/方法复用,支持 super.method(...) 与 super(...) 构造链调用。 支持结构体多构造函数/重载与自动选择策略,增强面向对象建模能力。 新增对象创建表达式(new)及其语义分析与 IR 生成流程。 增加 ModuleNode、StructNode 及其序列化逻辑,扩展类型系统表示能力。 扩展签名注册器,支持结构体类型签名登记与跨模块校验。 支持 this.xxx 成员赋值与更复杂的表达式解析场景。 性能和稳定性改进 优化 emitCall 与 CALL 指令执行路径,修复虚调度与 super 匹配边界问题,提高执行正确性与性能。 重构 IRBuilderScope、VMProgramBuilder、IRProgram、IRContext 等核心组件,简化依赖与上下文切换开销。 优化函数解析器、语义分析器与表达式构建链路,提升类型分派与错误恢复能力。 改进结构体的序列化...
-
下一篇
英伟达新款“中国特供” AI 芯片性能强于 H20,但价格翻番
路透社独家报道了英伟达新款中国特供芯片的更多细节。 据了解,该芯片暂定名为 B30A,基于英伟达 Blackwell 架构,性能更强大。 两位知情人士表示,如果美国批准英伟达对华销售 B30A,其价格很可能是 H20 的两倍左右。目前,H20 的售价介于 1 万美元至 1.2 万美元之间。 在性能方面,一位知情人士称,B30A 的性能有望高达 H20 的六倍。B30A 和 H20 均为降级版芯片,专为遵守美国对华出口管制为中国市场开发。 结合之前的报道,该芯片采用单芯片设计,预计其算力约为旗舰级 B300 加速卡双芯片配置的一半。此外,该芯片将配备高带宽内存(HBM)和 NVLink 技术,以提升处理器间的数据传输效率。单芯片设计指所有主要电路都制作在同一块连续的硅晶圆上,而不是分散在多个芯片上。 当被问及在中国市场与对手的竞争格局时,英伟达在一份声明中表示:“竞争无疑已经到来”。该公司拒绝进一步置评。
相关文章
文章评论
共有0条评论来说两句吧...
文章二维码
点击排行
推荐阅读
最新文章
- MySQL数据库在高并发下的优化方案
- Jdk安装(Linux,MacOS,Windows),包含三大操作系统的最全安装
- CentOS6,7,8上安装Nginx,支持https2.0的开启
- CentOS7,8上快速安装Gitea,搭建Git服务器
- Docker使用Oracle官方镜像安装(12C,18C,19C)
- SpringBoot2全家桶,快速入门学习开发网站教程
- CentOS8编译安装MySQL8.0.19
- MySQL8.0.19开启GTID主从同步CentOS8
- SpringBoot2编写第一个Controller,响应你的http请求并返回结果
- Dcoker安装(在线仓库),最新的服务器搭配容器使用