DeepSeek 开源周第三日:开源 DeepGEMM
DeepSeek 开源周第三日宣布推出 DeepGEMM,一个支持密集和 MoE GEMM 的 FP8 GEMM 库,为 V3/R1 训练和推理提供支持。
该库采用 CUDA 编写,在安装过程中无需编译,通过使用轻量级的即时编译(JIT)模块在运行时编译所有内核。
相关阅读:

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。
持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。
转载内容版权归作者及来源网站所有,本站原创内容转载请注明来源。
- 上一篇
DeepSeek R2 将提前推出
据路透社援引三位知情人士的消息称,DeepSeek 正在加速推出 1 月发布的 R1 模型升级版 — DeepSeek R2。 其中两位知情人士表示,DeepSeek 原计划在 5 月初发布 R2,但现在希望尽早推出,具体时间尚未透露。该公司表示,希望新模型在编程能力上表现更佳,并能够支持英语以外的多种语言进行推理。 此外,DeepSeek 在同日重新开放了 API 充值入口,此前因资源紧张,其曾一度关闭充值入口。目前 deepseek-chat 模型优惠期结束,调用价格已变更为每百万输入 tokens 2 元,每百万输出 tokens 8 元。 路透社的独家报道: - DeepSeek原计划在5月初发布新一代R2模型,但已经开始考虑提前发布,这段时间Grok 3、Claude 3.7、Qwen 2.5-Max等竞品接连推出,还是有影响的; - 梁文锋在距离清华、北大两所高校步行可达的地段设立了北京办公室,非常乐于和实习生以及应届生一起工作和讨论问题,而且从不鼓励加班; - 采访中一名已经离职的研究员依然对前老板赞不绝口,「他把我们视为专家,不断提问,一起学习,而且愿意下放管理权,普通...
- 下一篇
宇树科技 G1 人形机器人展示武打动作
昨日,宇树科技发布视频展示了旗下 G1 人形机器人最新更新。 视频中,宇树 G1 人形机器人在镜头前展示了「武打动作」的实操,其能够依靠自身完成单脚飞腿加 360° 转身动作。 据宇树科技官方介绍,宇树 G1 机器人算法继续升级,现在已经支持“任意动作任意学”。视频显示,G1 机器人完成了连续武打动作,并能够保持平衡。 宇树 G1 人形机器人于 2024 年 5 月发布,定价 9.9 万元起,官方称其为“人形智能体、AI化身”,支持模仿&强化学习驱动。外观设计方面,该机器人体重约 35kg、身高约 127cm,拥有 23~43 个关节电机,关节最大扭矩 120N・m。 近期,宇树科技还公布了宇树 G1 舞蹈视频,视频中机器人动作自然流畅,受到外力干扰依然能够完成舞蹈动作,不受外界影响。 此前,在 2025 年央视春晚中,著名电影导演张艺谋携手杭州宇树科技、新疆艺术学院带来了一个名为《秧 BOT》的节目,而其中表演的机器人基于宇树 Unitree H1 人形机器人打造,宇树 G1 和宇树 Go 系列机器狗也一同登台。
相关文章
文章评论
共有0条评论来说两句吧...
文章二维码
点击排行
推荐阅读
最新文章
- Docker快速安装Oracle11G,搭建oracle11g学习环境
- Docker使用Oracle官方镜像安装(12C,18C,19C)
- CentOS关闭SELinux安全模块
- CentOS7安装Docker,走上虚拟化容器引擎之路
- Docker安装Oracle12C,快速搭建Oracle学习环境
- CentOS6,7,8上安装Nginx,支持https2.0的开启
- Linux系统CentOS6、CentOS7手动修改IP地址
- Hadoop3单机部署,实现最简伪集群
- CentOS7编译安装Cmake3.16.3,解决mysql等软件编译问题
- CentOS7,8上快速安装Gitea,搭建Git服务器