Sockeye 3.0.7 发布,快速、可扩展的深度学习库
Sockeye 是一个基于 Apache MXNet 的快速而可扩展的深度学习库。Sockeye 代码库具有来自 MXNet 的独特优势。例如,通过符号式和命令式 MXNet API,Sockeye 结合了陈述式和命令式编程风格;可以在多块 GPU 上并行训练模型。
目前 Sockeye 更新到 3.0.7 版本,改进了训练速度,内容如下:
[3.0.7]
在训练期间使用 torch.nn.functional.multi_head_attention_forward
的自注意力和编码器注意力来提高训练速度。
需要重新组织键值输入投影的参数布局,因为当前的 Sockeye 注意力会交错以进行更快的推理。注意掩码(源掩码和自回归掩码都需要一些形状调整,因为对融合 MHA 操作的要求略有不同)。
- 联合键值输入投影参数的非交错格式:
in_features=hidden, out_features=2*hidden -> Shape: (2*hidden, hidden)
- 联合键值输入投影的交错格式存储键和值参数,按头部分组:
Shape: ((num_heads * 2 * hidden_per_head), hidden)
- 模型以交错格式保存和加载键值投影参数。
- 当
model.training == True
键值投影参数被放入非交错格式时torch.nn.functional.multi_head_attention_forward
- 当
model.training == False
,即 model.eval() 被调用时,键值投影参数再次转换为交错格式。
[3.0.6]
- 修复了阻止使用
bleu
as--optimized-metric
进行分布式训练的检查点解码器问题(#995)
[3.0.5]
- 修复了多语言教程中的数据下载。

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。
持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。
转载内容版权归作者及来源网站所有,本站原创内容转载请注明来源。
- 上一篇
成立两年不谈营收,这家公司在想什么?
开源不等于免费。 大概每个人刚开始了解开源时,都会听到这句话。 但是,有这样一家开源创企,花了近 2 年的时间,为开源软件 Apache Pulsar、Apache BookKeeper 做贡献,甚至还免费帮社区用户开发定制化的需求,分文不取…… 这家公司便是 StreamNative,其两位创始人郭斯杰和翟佳也是他们所维护的开源项目的创始成员和 PMC 成员。最近,我们和 StreamNative 的创始人翟佳聊了聊他们的故事。 在 StreamNative 的故事中,我们能看到开源掌舵者对开源社区的坚持和思考,能看到投资人在背后给予开源事业的认可与帮助。当然,我们更能看到开源创企独特的发展路径——两年的免费支持并不意味着慈善,而是蓄力之后静待爆发,让开源社区成长为企业最坚固的护城河。 一条鲶鱼至少能让水面泛起波澜 回想 2019 年初下决心投入 Pulsar 研发的时候,翟佳提到朋友给他的一句话:大数据市场已经成型,你们进来就相当于一条鲶鱼,不一定能游很远,但市场肯定会有波动。 做为技术人员,在彼时风起云涌的大数据市场留下自己的身影,听起来就心潮澎湃。 数据库领域产品的爆发可追溯至...
- 下一篇
ng-zorro-antd 12.1.1 发布,Ant Design 的 Angular 实现
ng-zorro-antd是 Ant Design 的 Angular 实现,主要用于研发企业级中后台产品。全部代码开源并遵循 MIT 协议,任何企业、组织及个人均可免费使用。 目前ng-zorro-antd 更新了 12.1.1 版本,带来如下变化: Bug 修复 date-picker,time-picker:禁用自动填充 autocomplete 属性 (#7088) (bddc537), closes#6718 popconfirm:修复箭头丢失样式 (#7086) (3f4a704) timeline:清空数据时重置组件状态 (#7109) (0ece612) 性能改进 carousel:keydown事件取消不必要的脏值检测(change detection) (#7097) (ca3299e) cascader:keydown事件取消不必要的脏值检测 (#7060) (9a37718) date-picker:点击date-range-popup取消不必要的脏值检测 (#7096) (8f8c71b) date-picker:修复内存泄漏问题 (#7113) (fe907...
相关文章
文章评论
共有0条评论来说两句吧...
文章二维码
点击排行
推荐阅读
最新文章
- CentOS8,CentOS7,CentOS6编译安装Redis5.0.7
- Eclipse初始化配置,告别卡顿、闪退、编译时间过长
- 设置Eclipse缩进为4个空格,增强代码规范
- Hadoop3单机部署,实现最简伪集群
- CentOS7编译安装Gcc9.2.0,解决mysql等软件编译问题
- CentOS7编译安装Cmake3.16.3,解决mysql等软件编译问题
- 2048小游戏-低调大师作品
- CentOS6,CentOS7官方镜像安装Oracle11G
- Jdk安装(Linux,MacOS,Windows),包含三大操作系统的最全安装
- SpringBoot2更换Tomcat为Jetty,小型站点的福音