Sockeye 3.0.7 发布，快速、可扩展的深度学习库-低调大师

Sockeye 3.0.7 发布，快速、可扩展的深度学习库

2021-12-20 670

Sockeye 是一个基于 Apache MXNet 的快速而可扩展的深度学习库。Sockeye 代码库具有来自 MXNet 的独特优势。例如，通过符号式和命令式 MXNet API，Sockeye 结合了陈述式和命令式编程风格；可以在多块 GPU 上并行训练模型。

目前 Sockeye 更新到 3.0.7 版本，改进了训练速度，内容如下：

[3.0.7]

在训练期间使用 torch.nn.functional.multi_head_attention_forward 的自注意力和编码器注意力来提高训练速度。

需要重新组织键值输入投影的参数布局，因为当前的 Sockeye 注意力会交错以进行更快的推理。注意掩码（源掩码和自回归掩码都需要一些形状调整，因为对融合 MHA 操作的要求略有不同）。

联合键值输入投影参数的非交错格式：
in_features=hidden, out_features=2*hidden -> Shape: (2*hidden, hidden)
联合键值输入投影的交错格式存储键和值参数，按头部分组：
Shape: ((num_heads * 2 * hidden_per_head), hidden)
模型以交错格式保存和加载键值投影参数。
当 model.training == True 键值投影参数被放入非交错格式时torch.nn.functional.multi_head_attention_forward
当 model.training == False，即 model.eval() 被调用时，键值投影参数再次转换为交错格式。

[3.0.6]

修复了阻止使用bleuas--optimized-metric进行分布式训练的检查点解码器问题（#995）

[3.0.5]

修复了多语言教程中的数据下载。

更新公告：https://github.com/awslabs/sockeye/releases/tag/3.0.7

微信关注我们

原文链接：https://www.oschina.net/news/174732/sockeye-3-0-7-released

转载内容版权归作者及来源网站所有！

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。

成立两年不谈营收，这家公司在想什么？

开源不等于免费。大概每个人刚开始了解开源时，都会听到这句话。但是，有这样一家开源创企，花了近 2 年的时间，为开源软件 Apache Pulsar、Apache BookKeeper 做贡献，甚至还免费帮社区用户开发定制化的需求，分文不取…… 这家公司便是 StreamNative，其两位创始人郭斯杰和翟佳也是他们所维护的开源项目的创始成员和 PMC 成员。最近，我们和 StreamNative 的创始人翟佳聊了聊他们的故事。在 StreamNative 的故事中，我们能看到开源掌舵者对开源社区的坚持和思考，能看到投资人在背后给予开源事业的认可与帮助。当然，我们更能看到开源创企独特的发展路径——两年的免费支持并不意味着慈善，而是蓄力之后静待爆发，让开源社区成长为企业最坚固的护城河。一条鲶鱼至少能让水面泛起波澜回想 2019 年初下决心投入 Pulsar 研发的时候，翟佳提到朋友给他的一句话：大数据市场已经成型，你们进来就相当于一条鲶鱼，不一定能游很远，但市场肯定会有波动。做为技术人员，在彼时风起云涌的大数据市场留下自己的身影，听起来就心潮澎湃。数据库领域产品的爆发可追溯至...

2021-12-20

490

ng-zorro-antd是 Ant Design 的 Angular 实现，主要用于研发企业级中后台产品。全部代码开源并遵循 MIT 协议，任何企业、组织及个人均可免费使用。目前ng-zorro-antd 更新了 12.1.1 版本，带来如下变化： Bug 修复 date-picker,time-picker:禁用自动填充 autocomplete 属性 (#7088) (bddc537), closes#6718 popconfirm:修复箭头丢失样式 (#7086) (3f4a704) timeline:清空数据时重置组件状态 (#7109) (0ece612) 性能改进 carousel:keydown事件取消不必要的脏值检测（change detection） (#7097) (ca3299e) cascader:keydown事件取消不必要的脏值检测 (#7060) (9a37718) date-picker:点击date-range-popup取消不必要的脏值检测 (#7096) (8f8c71b) date-picker:修复内存泄漏问题 (#7113) (fe907...

2021-12-20

704

资源下载

更多资源

Spring

Spring框架（Spring Framework）是由Rod Johnson于2002年提出的开源Java企业级应用框架，旨在通过使用JavaBean替代传统EJB实现方式降低企业级编程开发的复杂性。该框架基于简单性、可测试性和松耦合性设计理念，提供核心容器、应用上下文、数据访问集成等模块，支持整合Hibernate、Struts等第三方框架，其适用范围不仅限于服务器端开发，绝大多数Java应用均可从中受益。

Rocky Linux

Rocky Linux（中文名：洛基）是由Gregory Kurtzer于2020年12月发起的企业级Linux发行版，作为CentOS稳定版停止维护后与RHEL（Red Hat Enterprise Linux）完全兼容的开源替代方案，由社区拥有并管理，支持x86_64、aarch64等架构。其通过重新编译RHEL源代码提供长期稳定性，采用模块化包装和SELinux安全架构，默认包含GNOME桌面环境及XFS文件系统，支持十年生命周期更新。

Sublime Text

Sublime Text具有漂亮的用户界面和强大的功能，例如代码缩略图，Python的插件，代码段等。还可自定义键绑定，菜单和工具栏。Sublime Text 的主要功能包括：拼写检查，书签，完整的 Python API ， Goto 功能，即时项目切换，多选择，多窗口等等。Sublime Text 是一个跨平台的编辑器，同时支持Windows、Linux、Mac OS X等操作系统。

WebStorm

WebStorm 是jetbrains公司旗下一款JavaScript 开发工具。目前已经被广大中国JS开发者誉为“Web前端开发神器”、“最强大的HTML5编辑器”、“最智能的JavaScript IDE”等。与IntelliJ IDEA同源，继承了IntelliJ IDEA强大的JS部分的功能。