Apache Arrow 4.0.0 发布,内存数据交换格式
Apache Arrow 4.0.0 现已发布,该版本涵盖了 3 个月的开发工作,包括来自 114 个不同贡献者的 711 个已解决的问题。此外,自 3.0.0 发布以来,Yibo Cai、Ian Cook和 Jonathan Keane已被邀请为 Arrow 的 committers,Andrew Lamb 和 Jorge Leitão则加入了项目管理委员会(PMC)。 Apache Arrow 是 Apache 基金会的顶级项目之一,目的是作为一个跨平台的数据层来加快大数据分析项目的运行速度。它包含一组规范的内存中的平面和分层数据表示,以及多种语言绑定以进行结构操作。 它还提供低架构流式传输和批量消息传递,零拷贝进程间通信(IPC)和矢量化的内存分析库。 新版本的一些更新内容如下: Arrow Flight RPC notes 在 Java 中,应用程序现在可以在写入数据时启用零拷贝优化(ARROW-11066)。这有可能破坏源代码的兼容性,所以默认情况下不启用。 Arrow Flight 现在已被打包给 C#/.NET。 Linux packages notes 此前曾有由 Bi...

