Apache Arrow 4.0.1 发布,内存数据交换格式
Apache Arrow 4.0.1 现已发布。Apache Arrow 是 Apache 基金会的顶级项目之一,目的是作为一个跨平台的数据层来加快大数据分析项目的运行速度。它包含一组规范的内存中的平面和分层数据表示,以及多种语言绑定以进行结构操作。 它还提供低架构流式传输和批量消息传递,零拷贝进程间通信(IPC)和矢量化的内存分析库。 主要更新内容 [Python][C++] 在 v4.0.0 中转换 int64 的切片 ListArray 时出现段错误 [R][Packaging] 修复 r/configure 中的 pkg-config 检查 [R] open_dataset 在使用 select 时忽略提供的模式 [R][Packaging] 数据集,在 autobrew 和 CRAN Mac 版本中关闭 Parquet [Python] pyarrow.orc.write_table 签名与 pyarrow.parquet.write_table 的签名相反 [Python] 在 Flight 服务器中读取 CSV 时出现段错误 [R] LIBARROW_MINIMAL、LI...