Apache Arrow 6.0.0 发布
Apache Arrow 是一个列式内存分析层,旨在加速大数据的分析。它包含了一套平面和分层数据的典型内存表示,以及用于结构化数据的多种语言绑定。目前支持的语言包括 C、C++、C#、Go、Java、JavaScript、Julia、MATLAB、Python、R、Ruby 和 Rust。 Apache Arrow 6.0.0 正式发布,更新内容如下: 新功能和改进 ARROW-1565- [C++] 实现 TopK/BottomK ARROW-1568- [C++] 实现 "drop null" 内核,返回没有空值的数组 ARROW-4700- [C++] 在 arrow::json::TableReader 中添加 DecimalType 支持 ARROW-5002- [C++] 实现 Hash Aggregation 的查询执行节点 ARROW-5244- [C++] 审查实验性/不稳定的 API ARROW-6607- [Python] 从 Pandas 转换时支持集合/列表列 ARROW-6626- [Python] 在转换为 Arrow 时,将嵌套的 "集合" 值作为列表处...