Apache Arrow 5.0.0 发布
Apache Arrow 是一个列式内存分析层,旨在加速大数据的分析。它包含了一套平面和分层数据的典型内存表示,以及用于结构化数据的多种语言绑定。目前支持的语言包括 C、C++、C#、Go、Java、JavaScript、Julia、MATLAB、Python、R、Ruby 和 Rust。 Apache Arrow 5.0.0 正式发布,更新内容如下: 新功能和改进 ARROW-2665- [Python/C++]增加 index() 方法来查找 Python 标量的第一次出现; ARROW-3014- [C++] ORC 文件格式的最小写入器适配器; ARROW-3316- [R] 从 R data.frame 到 Arrow table / record batch 的多线程转换; ARROW-5385- [Go] 实现 EXTENSION 数据类型; ARROW-5640- [Go] 实现 Map 数组 ARROW-6513- [CI] conda 环境文件 arrow/ci/conda_env_*.yml 的扩展名应该是.txt。 ARROW-7001- [C++] 开发线程 ...





