Apache Arrow 5.0.0 发布
Apache Arrow 是一个列式内存分析层,旨在加速大数据的分析。它包含了一套平面和分层数据的典型内存表示,以及用于结构化数据的多种语言绑定。目前支持的语言包括 C、C++、C#、Go、Java、JavaScript、Julia、MATLAB、Python、R、Ruby 和 Rust。
Apache Arrow 5.0.0 正式发布,更新内容如下:
新功能和改进
- ARROW-2665 - [Python/C++] 增加 index() 方法来查找 Python 标量的第一次出现;
- ARROW-3014 - [C++] ORC 文件格式的最小写入器适配器;
- ARROW-3316 - [R] 从 R data.frame 到 Arrow table / record batch 的多线程转换;
- ARROW-5385 - [Go] 实现 EXTENSION 数据类型;
- ARROW-5640 - [Go] 实现 Map 数组
- ARROW-6513 - [CI] conda 环境文件 arrow/ci/conda_env_*.yml 的扩展名应该是.txt。
- ARROW-7001 - [C++] 开发线程 API 以适应嵌套的并行性
- ARROW-7114 - [JS][CI] NodeJS 在 Github Actions Windows 节点上构建失败;
- ARROW-7252 - [Rust] [Parquet] 读取 UTF-8/JSON/ENUM 字段会导致大量的 vec 分配;
- ARROW-7396 - [Format] 向 IANA 注册 Apache Arrow 格式的媒体类型;
- ARROW-8421 - [Rust] [Parquet] 实现 parquet 写入器;
- ARROW-8459 - [Dev][Archery] 使用最新的 cmake-format;
- ARROW-8527 - [C++][CSV] 增加对 ReadOptions::skip_rows >= block_size 的支持;
- ARROW-8655 - [C++][Dataset][Python][R] 为已发现的数据集保存分区信息;
- ARROW-8676 - [Rust] 从 ARROW-300 创建 IPC RecordBatch 主体缓冲区压缩实现
- ARROW-9054 - [C++] 增加 ScalarAggregateOptions
- ARROW-9056 - [C++] 支持标量上的标量聚合
- ARROW-9140 - [R] Zero-copy Arrow to R where possible
- ARROW-9295 - [Archery] 在 lint 命令中支持 rust clippy
- ARROW-9299 - [Python] 在 Python ORCFile 中暴露 ORC metadata()
- ARROW-9313 - [Rust] 使用特征枚举
- ARROW-9697 - [C++][Dataset] 数据集/扫描器的 num_rows 方法;
- ARROW-10031 - [Java] 在 Archery 中支持 Java 基准测试
- ARROW-10115 - [C++] CSV 空引号字符串被视为 NULL
- ……
错误修复:
- ARROW-6189 - [Rust] [Parquet] 普通编码的布尔列块限制为 2048 个值;
- ARROW-6312 - [C++] 在 arrow.pc 包配置中声明所需的 Libs.private;
- ARROW-7948 - [Go][集成] 十进制集成失败;
- ARROW-9594 - [Python] DictionaryArray.to_numpy 不能正确地将空索引转换为空值;
- ARROW-10910 - [Python]当对传统数据集的 read_table 给出 None 时出现分段故障;
- ARROW-11146 - [CI][Python] conda-python-3.8-jpype Nightly 构建失败;
- ARROW-11161 - [Python][C++] S3Filesystem: 文件 Content-Type 设置不正确;
- ARROW-11633 - [CI][文档] 未找到 Maven 默认皮肤;
- ARROW-11780 - [C++][Python] StructArray.from_arrays() 使 Python 解释器崩溃;
- ARROW-11908 - [Rust]间歇性的 Flight 集成测试失败;
- ARROW-12007 - [C++]加载 parquet 文件时返回 "无效的 UTF8 有效载荷" 错误;
- ARROW-12055 - [R] is.na() 对 Arrow NaN 值的评估结果为 FALSE;
- ARROW-12122 - [Python] 无法通过 pip 在 M1 mac 上安装;
- ……

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。
持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。
转载内容版权归作者及来源网站所有,本站原创内容转载请注明来源。
- 上一篇
TimescaleDB 2.4.0 发布,基于 PostgreSQL 的时序数据库
TimescaleDB 2.4.0 现已发布,此版本添加了自 2.3.1 版本以来的新实验性功能。TimescaleDB 是基于 PostgreSQL 开发的一款时序数据库,以插件化的形式打包提供。 此版本中的实验性功能是: 用于在分布式 hypertable 设置中跨数据节点进行块操作的 API。这包括添加数据节点并将块移动到新数据节点以进行集群重新平衡的能力。 time_bucket_ng函数是time_bucket的较新版本。支持年、月、日、小时、分钟和秒。 此版本还包括几个错误修复;以及 TimescaleDB 2.4 不再支持 Postgres 11,需要 Postgres 12 及以上版本。 具体更新内容如下: Experimental Features #3293 添加 timescaledb_experimental 模式 #3302 将 block_new_chunks 和 allow_new_chunks API 添加到实验模式。添加基于块的 refresh_continuous_aggregate。 #3211 引入实验性的 time_bucket_ng 函数 #...
- 下一篇
红旗 Linux 桌面操作系统 v11 alpha 版(0730)更新
红旗 Linux 桌面操作系统 v11 alpha 版发布了(0730)更新。 较上一版本,此版本主要更新如下: 完善系统开始菜单体验; 修复AMD64架构LIVE环境网络源地址报错的问题; 修复AMD64架构部分环境安装失败的问题; 增加两款益智游戏2048,纸牌游戏; 增加建军94周年主题壁纸; 修复部分已知问题; 更新及下载方法: 1、已安装红旗Linux桌面操作系统v11 alpha前序版本的用户,可参考下列方法进行系统更新。 2、未安装红旗Linux桌面操作系统v11 alpha版的用户,需按下方提供的下载链接,访问红旗Linux官方社区下载版块,下载安装体验。 方式1、软件商店自定义更新 点击桌面左下角“R”图标,点击“系统”-“软件商店”-“检查更新”,根据更新提示可自定义选取需要更新的软件包或更新全部升级的软件包。 方式2、终端命令更新 更新网络源 sudo aptupdate-y 查看可更新软件 apt list --upgradable 可根据需求全部或选择性的手动安装相应更新包。 下载链接: 访问红旗 Linux 官方社区下载版块https://www....
相关文章
文章评论
共有0条评论来说两句吧...
文章二维码
点击排行
推荐阅读
最新文章
- CentOS7编译安装Gcc9.2.0,解决mysql等软件编译问题
- SpringBoot2更换Tomcat为Jetty,小型站点的福音
- SpringBoot2整合Thymeleaf,官方推荐html解决方案
- Linux系统CentOS6、CentOS7手动修改IP地址
- CentOS8安装Docker,最新的服务器搭配容器使用
- CentOS7安装Docker,走上虚拟化容器引擎之路
- Docker快速安装Oracle11G,搭建oracle11g学习环境
- Docker安装Oracle12C,快速搭建Oracle学习环境
- Docker使用Oracle官方镜像安装(12C,18C,19C)
- CentOS7,8上快速安装Gitea,搭建Git服务器