您现在的位置是:首页 > 文章详情

Apache Impala 4.0 发布,大规模并行处理 SQL 查询引擎

日期:2021-07-18点击:1600

Apache Impala 是一个开源的大规模并行处理(MPP)SQL 查询引擎,用于存储在运行 Apache Hadoop 的计算机集群中的数据。

Apache Impala 4.0 正式发布,更新内容如下:

重大变化:

  • 移除对 Hive 2.x 的支持;
  • 移除对 Impala-lzo 的支持
    • Impala-lzo 提供了允许 Impala 读取 LZO 压缩表的代码。鉴于 LZO 的低采用率和其他可用的压缩选项,Impala 删除了 Impala-lzo 支持及其使用的低级别接口;
  • 移除对 Sentry 的支持
    • 从 4.0 开始,Impala 将只支持授权中的 Ranger;
  • 为 x86_64 设置最低 CPU 要求为 AVX
    • 在 4.0 之前,最低 CPU 要求是 SSSE3。现在我们把它提升到 AVX。对于只支持 AVX 而不支持 AVX2 的机器,请使用 --enable_legacy_avx_support 标志来启动 Impala;
  • 删除了对无数据时间戳的支持;
  • 增加对使用 || 的字符串连接操作的支持
    • 此前,"||" 意味着逻辑 OR 表达式的 "OR"。现在,如果左边操作数的类型是 STRING,"||" 意味着对字符串连接的 "concat";
  • 默认不允许 HAVING 子句中的序数;

新功能:

  • 在所有运算符中支持多线程(MT_DOP);
  • 更密集的(聚合的)运行时配置文件,即 profile-v2;
  • 支持所有 TPC-DS 99 查询,无需手动重写;
  • 透明查询重试;
  • 支持按 Z-Order 排序;
  • 支持 Async Codegen;
  • 支持对 Hive full-ACID ORC 表的读取;
  • 与 Apache DataSketches 的内置函数;
  • Iceberg 支持;
  • 使用 docker-compose 的 Impala 快速启动集群;
  • 支持 aarch64 (ARM)
  • ……

更多详情可查看:https://impala.apache.org/docs/changelog-4.0.html

原文链接:https://www.oschina.net/news/151035/apache-impala-4-0-released
关注公众号

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。

持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。

转载内容版权归作者及来源网站所有,本站原创内容转载请注明来源。

文章评论

共有0条评论来说两句吧...

文章二维码

扫描即可查看该文章

点击排行

推荐阅读

最新文章