Apache Doris 3.0.4 版本正式发布
亲爱的社区小伙伴们,Apache Doris 3.0.4 版本已于 2025 年 02 月 28 日正式发布。 该版本持续在存算分离、湖仓一体、异步物化视图等方面进行改进提升与问题修复,进一步加强系统的性能和稳定性,欢迎大家下载体验。
- 官网下载:https://doris.apache.org/download
- GitHub下载:https://github.com/apache/doris/releases/tag/3.0.4-rc02
行为变更
-
在 Audit Log 中,
drop table
和drop database
语句保持force
标志。 #43227 -
导出数据至 Parquet/ORC 格式时,
bitmap
、quantile_state
和hll
类型将以 Binary 格式导出。同时新增支持导出jsonb
和variant
类型,导出格式为string
。 #44041-
更多内容,参考文档:Export Overview - Apache Doris
-
-
将 Hudi JNI Scanner 从 Spark API 替换为 Hadoop API,以增强兼容性。用户可以通过设置会话变量
set hudi_jni_scanner=spark/hadoop
进行切换。#44267 -
禁止在 Colocate 表中使用
auto bucket
。 #44396 -
为 Catalog 增加 Paimon 缓存,不再进行实时数据查询。 #44911
-
增大
max_broker_concurrency
的默认值,以提升 Broker Load 在大规模数据导入时的性能。 #44929 -
将 Auto Partition 分区的
storage medium
默认值修改为当前表的storage medium
属性值,而非系统默认值。 #45955 -
禁止在修改 Key 列的 Schema Change 执行期间进行列更新。 #46347
-
对于包含自增列的 Key 列表,支持在列更新时不提供自增列。 #44528
-
FE ID 生成器策略切换为与物理时间相关的策略,ID 不再从 10000 开始。 #44790
-
在存算分离模式下,Compaction 产生的 stale rowset 默认回收延迟时间减小至 1800 秒,以减少回收间隔。某些极端场景下可能会导致超大查询失败,如遇问题可按需调整。 #45460
-
在存算分离模式下禁用
show cache hotspot
语句,需直接访问系统表。 #47332 -
禁止删除系统创建的
admin
用户。 #44751
优化改进
存储
-
优化 Routine Load 因
max_match_interval
设置过小导致任务频繁超时的问题。 #46292 -
提升 Broker Load 在导入多个压缩文件时的性能。 #43975
-
增大
webserver_num_workers
的默认值以提升 Stream Load 性能。 #46593 -
优化 Routine Load 导入任务在 BE 节点扩容时负载不均衡的问题。 #44798
-
优化 Routine Load 线程池使用,防止 Routine Load 超时失败影响查询。 #45039
存算分离
-
优化 File Cache,增加提前淘汰策略,减小持锁时间,提升查询性能。 #47473, #45678, #47472
-
优化 File Cache 初始化检查以及队列转换,提升稳定性。 #44004, #44429, #45057, #47229
-
优化 HDFS 数据回收速度。 #46393
-
优化超高频导入时 FE 获取计算组可能存在的性能问题。 #47203
Lakehouse
-
支持读取 Hive Json 格式的表数据。 #43469
-
更多内容,参考文档:Text/CSV/JSON - Apache Doris
-
-
支持会话变量
enable_text_validate_utf8
,可忽略 CSV 格式中的 UTF-8 编码检测。 #45537-
更多内容,参考文档:Text/CSV/JSON - Apache Doris
-
-
将 Hudi 版本更新至 0.15,并优化 Hudi 表的查询规划性能。
-
优化 MaxCompute 分区表的读取性能。 #45148
-
优化在高过滤率情况下,Parquet 文件延迟物化的性能。 #46183
-
支持 Parquet 复杂类型的延迟物化。 #44098
-
优化 ORC 类型的谓词下推逻辑,支持更多谓词条件用于索引过滤。 #43255
异步物化视图
-
支持更多场景下的聚合上卷改写。 #44412
查询优化器
-
优化分区裁剪性能。 #46261
-
增加利用数据特征消除
group by
key 的规则。 #43391 -
根据目标表的数据量自适应调整 Runtime Filter 的等待时间。 #42640
-
优化 Limit 下压聚合,以适应更多场景。 #44042
其他
-
show tables
显示的表名大小写现在与 MySQL 行为一致。 #46030 -
show index
支持任意目标表类型。 #45861 -
information_schema.columns
支持显示默认值。 #44849 -
information_schema.views
支持显示视图定义。 #45857 -
支持 MySQL 协议的
COM_RESET_CONNECTION
命令。 #44747
缺陷修复
存储
-
修复聚合表模型导入过程中可能出现的内存错误。 #46997
-
修复存算分离模式下 FE 主节点重启时导致 Routine Load offset 丢失的问题。 #46566
-
修复存算模式下 FE Observer 节点在批量导入场景中的内存泄漏问题。 #47244
-
修复 Full Compaction 进行 Order Data Compaction 导致 Cumulative Point 回退的问题。 #44359
-
修复 Delete 操作可能导致 Tablet Compaction 短暂无法调度的问题。 #43466
-
修复多计算集群时,Schema Change 后 Tablet 状态不正确的问题。 #45821
-
修复在有
sequence_type
的主键表上进行 Column Rename Schema Change 时可能报 NPE 错误的问题。 #46906 -
数据正确性:修复主键表在部分列更新导入包含 DELETE SIGN 列时的正确性问题。 #46194
-
修复主键表 Publish 任务持续卡住时,FE 可能存在内存泄漏的问题。 #44846
存算分离
-
修复数据上传至 5MB 边界值时可能导致上传失败的问题。 #47333
-
修复 Storage Vault 若干
alter
相关操作,增加更多参数检查,提升鲁棒性。 #45155, #45156, #46625, #47078, #45685, #46779 -
修复因 Storage Vault 配置不当导致数据无法回收或回收缓慢的问题。 #46798, #47536, #47475, #47324, #45072
-
修复回收过程中可能卡住导致数据无法及时回收的问题。 #45760
-
修复存算分离模式下 Decommission BE 时,Group Commit WAL 未回放完成的问题。 #47187
-
修复超过 2GB 的 Tablet Meta 导致 MS 不可用的问题。 #44780
-
修复存算分离主键表在高频实时导入下,可能因 Delete Bitmap 过大导致 Base Compaction 持续失败的问题。 #46969
-
修改 Schema Change 在存算分离主键表上的一些错误重试逻辑,提高 Schema Change 的健壮性。 #46748
Lakehouse
Hive
-
修复无法查询 Spark 创建的 Hive 视图的问题。 #43553
-
修复无法正确读取某些 Hive Transaction 表的问题。 #45753
-
修复 Hive 表分区存在特殊字符时,无法进行正确分区裁剪的问题。 #42906
Iceberg
-
修复在 Kerberos 认证环境下,无法创建 Iceberg 表的问题。 #43445
-
修复某些情况下,Iceberg 表存在 dangling delete 情况下,
count*
查询不准确的问题。 #44039 -
修复某些情况下,Iceberg 表列名不匹配导致查询错误的问题。 #44470
-
修复某些情况下,Iceberg 表分区被修改后无法读取的问题。 #45367
Paimon
-
修复 Paimon Catalog 无法访问阿里云 OSS-HDFS 的问题。 #42585
Hudi
-
修复某些情况下,Hudi 表分区裁剪失效的问题。 #44669
JDBC
-
修复某些情况下,开启表名大小写不敏感功能后,使用 JDBC Catalog 无法获取表的问题。
MaxCompute
-
修复某些情况下,MaxCompute 表分区裁剪失效的问题。 #44508
其他
-
修复某些情况下,Export 任务导致 FE 内存泄漏的问题。 #44019
-
修复某些情况下,无法使用 HTTPS 协议访问 S3 对象存储的问题。 #44242
-
修复某些情况下,Kerberos 认证票据无法自动刷新的问题。 #44916
-
修复某些情况下,读取 Hadoop Block 压缩格式文件出错的问题。 #45289
-
查询 ORC 格式的数据时,不再下推 CHAR 类型的谓词,以避免可能的结果错误。 #45484
异步物化视图
查询优化器
-
修复部分场景下 Limit 下压聚合算子可能导致错误结果的问题。 #45369
查询执行
-
修复正则表达式和
like
函数在特殊字符时结果不正确的问题。 #44547 -
修复 SQL Cache 在切换 DB 时结果可能不正确的问题。 #44782
-
修复当 HashJoin 的 Hash 表超过 4G 时,部分情况下结果错误的问题。 #46461
-
修复
convert_to
函数在中文字符时溢出的问题。 #46405 -
修复
group by
带 Limit 时,在极端情况下结果可能出错的问题。 #47844 -
修复访问某些系统表结果可能不正确的问题。 #47498
-
修复
percentile
函数可能导致系统崩溃的问题。 #47068 -
修复单表查询带 Limit 时性能退化的问题。 #46090
-
修复
StDistanceSphere
和StAngleSphere
函数导致系统崩溃的问题。 #45508 -
修复
map_agg
结果错误的问题。 #40454
半结构化数据管理
BloomFilter Index
Inverted Index
-
修复倒排索引构建过程中偶发崩溃的问题。 #43246
-
修复倒排索引合并时,出现次数为 0 的词占用空间的问题。 #43113
-
避免 Index Size 统计出现超大异常值。 #46549
-
修复 VARIANT 类型字段的倒排索引异常。 #43375
-
优化倒排索引的本地缓存局部性,提高缓存命中率。 #46518
-
在查询 Profile 中增加倒排索引读远程存储的指标
NumInvertedIndexRemoteIOTotal
。 #45675, #44863
其他
-
修复
ipv6_cidr_to_range
函数在特殊 NULL 数据时崩溃的问题。 #44700
权限

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。
持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。
转载内容版权归作者及来源网站所有,本站原创内容转载请注明来源。
- 上一篇
DBeaver 25.0 发布
DBeaver 是一个免费开源的通用数据库工具,适用于开发人员和数据库管理员。DBeaver 25.0 现已发布,更新内容如下: Data Editor: 添加了启用空间视图时检查空间列可见性的建议 数据单元搜索算法已修复(查找/替换) SQL Editor: 当schema selector 不适用于当前连接时,它将被隐藏 @include 命令执行已修复 修复了脚本数据库更改时刷新事务模式的问题 改进了 SQL 控制台中读取数据的性能 将结果集缩放的默认快捷键更改为 Alt+0 和 Alt+9(以避免与 European layouts 冲突) Proposal sorting in code completion 得到改进:连接始终位于顶部 Joins auto-completion 功能得到改进 AI 助手:修复了在扩展中禁用 AI 时出现过多 AI 请求的问题 Diagrams: 表格注释和fully qualified names 的可见性已修复 “ER Diagram”选项卡重命名为“Diagram” Metadata Editor:列和其他对象的重新排序已修复 Navi...
- 下一篇
三头六臂显神通:Warm-Flow 引擎实现多维度灵活配置
三头六臂显神通:Warm-Flow引擎实现多维度灵活配置 主要更新内容 设计器支持节点扩展属性设置 流程图扩展,新增接口,方便追加文字 流程状态支持颜色支持自定义 详细更新日志 升级指南 [feat] 设计器支持节点扩展属性设置 [feat] 流程图扩展,新增接口,方便追加文字 [feat] 流程状态支持颜色支持自定义 [update] 节点表版本号字段标识下个版本删除 [update] Jackson反序列化时忽略未知字段 [update] 删除部分代码,调整注释 [update] 修改当票签和会签节点时,注意事项描述 [fix] 规范solon,api注解 防止某些情况获取不到方法参数名 [fix] 删除流程实例的时候,办理用户不存在,导致删除失败 [fix] #IBP397:修复当设计流程,开始节点出现再负坐标时,文字名称未显示 [fix] #IBP3LK:修复开启流程,流程图第一个节点不是待办颜色 [fix] 网关节点编辑文字报错处理 [remove] 移除流程定义xml导入导出方式 [remove] 移除多余的skip_Any_Node字段 [style] 常量改成大写和下划...
相关文章
文章评论
共有0条评论来说两句吧...
文章二维码
点击排行
推荐阅读
最新文章
- Linux系统CentOS6、CentOS7手动修改IP地址
- CentOS7设置SWAP分区,小内存服务器的救世主
- Docker快速安装Oracle11G,搭建oracle11g学习环境
- CentOS8安装MyCat,轻松搞定数据库的读写分离、垂直分库、水平分库
- SpringBoot2整合MyBatis,连接MySql数据库做增删改查操作
- Springboot2将连接池hikari替换为druid,体验最强大的数据库连接池
- SpringBoot2全家桶,快速入门学习开发网站教程
- CentOS8编译安装MySQL8.0.19
- CentOS8,CentOS7,CentOS6编译安装Redis5.0.7
- CentOS7,CentOS8安装Elasticsearch6.8.6