冷查第一,再登榜首!Apache Doris 3.1 全面刷新 JSONBench 性能纪录
在半结构化数据分析领域,真正的挑战往往不在于“热数据”,即常被访问、已加载至缓存的数据,而在于“冷数据” ——那些规模庞大、未被缓存,且需直接从磁盘读取的 JSON 文件。
在 9 月份发布的 Apache Doris 3.1 版本中,对 Variant 引擎进行系统性优化,包括引入稀疏子列与子列模板化机制、优化列裁剪与路径索引、向量化 JSON 列裁剪引擎。这些改进推动 Doris 在冷查场景下实现性能及稳定性的全面突破。
与此同时,基于 Apache Doris 3.1 版本,在最新的 JSONBench 基准测试 中,获得在冷查性能第一的优异成绩,超越 ClickHouse、Elasticsearch 等同类数据库;热查询也获得第二的成绩;综合性能全面领先!
什么是 JSONBench
JSONBench 是最具代表性的 JSON 数据分析性能基准,由 ClickHouse 社区发起。该基准测试采用真实场景 Bluesky 数据集( 10 亿级 JSON 数据),包含多层嵌套、键值不固定的 JSON 结构,对数据库的查询优化、列存设计、解析引擎都是严苛考验,是业内公认的半结构化性能试金石。
Doris 冷查性能 Top 1
根据最新的内部测试与 JSONBench 官方公布结果, Apache Doris 3.1 冷查在 Q3–Q5 查询表现最佳,且在冷查询(无缓存)场景下性能远超其他所有对比系统,位居榜首,综合性能全面领先。
具体测试结果如下:
-
JSONBench 榜单已同步 Doris 3.1 结果
-
更多测试数据及报告详见 SelectDB 官方博客
从榜单可以清晰地看到,Doris (分数 1.57) 具备压倒性的性能优势:其速度约是 MongoDB (分数 258.21) 的 164 倍,是 PostgreSQL (分数 1687.29) 的 1074 倍。同时,以近 2 倍的优势领先于 Elasticsearch (分数 3.01),成为更具竞争力的选择。
此外,Doris 在热查询下也表现优异,仅次于榜单发起者 ClickHouse,位居第二。
性能登顶的背后
Apache Doris 在冷查询场景下的卓越性能,得益于其在以下几方面的协同:
-
高效 I/O 路径:通过 Path 级别列裁剪和延迟物化机制,冷读 JSON 子列时仅加载必需的数据,精确命中、减少数据读放大问题;
-
Variant 子列级索引:支持 JSON 路径索引(ZoneMap、BloomFilter 等稀疏索引)和谓词下推,支持文件级别裁剪,可加速过滤条件的定位;
-
强大的查询引擎:具备高效的向量化执行引擎以及并发查询机制,显著提升查询效率;
-
智能缓存策略:在冷查时,结合预读与页缓存,可提升系统整体吞吐。
同时,在 Doris 3.1 版本中,Doris 对 Variant 类型进行了系统性优化,使其在冷查场景下有更为可观的性能提升:
-
稀疏子列(Sparse Sub-Column)机制:仅列式存储高频出现的 JSON 键,减少 I/O 与元数据开销;
-
子列模板化(Schema Template)机制:固定子列类型,确保索引命中更加稳定;
-
列裁剪与路径索引优化:冷读时可精确定位目标子列,避免全字段扫描,并能实现更稳定的索引命中。
详情参考:Variant 数据类型
选择 Apache Doris
对于追求稳定、高效、低延迟的半结构化分析系统而言,Apache Doris 3.1 正在成为新的性能标杆。其核心价值体现在:
-
秒级查询响应:在日志、埋点、事件数据分析场景中,实现秒级响应,支持实时探索;
-
适用存算分离架构:即使在基于 S3、HDFS 的大规模存算分离架构中,冷查询性能依然强劲;
-
极低 I/O 成本:在相同查询规模下,Doris 的冷查 I/O 成本相比 Elasticsearch 可降低 60% 以上;
-
技术架构升级:从上文可知,Doris 在 JSON 分析场景中,性能远超 MongoDB、PostgreSQL 以及 Elasticsearch,是当下更具竞争力的半结构化数据分析的选择。
关注公众号
低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。
持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。
转载内容版权归作者及来源网站所有,本站原创内容转载请注明来源。
-
上一篇
调问更新 10.24~10.31:数据大屏能力上线+3 项功能新增+1 项功能优化+3 项 BugFix
国产开源问卷平台,调问自开源以来一直坚持前后端所有代码 100% 开源💯,保证所有功能的稳定与可改造能力👏。 🔥 安装下载地址(安装包):https://www.diaowen.net/install/docker 🔥 源码下载地址: https://gitee.com/wkeyuan/DWSurvey 🔥 官网地址:https://www.diaowen.net 调问在上周顺利发布了数据大屏能力!!!并将数据大屏能力与已有问卷系统进行了融合。 面对越来越多的企业级调研,尤其是满意度调研场景。与问卷数据结合的数据大屏能力应用场景越来越多。调问团队从零到一开发了数据大屏编辑、展现、绑定功能,并与问卷场景紧密结合,实现了将问卷数据实时同步到大屏的能力。 数据大屏已在真实的客户项目场景下应用,得到了客户的一致好评,欢迎大家体验试用,提出包括优化意见~ 此外,上周调问团队还对一些细节功能进行了补充优化,增加分页控制每一页时间控制,可以分别控制每页的最短答卷时间;增加选择题默认选项。欢迎大家体验试用~ 选择题默认选项配置: 分页单独设置最短时间: 欢迎伙伴们,进行体验、试用!!! 本周...
-
下一篇
AtomUI v5.0.1 已经发布,企业级跨平台控件库
经过两周的紧张开发,我很高兴在这里宣布 AtomUI OSS 5.0.1 版本发布,本次更新给各位开发者朋友带来了新的 Select 控件,优化了主题系统和部分重要的控件。 新特性 新增 Select 控件 实现数据表格列拖动改变列宽 全新的 List 控件实现 优化 优化 MenuFlyout 的数据源绑定生成模板 优化弹出菜单滚动条 优化 Design Token 系统 优化 Tree 控件,需要支持数据源绑定生成节点 RadioButton 新增可以定制 label 内容 Spin 加载器背景新增是否模糊开关 优化 AddOnDecoratedBox,大大降低使用难度 Bug 修复 TreeView多级树形结构中复选框父级状态异常 Combobox 点击 arrow icon 无法弹出 popup NavMenu 菜单级别的选中需要单独处理,目前的处理是错误的 默认类型的按钮背景颜色计算有问题 ThemeConfigProvider 修改全局 Token 的时候,组件没有正确计算 Drawer抽屉第二次点击弹出有问题 Multi-level drawer AtomLayer问题,...
相关文章
文章评论
共有0条评论来说两句吧...
文章二维码
点击排行
推荐阅读
最新文章
- CentOS7设置SWAP分区,小内存服务器的救世主
- CentOS6,7,8上安装Nginx,支持https2.0的开启
- CentOS7编译安装Gcc9.2.0,解决mysql等软件编译问题
- Linux系统CentOS6、CentOS7手动修改IP地址
- Dcoker安装(在线仓库),最新的服务器搭配容器使用
- Docker快速安装Oracle11G,搭建oracle11g学习环境
- Docker安装Oracle12C,快速搭建Oracle学习环境
- Docker容器配置,解决镜像无法拉取问题
- Docker使用Oracle官方镜像安装(12C,18C,19C)
- MySQL数据库中FOR UPDATE的使用



微信收款码
支付宝收款码