活动回顾|Apache Cloudberry™ (Incubating) Meetup·2025 杭州站
2025 年 4 月 19 日,由酷克数据与中启乘数联合举办的 Apache Cloudberry™ (Incubating) Meetup · 杭州站在浙江省杭州市滨江区滨江会展中心成功举办。本次活动邀请了 Cloudberry PPMC 团队成员、活跃内核贡献者以及中兴 EBASE-A、阿里云 ADB-PG、网易、中启乘数等多家团队的顶尖技术专家,共同探讨 Cloudberry / Greenplum 内核前沿进展、一线生产实践和周边生态工具。活动现场气氛热烈,干货满满,为社区开发者与用户搭建了自由交流的平台,吸引线上线下近千名开发者与用户参与。
让我们一起回顾整场活动的议题干货吧!
👇🏻️私信小助手回复 0419,获取活动 PPT👇🏻️
Apache Cloudberry 简介与路线图展望
演讲嘉宾:杨瑜(Cloudberry PPMC 成员,酷克数据研发 VP,前 Greenplum 全球研发总监)
活动伊始,酷克数据研发 VP、Apache Cloudberry PPMC 成员杨瑜从项目背景、技术架构到未来规划,全面解读了 Apache Cloudberry 的发展蓝图。作为基于 Greenplum 和 PostgreSQL 的开源 MPP 数据库,Cloudberry 旨在通过开源模式将企业级优化成果回馈社区,解决闭源带来的不确定性。目前 Cloudberry 已正式进入 Apache 孵化器进行孵化,经过社区的充分讨论,已形成项目发展路线图;同时,社区正在准备推出第一个 Apache Release —— Cloudberry 2.0。未来,Cloudberry 将聚焦内核升级、执行引擎优化及社区合作,携手开发者共建开源生态。
Apache Cloudberry 向量化实践:向量数据重分布性能优化
演讲嘉宾:赵熙(Cloudberry 贡献者,内核研发工程师)
酷克数据内核研发工程师、Apache Cloudberry 贡献者赵熙聚焦向量化技术在Join+Motion数据重分布中的性能瓶颈,分享了Cloudberry从系统性能分析到优化落地的完整实践。通过Gandiva表达式优化与分组算法重构,显著降低CPU负载,512节点下耗时从2004ms降至180ms,提速11倍。结合内存布局优化与性能分析工具,有效提升向量化 Join+Motion 吞吐,为大规模查询提供高效支撑。这一分享为内核开发者提供了可落地的优化范式。
EBASE-A 实时流式入库实现机制及应用实践
演讲嘉宾:柏楠(中兴 EBASE-A 团队工程师)
中兴 EBASE-A 团队工程师柏楠介绍了 EBASE-A 的实时流式入库架构及核心技术。作为支持多写多读、湖仓一体的 OLAP 数据库,EBASE-A 依托自研向量化引擎与存算分离架构实现 PB级分析。其 APFlow 组件通过零拷贝技术将吞吐推至磁盘极限,结合性能为 Flink 两倍的 Saturn 流引擎替代 JStorm 架构,资源消耗降低 50%,入库效率提升 30%,有效支撑通信行业实时数据处理。
Data+AI 时代下的数据处理分析架构与技术演进
演讲嘉宾:印才华(阿里云资深技术专家)
阿里云 ADB-PG 技术负责人、阿里云资深技术专家印才华分享了企业在 Data + AI 背景下的数据分析架构演进,特别介绍了基于 Greenplum 构建的阿里云 ADB-PG 云数仓在高性能实时数仓、向量化,以及 In-Database AI 方面的探索洞察与行业用户融合实践。
Greenplum/Cloudberry 第三方管控平台 APCC 详解
演讲嘉宾:唐成(中启乘数科技 CTO)
中启乘数 CTO 唐成分享第三方可视化管控平台 APCC 的设计理念与实践路径。APCC 平台支持多版本、跨平台部署,提供可视化集群管理、一键扩容、慢 SQL 优化等丰富能力,旨在通过“自动化 + 图形化”的方式大幅降低 Greenplum 及 Cloudberry 运维门槛,实现高效、智能的数据库运维。
Apache SeaTunnel 架构解析与 Cloudberry 集成实践
演讲嘉宾:陈虹宇 (Apache SeaTunnel 贡献者,网易数据集成研发工程师)
最后,网易数据集成研发工程师、Apache SeaTunnel 贡献者陈虹宇详细介绍了 SeaTunnel 的核心架构及其与 Cloudberry 的集成方案。Apache SeaTunnel 是一个易用的支持海量数据同步的超高性能分布式数据集成平台;SeaTunnel 中的 Cloudberry 连接器基于标准 JDBC 构建,继承了 PostgreSQL 连接器的所有核心逻辑。通过简单命令,即可实现 Cloudberry 数据库的读写操作,无需复杂配置,使得数据流转更加轻松高效。未来,计划引入基于 gpfdist 协议和外部表机制的全新连接器,充分利用 Cloudberry 的并行计算能力,持续提升大规模数据迁移传输的性能表现。
本次 Meetup 汇聚了来自社区与企业的一线技术力量,分享内容兼具深度与实战价值,涵盖数据库内核、数据集成、运维、AI 融合等多个关键方向,为开发者与用户搭建了高质量的技术交流平台。
特别感谢中启乘数对本次活动的全程支持与协作,也感谢每一位演讲嘉宾与参会者的积极投入,感谢 Apache SeaTunnel 等众多社区合作伙伴的支持!欢迎更多开发者、用户与企业伙伴加入 Apache Cloudberry 社区,共同打造开源时代的分布式数据基础设施!

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。
持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。
转载内容版权归作者及来源网站所有,本站原创内容转载请注明来源。
- 上一篇
赋能车联网|智能地铁物联系统,让出行更顺畅
行业背景 随着城市轨道交通网络规模的不断扩大和智能化水平的持续提升,地铁物联网监控系统需要实时监控和管理数以万计的包括环控系统、火灾报警、门禁控制、电梯运行等在内的物联网关键设备。这些设备产生的海量时序数据对数据库系统的写入性能、实时分析能力和查询响应速度提出了极高要求,传统的数据库方案已无法支撑现代化智慧地铁的运营。 痛点与挑战 高并发写入性能瓶颈 物联网监控系统往往需要同时处理上万台设备产生的数据,每秒写入量达几十万测点,日均入库数据达上亿条,传统时序数据库无法支撑如此高并发的数据写入需求,导致数据延迟并带来丢失风险。 数据分析功能欠缺 轨道交通物联网监控系统需对大量的历史数据进行分析处理,传统的数据库因为缺乏专业的时序数据处理分析能力,导致用户需要额外开发复杂函数才能实现设备状态分析、趋势预测等业务需求,显著增加了开发和维护成本。 实时响应能力不足 传统数据库方案在实时告警生成和设备状态监控方面存在较大延迟,无法满足地铁运营对关键设备异常快速响应的要求,影响运营安全和效率。 解决方案 针对上述场景的特殊需求,KaiwuDB 打造了一套地铁物联网监控系统解决方案——通过其高并发写入...
- 下一篇
月暗开源 Kimi-Audio,单一框架执行多种语音任务;照片秒变可对话数字人,LemonAI 推出 Slice Live丨日报
开发者朋友们大家好: 这里是 「RTE 开发者日报」 ,每天和大家一起看新闻、聊八卦。我们的社区编辑团队会整理分享 RTE(Real-Time Engagement) 领域内「有话题的 技术 」、「有亮点的 产品 」、「有思考的 文章 」、「有态度的 观点 」、「有看点的 活动 」,但内容仅代表编辑的个人观点,欢迎大家留言、跟帖、讨论。 本期编辑:@赵怡岭、@鲍勃 01.有话题的技术 1、百度推出文心 4.5 Turbo 和深度思考模型 X1 Turbo 4 月 25 日,在面向开发者的 Create 大会重磅推出两款全新模型:文心 4.5 Turbo 和深度思考模型 X1 Turbo。 两款模型主打多模态、强推理和低成本。百度旗下新搜索智能助手文小言也宣布全面接入,免费向用户开放,即日起用户打开文小言 APP 即可使用。 文心大模型 4.5 Turbo 进一步强化了多模态能力。在多个基准测试集中,文心 4.5 Turbo 多模态能力已与 GPT-4.1 持平,甚至在部分维度优于 GPT-4o。 而文心大模型 X1 Turbo 则在 4.5 Turbo 的基础上进行了「深度思考」升级。...
相关文章
文章评论
共有0条评论来说两句吧...