数据湖与 LakeHouse 依然炙手可热
马进 网易数帆大数据实时计算技术专家、湖仓一体项目负责人,负责网易集团分布式数据库、数据传输平台、实时计算平台、实时数据湖等项目,长期从事中间件、大数据基础设施方面的研究和实践,目前带领团队聚焦于流批一体、湖仓一体的平台方案和技术演进,及流式湖仓服务 Arctic 项目开源。 近日,OSCHINA 和 Gitee 联合发布了《2022 中国开源开发者报告》。网易数帆大数据实时计算技术专家马进在报告中对开源 AI 领域进行了解读,以下为原文。 数据湖与 LakeHouse 依然炙手可热 2022 年,数据湖与 LakeHouse 依然是炙手可热的话题。一方面,在 Apache Iceberg、Apache Hudi、Delta 等知名开源项目的带动下,国内的一些基础软件公司也开始在数据湖开源领域积极布局,代表有网易数帆开源的湖仓管理系统 Arctic,阿里云开源的流式数仓 Flink Tablestore;另一方面,一些传统架构的开源数仓软件,以及闭源的数据分析引擎,也开始积极拥抱开放的数据湖格式,标志性事件如 Snowfake 可以对接 Delta 和 Iceberg,Doris 系的...
