Apache Hudi 1.0.0 正式发布,开源数据湖平台
Apache Hudi 1.0.0 是 Apache Hudi 的一个重要里程碑版本。此版本包含重要的格式更改和令人兴奋的新功能。 Apache Hudi 是一个开源数据湖平台,基于高性能的开源表格式,用于跨多个云数据环境进行数据的导入、索引、存储、服务、转换和管理。 迁移指南 我们鼓励用户首先在新表上试用 1.0.0 功能。1.0 通用版本 (GA) 将支持从 0.x 版本自动升级表,同时确保在使用 1.0 读取 0.x Hudi 表时完全向后兼容,从而确保无缝迁移体验。 此版本带有向后兼容的写入功能,即1.0.0可以写入表版本8(最新)和较旧的表版本6(对应于0.14及以上)格式。完全支持从 0.x 版本自动升级表,从而最大限度地减少迁移挑战。在所有读取器都升级之前,用户仍然可以为写入器部署 1.0.0 二进制文件,并利用向后兼容的写入继续以旧格式写入表。读取器完全升级后,用户可以通过配置更改切换到最新格式。我们建议用户按照迁移指南[1]中提到的升级步骤进行操作,以确保顺利过渡。 注意: 大多数事情都由自动升级过程无缝处理,但存在一些限制。在继续迁移之前,请仔细阅读升级降级过程的限...