Apache Spark Delta Lake 删除使用及实现原理代码解析
Apache Spark Delta Lake 删除使用及实现原理代码解析
Delta Lake 的 Delete 功能是由 0.3.0 版本引入的。在介绍 Apache Spark Delta Lake 实现逻辑之前,我们先来看看如何使用 delete 这个功能。
Delta Lake 删除使用
Delta Lake 的官方文档为我们提供如何使用 Delete 的几个例子,参见这里,如下:
import io.delta.tables._
val iteblogDeltaTable = DeltaTable.forPath(spark, path)
// 删除 id 小于 4 的数据
iteblogDeltaTable.delete("id <= '4'")
import org.apache.spark.sql.fu