Spark 10年,作者 Matei 在 Spark + AI Summit 2020 上深情回顾
作者:郑锴,花名铁杰,阿里巴巴高级技术专家,Apache Hadoop PMC,Apache Kerby 创立者。深耕分布式系统开发和开源大数据多年,目前专注于在阿里云上提供更好用更有弹性的 Hadoop/Spark 大数据平台。
端午节宅家,Spark + AI Summit 2020 在网上如火如荼。刚看了 Matei 先生的keynote,他对 Spark 10 年做了非常精彩的演讲和深情的回顾,不禁很多感想,却千头万绪。我想这次简单点,不啰嗦,直接挑个重点说吧,看下图。
这是我在 Youtube 上看的视频做的一个截图。这张 slide 无需解读,我相信大家都能看出以下几点。
第一. SQL 万物归宗,成为Spark 诸多语言 API 的核心,SparkSQL 和 Spark Core 以后就是一回事。大家可以收收心吧,做
