Spark Release 2.0.0发版概序
Spark2.0在2016年7月26日发布,因为工作中经常用到,所以对它关注比较多,正好今天”提前”下班,所以抽空翻译一下spark2.0发版概述,简单的介绍一下spark2.0的新特性和新变化。好吧,现在就让村长带领大家一起走进spark2.0的神秘殿堂。同时也希望更多的人参入进来,知识因为共享才变的有意义和价值。 译者注:因为由于时间原因,导致翻译不及时,信息有一定的滞后,在此村长深表歉意。同时也希望更多优秀人才参入进来,让最新最优秀的文章第一时间与有梦想的人分享,一起进步,共同成长。 Spark 2.0.0是第一个在2.x线上发行的版本. 主要的更新是在API的可用性,SQL2003的支持,性能的提升,结构化流,R UDF的支持还用可操作性的提升. 另外, 这个发行版本包括超过2500个补丁来只300个贡献者. 可以通过downloads来下载spark2.0. 你也可以访问detailed changes来了解细节的改变. 我们向你展示每个模块的细节变化. API 稳定性 核心 和 Spark SQL 编程 APIs SQL 新特性 性能和执行时间 MLlib 新特性 速度/扩...