初窥Spark
11月26日,IBM资深软件工程师朱志辉老师,在DBA+社群DB2用户群进行了一次主题为“初窥Spark”的线上分享。小编特别整理出其中精华内容,供大家学习交流。同时,也非常感谢朱志辉老师对DBA+社群给予的大力支持。 嘉宾简介 IBM中国开发中心高级软件工程师 具有多年的数据库软件开发设计经验,擅长解决复杂的数据库应用系统问题及性能优化,拥有DB2多项认证和Oracle OCP证书 合作出版了《DB2设计,管理与性能优化艺术》《DB2性能管理与实战》 自从2007年加入IBM以来,一直从事DB2相关工具的开发与研究,现在专注Spark工具的初创研究 演讲实录 一、前言 Spark作为现在大数据领域最火热的技术,被称为将会是下个十所最重要的开源技术,其基于内存的计算速度100倍速于Hadoop MapReduce,基于磁盘的运算速度也比Hadoop MapReduce要快10倍,它易于使用,Spark提供了80个以上的高阶操作使你很容易的使用Java,Scala,Python,R等语言快速地构建分布式应用,你也可以Scala,Python和R shells进行交互式分析。作为一种...