Apache Spark机器学习.1.1 Spark概述和技术优势
摘要 Spark机器学习简介 本章从机器学习和数据分析视角介绍Apache Spark,并讨论Spark中的机器学习计算处理技术。本章首先概括介绍Apache Spark,通过与MapReduce等计算平台进行比较,展示Spark在数据分析中的技术优势和特点。接着,讨论如下五个方面的内容: 机器学习算法与程序库 Spark RDD和DataFrame 机器学习框架 Spark pipeline技术 Spark notebook技术 以上是数据科学家或机器学习专业人员必须掌握的五项最重要的技术内容,以便于充分运用Spark处理计算优势。同时,本章将涵盖以下六个主题: Spark概述和技术优势 机器学习算法和Spark机器学习库 Spark RDD和Dataframe 机器学习框架、RM4E和Spark计算 机器学习工作流和Spark pipeline技术 Sp

