Apache Spark机器学习3.1 Spark整体视图
摘要
基于Spark的整体视图
通过第1章,我们建立起了Spark系统,根据第2章的内容,我们完成了数据准备。现在将进入Spark系统应用的新阶段:从数据中获得洞见。
根据Gartner等机构的研究结果,许多公司仅仅是因为缺乏其商业的整体视图而损失了大量的价值。本章我们将回顾机器学习的方法和获得商业整体视图的步骤,然后讨论Spark如何简单、快速地进行相关计算,同时通过一个实例,循序渐进地展示使用Spark从数据到整体视图的开发过程。
Spark整体视图
整体视图的方法
特征准备
模型估计
模型评估
结果解释
部署
3.1 Spark整体视图
Spark能够快速处理大量的数据,易于开发复杂的计算,因此,非常适合机器学习项目,例如获得商业的整体视图。本节,我们首先介绍一个真实的商业案例,然后讨论在Spark上完成项目的准备工作。
3.1.1 例子
IFS公司销