《 Apache Spark机器学习.》导读
本节书摘来自华章出版社《 Apache Spark机器学习.》一书中作者[美] 刘永川(Alex Liu) 著 闫龙川 高德荃 李君婷 译 更多章节内容可以访问云栖社区“华章计算机”公众号查看。 前言 作为数据科学家和机器学习专业人员,我们的工作是建立模型进行欺诈检测、预测客户流失,或者在广泛的领域将数据转换为洞见。为此,我们有时需要处理大量的数据和复杂的计算。因此,我们一直对新的计算工具满怀期待,例如Spark,我们花费了很多时间来学习新工具。有很多可用的资料来学习这些新的工具,但这些资料大多都由计算机科学家编写,更多的是从计算角度来描述。 作为Spark用户,数据科学家和机器学习专业人员更关心新的系统如何帮助我们建立准确度更高的预测模型,如何使数据处理和编程更加简单。这是本书的写作目的,也是由数据科学家来执笔本书的主要原因。 与此同