Apache Spark机器学习.1.9 小结
1.9 小结
本章介绍了Apache Spark所有的基础知识,这也是所有想把Apache Spark应用于机器学习实际项目的从业者必须理解掌握的。我们重点探讨了Apache Spark计算,并涉及一些最重要的机器学习组件,以便把Apache Spark和机器学习关联起来,让开展机器学习项目的读者做好充分准备。
第一,我们作了Spark总体概述,还讨论了Spark优点以及面向机器学习的Spark计算模型。
第二,我们回顾了机器学习算法,Spark的MLlib库和其他机器学习库。
第三,讨论了Spark RDD的核心创新和DataFrame,以及用于R语言的Spark DataFrame API。
第四,我们回顾了一些机器学习框架,通过案例具体讨论了机器学习的RM4E框架,进一步讨论了Spark机器学习计算框架。
第五,我们讨论了机器学习的工作

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。
持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。
转载内容版权归作者及来源网站所有,本站原创内容转载请注明来源。
- 上一篇
变量可变性问题
从FP的角度, Clojure中变量是不可变的, 改变一个变量实际是创建一个新的变量 所以所有的change都需要通过参数的不断传递... 如下面的例子, => (defrecord Employee [name room]) backtype.storm.util.Employee => (def emp (Employee. "John Smith" 304)) #'backtype.storm.util/emp => (:name emp) "John Smith" => (assoc emp :room 309) #backtype.storm.util.Employee{:name "John Smith", :room 309} => (println emp) #backtype.storm.util.Employee{:name John Smith, :room 304} Clojure是一个妥协的语言, 不单纯的从FP的角度思考, 也需要从OO的角度思考, 你可以认为这是灵活的体现 所以有时候, 单纯的依赖参数的传递很麻烦...虽然很p...
- 下一篇
超越Hadoop的大数据分析之第一章介绍:为什么超越Hadoop Map-Reduce
本文翻译自《BIG DATA ANALYTICS BEYOND HADOOP》译者:吴京润 译者注:本文是本书第一章的开头,第一章其它部分由其他人翻译。 你可能是一个视频服务提供商,而你想基于网络环境动态的选择合适的内容分发网络来优化终端用户的体验。或者你是一个政府监管机构,需要为互联网页进行色情或非色情的分类以便过滤色情页面,同时还要做到高吞吐量以及实时性。或者你是一个通讯/移动服务提供商——要么你在这样的公司工作——而你担心客户流失(客户流失意味着,老用户离开而选择竞争对手,或者新用户加入竞争对手)。你一定非常想知道前一天有哪些客户在tweeter上抱怨你的服务。或者你是个零食店主,而你非常想对你的客户做购买预测,这样你就可以为你商品做更多有针对性的促销活动,并期望销售额由此带来的增长。或者你是一家医疗保险公司,当务之急是计算某位客户明年住院的概率,以便适当的修改的保费。或者你是一家金融产品公司的CTO,而公司希望拥有实时交易/预测算法,帮助确认损益表底线。或者你为一家电子制造公司工作,而你想在试运行期间预测故障、查明故障根源,以便在后来的实际运行中有效。这要归功于大数据分析创造的...
相关文章
文章评论
共有0条评论来说两句吧...
文章二维码
点击排行
推荐阅读
最新文章
- CentOS7,8上快速安装Gitea,搭建Git服务器
- MySQL8.0.19开启GTID主从同步CentOS8
- CentOS8安装MyCat,轻松搞定数据库的读写分离、垂直分库、水平分库
- Windows10,CentOS7,CentOS8安装MongoDB4.0.16
- CentOS7设置SWAP分区,小内存服务器的救世主
- CentOS7编译安装Gcc9.2.0,解决mysql等软件编译问题
- Docker快速安装Oracle11G,搭建oracle11g学习环境
- CentOS8安装Docker,最新的服务器搭配容器使用
- Windows10,CentOS7,CentOS8安装Nodejs环境
- CentOS8编译安装MySQL8.0.19