《循序渐进学Spark》一2.2　Spark程序模型-低调大师

《循序渐进学Spark》一2.2　Spark程序模型

2017-05-01 678

本节书摘来自华章出版社《循序渐进学Spark》一书中的第2章，第2.2节，作者小象学院　杨　磊，更多章节内容可以访问云栖社区“华章计算机”公众号查看。

2.2　Spark程序模型

下面给出一个经典的统计日志中ERROR的例子，以便读者直观理解Spark程序模型。

1）SparkContext中的textFile函数从存储系统（如HDFS）中读取日志文件，生成file变量。

scala> var file = sc.textFile("hdfs：//...")

2）统计日志文件中，所有含ERROR的行。

scala> var errors = file.filer(line=>line.contains("ERROR"))

3）返回包含ERROR的行数。

errors.count()

RDD的操作与Scala集合非常类似，这是Sp

微信关注我们

原文链接：https://yq.aliyun.com/articles/87503

转载内容版权归作者及来源网站所有！

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。

《Hive编程指南》一1.1　Hadoop和MapReduce综述

本节书摘来异步社区《Hive编程指南》一书中的第1章，第1.1节，作者：【美】Edward Capriolo , Dean Wampler , Jason Rutherglen 译者：曹坤，更多章节内容可以访问云栖社区“异步社区”公众号查看。 1.1　Hadoop和MapReduce综述如果用户已经熟悉Hadoop和MapReduce计算模型的话，那么可以跳过本节。虽然用户无需精通MapReduce就可以使用Hive，但是理解MapReduce的基本原理将帮有助于用户了解Hive在底层是如何运作的，以及了解如何才能更高效地使用Hive。我们在这里提供了一个关于Hadoop和MapReduce的简要描述。更多细节，请参考Tom White (O’Reilly)所著的《Hadoop权威指南》一书。 MapReduceMapReduce是一种计算模型，该模型可将大型数据处理任务分解成很多单个的、可以在服务器集群中并行执行的任务。这些任务的计算结果可以合并在一起来计算最终的结果。 MapReduce编程模型是由谷歌(Google)开发的。Google通过一篇很有影响力的论文对这个计算模...

2017-05-01

701

http://esper.codehaus.org/tutorials/tutorial/tutorial.html http://esper.codehaus.org/esper-4.6.0/doc/reference/en-US/html/index.html http://www.slideshare.net/hemapani/siddhi-a-second-look-at-complex-event-processing-implementations Esper Reference Version 4.6.0 1.1. Introduction to CEP and event stream analysis The Esper engine has been developed to address the requirements of applications that analyze and react to events. Some typical examples of applications are: •Business process management ...

2017-05-01

816

资源下载

更多资源

Nacos

Nacos /nɑ:kəʊs/ 是 Dynamic Naming and Configuration Service 的首字母简称，一个易于构建 AI Agent 应用的动态服务发现、配置管理和AI智能体管理平台。Nacos 致力于帮助您发现、配置和管理微服务及AI智能体应用。Nacos 提供了一组简单易用的特性集，帮助您快速实现动态服务发现、服务配置、服务元数据、流量管理。Nacos 帮助您更敏捷和容易地构建、交付和管理微服务平台。

Spring

Spring框架（Spring Framework）是由Rod Johnson于2002年提出的开源Java企业级应用框架，旨在通过使用JavaBean替代传统EJB实现方式降低企业级编程开发的复杂性。该框架基于简单性、可测试性和松耦合性设计理念，提供核心容器、应用上下文、数据访问集成等模块，支持整合Hibernate、Struts等第三方框架，其适用范围不仅限于服务器端开发，绝大多数Java应用均可从中受益。

Sublime Text

Sublime Text具有漂亮的用户界面和强大的功能，例如代码缩略图，Python的插件，代码段等。还可自定义键绑定，菜单和工具栏。Sublime Text 的主要功能包括：拼写检查，书签，完整的 Python API ， Goto 功能，即时项目切换，多选择，多窗口等等。Sublime Text 是一个跨平台的编辑器，同时支持Windows、Linux、Mac OS X等操作系统。

WebStorm

WebStorm 是jetbrains公司旗下一款JavaScript 开发工具。目前已经被广大中国JS开发者誉为“Web前端开发神器”、“最强大的HTML5编辑器”、“最智能的JavaScript IDE”等。与IntelliJ IDEA同源，继承了IntelliJ IDEA强大的JS部分的功能。