【Spark Summit East 2017】EasyMapReduce:利用Spark与Docker以MapReduce方式赋能大规模科...

更多精彩内容参见云栖社区大数据频道https://yq.aliyun.com/big-data;此外,通过Maxcompute及其配套产品,低廉的大数据分析仅需几步,详情访问https://www.aliyun.com/product/odps


本讲义出自Marco Cappucini在Spark Summit East 2017上的演讲,主要介绍了如何通过借助Spark和Docker在分布式数据集上使串行软件能够并行运行,瑞典的Uppsala大学开发了基于Spark的能够以MapReduce方式运行Docker容器的实用程序EasyMapReduce,分享了面对处理大型分布式数据集的挑战,EasyMapReduce是如何帮助实现科学研究的。


3605343545beca061c0f404a4af150ae4840a099

be3199a17b672efebdfee45a8cb2fa890fd29dd8

5175b014f7dc6c10cd8a3c3099eb1eb956a7fb6b

da6ba9ca2a1b32e049b3a787425f6d0064b9a30b

8b7a1297105de90a5c5994665cc83cca9c1d850e

f7e4f6e92d345ac0d5d0147293c873fd467d2113

69af4cf4b019ea25ce4304b0ffabb8804ab4652c

cc73d00aa0e849e85782be5ef655b2e6d617eed0

96575b94df5ba37c61af90c9484af35072180765

a45a3aaa0572f4167e3c6b43b449534146b51bc1

bd614777b69089e743bbc1603d50a0a9eac9e2eb

5746f5f02662fbedf4e4aa16fb13e853b6d2d84a

34cd3036b502e1d071652d8de0a3cb65203f1624

9bbee4438781f4907d97126afa04f4d2cd9db005

866c7f64ebfdfd996551ebaaa9611d76f92b859c

43bd783643bc4f356f363d30b58ef01b5d3dec18

cd95d6b2ebb0dd81d64e35b1d6738d5f7881b2af

af384cf1fe01984791bf027cfb4024be35e3362e

51f13b919d47082b6894192b8173ae0ab614c444

9cbc69a6f362adbc77ba45e5e95b3f36d3525644

abb1ae5a1adba2471a8252addd533b39364f4d47

d27ad33c525cc13eedb4835dd621778c46104c33

826ed410a1a264fcdeb23ff69bdb649b933ae6a0

优秀的个人博客,低调大师

微信关注我们

原文链接:https://yq.aliyun.com/articles/70387

转载内容版权归作者及来源网站所有!

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。

相关文章

发表评论

资源下载

更多资源
Oracle Database,又名Oracle RDBMS

Oracle Database,又名Oracle RDBMS

Oracle Database,又名Oracle RDBMS,或简称Oracle。是甲骨文公司的一款关系数据库管理系统。它是在数据库领域一直处于领先地位的产品。可以说Oracle数据库系统是目前世界上流行的关系数据库管理系统,系统可移植性好、使用方便、功能强,适用于各类大、中、小、微机环境。它是一种高效率、可靠性好的、适应高吞吐量的数据库方案。

Apache Tomcat7、8、9(Java Web服务器)

Apache Tomcat7、8、9(Java Web服务器)

Tomcat是Apache 软件基金会(Apache Software Foundation)的Jakarta 项目中的一个核心项目,由Apache、Sun 和其他一些公司及个人共同开发而成。因为Tomcat 技术先进、性能稳定,而且免费,因而深受Java 爱好者的喜爱并得到了部分软件开发商的认可,成为目前比较流行的Web 应用服务器。

Eclipse(集成开发环境)

Eclipse(集成开发环境)

Eclipse 是一个开放源代码的、基于Java的可扩展开发平台。就其本身而言,它只是一个框架和一组服务,用于通过插件组件构建开发环境。幸运的是,Eclipse 附带了一个标准的插件集,包括Java开发工具(Java Development Kit,JDK)。

Java Development Kit(Java开发工具)

Java Development Kit(Java开发工具)

JDK是 Java 语言的软件开发工具包,主要用于移动设备、嵌入式设备上的java应用程序。JDK是整个java开发的核心,它包含了JAVA的运行环境(JVM+Java系统类库)和JAVA工具。