《Storm分布式实时计算模式》——2.3　在Linux上安装Storm-低调大师

《Storm分布式实时计算模式》——2.3　在Linux上安装Storm

2017-07-02 575

本节书摘来自华章计算机《Storm分布式实时计算模式》一书中的第2章，第2.3节,作者：（美）P. Taylor Goetz　Brian O’Neill 更多章节内容可以访问云栖社区“华章计算机”公众号查看。

2.3　在Linux上安装Storm

Storm是设计运行在Unix兼容的操作系统上。但在0.9.1版本，它也支持在Windows机器上部署。
为了简化部署，我们使用Ubuntu 12.04LTS的发行版作为安装服务器。将会使用服务器版本，默认不包括图形界面接口，因为我们用不到。。在实体机和虚拟机上安装ubuntu都是非常方便的。出于学习和开发的目的，你会发现在虚拟机里进行部署更加方便，尤其是手头没有那么多实体机的情况。
OSX、Linux、Windows都有着对应的虚拟机软件。我们建议从下面集中软件中选择一个：

VMWare（OSX

微信关注我们

原文链接：https://yq.aliyun.com/articles/118255

转载内容版权归作者及来源网站所有！

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。

共筑Spark大数据引擎的七大工具

Spark正在数据处理领域卷起一场风暴。让我们通过本篇文章，看看为Spark的大数据平台起到推波助澜的几个重要工具。 Spark生态系统众生相 Apache Spark不仅仅让大数据处理起来更快，还让大数据处理起来更简单、功能更强大、更方便。Spark并非只是一项技术，它结合了诸多部分，新的功能和性能改进不断添加进来，每个部分都在不断完善之中。本文介绍了Spark生态系统的每个主要部分：每个部分的功能，为什么很重要，是如何发展的，在哪方面不尽如人意，以及可能会往哪个方向发展。 Spark Core Spark的核心是恰如其名的Spark Core。除了协调和调度作业外，Spark Core还为Spark中的数据处理提供了基本的抽象机制，名为弹性分布式数据集(RDD)。 RDD对数据执行两个动作：转换和操作。前者转换数据，并将它们作为刚创新的RDD来提供;后者根据现有的RDD(比如对象数量)来计算结果。 Spark的速度很快，原因是转换和操作都保存在内存中。操作慢腾腾地评估，这意味着只有需要相关的数据时，才执行操作;然而，很难搞清楚什么在缓慢运行。 Spark的速度在不断提高。Java...

2017-07-02

573

令人惊讶的是，Hadoop在短短一年的时间里被重新定义。让我们看看这个火爆生态圈的所有主要部分，以及它们各自具有的意义。对于Hadoop你需要了解的最重要的事情就是，它不再是原来的Hadoop。这边厢，Cloudera有时换掉HDFS改用Kudu，同时宣布Spark是其圈子的核心(因而一概取代发现的MapReduce);那边厢，Hortonworks加入了Spark阵营。在Cloudera和Hortonworks之间，“Hadoop”集群中唯一可以确信的项目就是 YARN。但是Databricks(又叫Spark人)偏爱Mesos而不是YARN;顺便说一句，Spark不需要HDFS。不过，分布式文件系统依然有用。对Cloudera的Impala来说，商业智能是一种理想的使用场合;而分布式列式存储系统Kudu针对商业智能进行了优化。Spark很适合处理许多任务，但有时候你需要像Impala这样的大规模并行处理(MPP)解决方案来达到目的，而Hive仍是一种有用的文件到表管理系统。即使你因为专注于Spark的内存中实时分析技术而没有使用Hadoop，到头来仍可能到处使用Hadoop...

2017-07-02

568

资源下载

更多资源

腾讯云软件源

为解决软件依赖安装时官方源访问速度慢的问题，腾讯云为一些软件搭建了缓存服务。您可以通过使用腾讯云软件源站来提升依赖包的安装速度。为了方便用户自由搭建服务架构，目前腾讯云软件源站支持公网访问和内网访问。

Rocky Linux

Rocky Linux（中文名：洛基）是由Gregory Kurtzer于2020年12月发起的企业级Linux发行版，作为CentOS稳定版停止维护后与RHEL（Red Hat Enterprise Linux）完全兼容的开源替代方案，由社区拥有并管理，支持x86_64、aarch64等架构。其通过重新编译RHEL源代码提供长期稳定性，采用模块化包装和SELinux安全架构，默认包含GNOME桌面环境及XFS文件系统，支持十年生命周期更新。

Sublime Text

Sublime Text具有漂亮的用户界面和强大的功能，例如代码缩略图，Python的插件，代码段等。还可自定义键绑定，菜单和工具栏。Sublime Text 的主要功能包括：拼写检查，书签，完整的 Python API ， Goto 功能，即时项目切换，多选择，多窗口等等。Sublime Text 是一个跨平台的编辑器，同时支持Windows、Linux、Mac OS X等操作系统。

WebStorm

WebStorm 是jetbrains公司旗下一款JavaScript 开发工具。目前已经被广大中国JS开发者誉为“Web前端开发神器”、“最强大的HTML5编辑器”、“最智能的JavaScript IDE”等。与IntelliJ IDEA同源，继承了IntelliJ IDEA强大的JS部分的功能。