Twitter Storm安装配置（Ubuntu系统）单机版-低调大师

Twitter Storm安装配置（Ubuntu系统）单机版

2015-05-07 789

要使用storm首先要安装以下工具：JDK、Python、zookeeper、zeromq、jzmq、storm

（注：各个模块都是独立的，如果安装失败或者卡顿可以单独百度某个模块的安装，都是可以的。）

JDK1.7安装 参见上篇《Ubuntu下安装配置JDK1.7》http://www.cnblogs.com/stone_w/p/4469548.html

第一步，安装Python2.7.2（ubuntu）

wget http://www.python.org/ftp/python/2.7.2/Python-2.7.2.tgz
tar zxvf Python-2.7.2.tgz
cd Python-2.7.2
./configure
make
make install
vi /etc/ld.so.conf
追加/usr/local/lib/
sudo ldconfig

第二步，安装zookeeper

下载zookeeper
解压，安装：http://pan.baidu.com/s/1jGjA90M

tar -zxvf zookeeper-3.3.5.tar.gz 
cp -R zookeeper-3.3.5 /usr/local/
ln -s /usr/local/zookeeper-3.3.5/ /usr/local/zookeeper
gedit /etc/profile (设置ZOOKEEPER_HOME和ZOOKEEPER_HOME/bin) 
export ZOOKEEPER_HOME="/path/to/zookeeper"
export PATH=$PATH:$ZOOKEEPER_HOME/bin
cp /usr/local/zookeeper/conf/zoo_sample.cfg /usr/local/zookeeper/conf/zoo.cfg (用zoo_sample.cfg制作$ZOOKEEPER_HOME/conf/zoo.cfg)
mkdir /tmp/zookeeper
mkdir /var/log/zookeeper

zookeeper的单机安装已经完成了。

第三步，安装zeromq以及jzmq
jzmq的安装貌似是依赖zeromq的，所以应该先装zeromq，再装jzmq。
1）安装zeromq：

wget http://download.zeromq.org/zeromq-2.2.0.tar.gz
tar zxf zeromq-2.2.0.tar.gz 
cd zeromq-2.2.0
./configure
make
make install
sudo ldconfig (更新LD_LIBRARY_PATH)

zeromq安装完成。
注意：如有有依赖报错，需要安装：
jzmq dependencies 依赖包
sudo yum install uuid*
sudo yum install libtool
sudo yum install libuuid
sudo yum install libuuid-devel
2）安装jzmq

yum install git 
git clone git://github.com/nathanmarz/jzmq.git
cd jzmq
./autogen.sh
./configure
make
make install

然后，jzmq就装好了.
注意：在./autogen.sh这步如果报错：autogen.sh:error:could not find libtool is required to run autogen.sh，这是因为缺少了libtool，可以用#yum install libtool*来解决。

第四步，安装Storm

我使用的Storm版本是最新的稳定版0.8.2，下载，解压，修改/conf/storm.yaml配置文件：

Storm 0.8.2 下载 http://pan.baidu.com/s/1sjODKPB

unzip storm-0.8.2.zip
mv storm-0.8.2 /usr/local/
ln -s /usr/local/storm-0.8.2/ /usr/local/storm
gedit /etc/profile
export STORM_HOME=/usr/local/storm-0.8.2
export PATH=$PATH:$STORM_HOME/bin

到此为止单机版的Storm就安装完毕了。

启动Storm

/usr/local/zookeeper/bin/zkServer.sh start
cd /usr/local/storm-0.8.2
bin/storm nimbus &
bin/storm supervisor &
bin/storm ui &

如果我们没有为storm添加环境变量，那么在启动的时候，我们就需要使用绝对路径或相对路径来定位/chenny/Storm/storm-0.8.2/bin/storm这个程序。启动完成后，我们可以使用jps来查看进程状态： >>jps 在没有运行任务时，我们必须应该要看到5个进程：QuorumPeerMain、nimbus、core、Jps、supervisor。否则就需要检查是否正确地启动，如果启动之后没有过多久就停止了，我们就需要查看~/storm-0.8.2/logs下面的对应的log文件，查看引起异常的原因是什么，然后解决后再次启动。同时，我们可以在浏览器中输入http://127.0.0.1:8080来进入Storm UI的界面，可以查看Storm运行期间的相关信息。

第五步，测试一下本地模式的WordCount

网上别的资料介绍了许多方式来编译可执行的Topology程序，我们这里提供一个简单的办法，只需要使用Eclipse和相关的Jar包即可，Ubuntu或者Windows环境下均可。我们需要从github上下载下来一个供初学者学习的storm-starter，同时，我们还需要有 commons-collections-3.2.1-bin.tar.gz、twitter4j-2.2.6.zip和storm-0.8.2.zip 等软件包，如果没有的话，需要去下载。以Windows XP下的Eclipse为例。首先我们将所有需要的包解压放到桌面，打开Eclipse，新建Java Project，名字任意取，我取名叫做MyFirstStormApp，然后点击Finish。

在MyFirstStormApp上右键，选择Import，然后选择File System：

在From Directory中输入相应的路径或者点击Browse，选择路径：

我们依次展开storm-starter-master/src/jvm/storm，选中jvm文件夹，点击确定，然后勾选jvm，点击finish：

这样，我们就在左侧看到Project的结构：

拖动storm到src中，然后安装同样的方式将 storm-starter-master/storm-starter-master/multilang导入到项目中，然后我们就在左侧看到如下图所示的结构：

可以看到上面有很多红叉，此时，我们就需要导入项目所依赖的jar包，在项目上右键，选择Properties，然后Java Build Path，切换到Libraries选项夹下，点击Add External JARs：

将storm-0.8.2/lib目录下的所有jar包都加入到项目中，将

commons-collections-3.2.1.jar添加到项目中，将twitter4j-2.2.6/lib中的所有jar包加入到项目中，将storm-0.8.2/storm-0.8.2.jar加入到项目中，然后点击OK，这个时候，可以看到项目中的所有错误都消失了。接下来，我们将PrintSampleStream.java和 TwitterSampleSpout.java中的注释取消，或者将这两个文件删除

在项目上选择Export，然后选择JAR file，在下一页，我们将项目导出，勾选如下图所示：

点击finish后，如果没有错误，只有warning的话，就不用管了，否则我们需要检查错误，然后重新打包。打包后的jar包是MyFirstStormApp.jar，将它拷贝到部署有Storm的机器上（/usr/local/storm-0.8.2目录下），然后在终端中输入：

>>bin/storm jar MyFirstStormApp.jar storm.starter.WordCountTopology test2 如果没有错误，就成功提交了，在浏览器中输入http://127.0.0.1:8080，可以看到这个Topology已经在运行了，点击它的名字，可以进入Topology summary：

如果看到这些数据，就说明我们正确地完成了配置。

如果本文对你有所帮助，请打赏——1元就足够感动我：）

联系邮箱：intdb@qq.com
我的GitHub： https://github.com/vipstone

关注公众号：

作者：王磊
出处： http://vipstone.cnblogs.com/
本文版权归作者和博客园共有，欢迎转载，请标明出处。

微信关注我们

原文链接：https://yq.aliyun.com/articles/630014

转载内容版权归作者及来源网站所有！

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。

R+Hadoop大数据方案有哪些坑？

摘要: 为什么有些公司在机器学习业务方面倾向使用 R + Hadoop 方案？因为他们在不懂R和Hadoop的特征应用场景的情况下，恰好抓到了一根免费，开源的稻草。R：R的应用场景不在于无与伦比的统计学习能力，而在于结构化数据下 ... 为什么有些公司在机器学习业务方面倾向使用 R + Hadoop 方案？因为他们在不懂R和Hadoop的特征应用场景的情况下，恰好抓到了一根免费，开源的稻草。 R： R的应用场景不在于无与伦比的统计学习能力，而在于结构化数据下无与伦比的单位代码产出量。神经网络，决策树等基于结构化数据的算法一行代码搞定，预测又只是一行代码。这样，商业数据库（如包括Oracle，Netezza，Teradata，SAP HANA等）提供了R接口供统计分析人员进行高效实施。同样的，SAS和IBM SPSS也做到了一部分高效实施能力，他们没有的是R独有的庞大cran packages群。但相似的一点是，R的package群也把它的用户惯坏了，惯坏到这些人只是觉得这是一个SAS或者SPSS的免费版，而不是去通过代码学习如何做机器学习哪怕一点点核心原理。你要做的，就是高效的最新...

2015-05-06

679

版权声明：本文为博主原创文章，未经博主允许不得转载。 https://blog.csdn.net/qq1010885678/article/details/45629643 首先交代一下集群的规模和配置集群有六台机器，均是VM虚拟机，每台256M的内存（原谅楼主物理机硬件不太给力）主机名分别是cloud1~cloud6 每台机器上都装有jdk6,和hadoop-2.2.0 其中cloud4~cloud6上装有zookeeper cloud1为hdfs文件系统的启动节点 cloud3为yarn资源管理的启动节点（注意每台机器都配置好SSH免密码登录，可以在下面的hadoop部署链接中查看具体步骤）有关hadoop和zookeeper的部署请看： hadoop-2.2.0集群安装部署 zookeeper集群安装部署本次实验目标是在六台虚拟机上装上spark，并且将cloud1作为主节点首先将下载好的spark和scala包上传到cloud1上 scala下载地址 spark下载地址注意安装时尽量不要使用root用户（这里使用cloud自定义用户）安装scala： tar –...

2015-05-10

731

资源下载

更多资源

腾讯云软件源

为解决软件依赖安装时官方源访问速度慢的问题，腾讯云为一些软件搭建了缓存服务。您可以通过使用腾讯云软件源站来提升依赖包的安装速度。为了方便用户自由搭建服务架构，目前腾讯云软件源站支持公网访问和内网访问。

Spring

Spring框架（Spring Framework）是由Rod Johnson于2002年提出的开源Java企业级应用框架，旨在通过使用JavaBean替代传统EJB实现方式降低企业级编程开发的复杂性。该框架基于简单性、可测试性和松耦合性设计理念，提供核心容器、应用上下文、数据访问集成等模块，支持整合Hibernate、Struts等第三方框架，其适用范围不仅限于服务器端开发，绝大多数Java应用均可从中受益。

Rocky Linux

Rocky Linux（中文名：洛基）是由Gregory Kurtzer于2020年12月发起的企业级Linux发行版，作为CentOS稳定版停止维护后与RHEL（Red Hat Enterprise Linux）完全兼容的开源替代方案，由社区拥有并管理，支持x86_64、aarch64等架构。其通过重新编译RHEL源代码提供长期稳定性，采用模块化包装和SELinux安全架构，默认包含GNOME桌面环境及XFS文件系统，支持十年生命周期更新。

WebStorm

WebStorm 是jetbrains公司旗下一款JavaScript 开发工具。目前已经被广大中国JS开发者誉为“Web前端开发神器”、“最强大的HTML5编辑器”、“最智能的JavaScript IDE”等。与IntelliJ IDEA同源，继承了IntelliJ IDEA强大的JS部分的功能。