您现在的位置是:首页 > 文章详情

Mahout学习之命令行创建序列文件

日期:2015-10-10点击:565

一:命令行转换

创建新的工作目录

mkdir lastfm

mkdir ./lastfm/original

export WORK_DIR=/home/thinkgamer/document/lastfm

cd $WORK_DIR

自己准备一个数据集放在original文件夹下,例如将点击打开链接下边的数据保存在synthetic_control.data中进行转换,首先将其放在origiinal文件夹中

进入mahout的安装目录,前提是hadoop环境是启动的

cd /usr/local/hadoop/mahout

bin/mahout seqdirectory -i $WORK_DIR/original -o $WORK_DIR/sequencesfile

然后进入$WORK_DIR目录下有一个sequencesfile文件夹

cd $WORK_DIR

cd sequencesfile

ls

会显示如下:

part-m-00000  _SUCCESS

命令行查看part-m-00000的文件内容为:

bin/mahout seqdumper -i $WORK_DIR/sequencesfile/part-m-00000 | more0

二:mapreduce转换

具体请参考mahout运行canopy程序中的程序:点击打开链接

三:命令行转换为文本文件

bin/mahout seqdumper -i $WORK_DIR/sequencesfile/part-m-00000 -o $WORK_DIR/clusteranalyzer

mahout版本不同如果上边的不好使,换用下边的

bin/mahout seqdumper -s $WORK_DIR/sequencesfile/part-m-00000 -o $WORK_DIR/clusteranalyzer

原文链接:https://yq.aliyun.com/articles/413154
关注公众号

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。

持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。

转载内容版权归作者及来源网站所有,本站原创内容转载请注明来源。

文章评论

共有0条评论来说两句吧...

文章二维码

扫描即可查看该文章

点击排行

推荐阅读

最新文章