spoon下载安装地址:http://www.pentaho.com/download
选择 Download Windows ,只有windows 版的才是spoon,下载解压后即可使用,无需安装。
spoon是纯java编写的,所以使用前必需安装java的jdk包
下载地址:http://www.oracle.com/technetwork/java/javase/downloads/index.html
连接HBase需要配置(实际连接HBase是通过zookeeper服务)
进入spoon解压目录,打开 plugins\pentaho-big-data-plugin\plugin.properties 文件
![QQ截图20150612111721.jpg wKiom1V6T1zhI5tvAANfk5HrmEA064.jpg]()
修改 active.hadoop.configuration 配置项(配置驱动集目录名),默认这里为空。当前已经修改好。
进入目录 plugins\pentaho-big-data-plugin\hadoop-configurations 查看当前可用驱动集目录
![QQ截图20150612112613.jpg wKioL1V6Uw6Bn4SVAAHNZD0BLoo146.jpg]()
里面的4个目录均为 hadoop-configurations 驱动集,链接HBase 需要 zookeeper-*.jar 文件
如在cdh52目录 lib 下:
![QQ截图20150612113021.jpg wKioL1V6VAaSbHIBAANfL7yknK0523.jpg]()
那么 cdh52 就驱动集可以使用。
HBase启动时会绑定服务器的hostname值,所以在spoon机器中需要绑定相同的host否则无法连接。
在HBase机器上输入命令:
如:
然后修改spoon机器上的hosts
打开 C:\Windows\System32\drivers\etc\hosts 文件
如HBase服务器的IP是 192.168.0.10
则在 hosts 文件中新加一行,并保存。
打开spoon,进入spoon解压目录双击 Spoon.bat 文件
注:其实在linux下也可以运行(远程连接不行)只要打开spoon.sh脚本即可
新建转换,并且点击 Big Data > HBase Input
![QQ截图20150612115802.jpg wKiom1V6WRmgKrRxAAKWkYZubnc066.jpg]()
双击 HBase Input 图标 > 点击New 弹出编辑 Hadoop cluster窗口
![QQ截图20150612130541.jpg wKioL1V6amHBCVRlAAFtH6esi2I084.jpg]()
修改Cluster Name 值(即这个HBase 连接别名),修改ZooKeeper 如HBase所在服务器IP为192.168.0.10 默认HBase 端口号为 2182
![QQ截图20150612130909.jpg wKiom1V6aYegtVpfAAFta83RSCU163.jpg]()
确定,然后在 Hadoop Cluster 选中 hbase-test
![QQ截图20150612131943.jpg wKiom1V6bBOzHgaiAAHheCcZuRc636.jpg]()
进入Create/Edit mappings选择卡,按以下步骤操作
![QQ截图20150612134203.jpg wKioL1V6cuODaaDpAAOHv_6i7Q0379.jpg]()
然后返回 Configure query 选项卡,按步骤操作
![QQ截图20150612142813.jpg wKioL1V6fbvzD5a6AASY4jt-GQI436.jpg]()
然后鼠标右键HBase Input > 选择Preview > 快速启动
即可查看数据。
spoon下载安装地址:http://www.pentaho.com/download
选择 Download Windows ,只有windows 版的才是spoon,下载解压后即可使用,无需安装。
spoon是纯java编写的,所以使用前必需安装java的jdk包
下载地址:http://www.oracle.com/technetwork/java/javase/downloads/index.html
连接HBase需要配置(实际连接HBase是通过zookeeper服务)
进入spoon解压目录,打开 plugins\pentaho-big-data-plugin\plugin.properties 文件
![QQ截图20150612111721.jpg wKiom1V6T1zhI5tvAANfk5HrmEA064.jpg]()
修改 active.hadoop.configuration 配置项(配置驱动集目录名),默认这里为空。当前已经修改好。
进入目录 plugins\pentaho-big-data-plugin\hadoop-configurations 查看当前可用驱动集目录
![QQ截图20150612112613.jpg wKioL1V6Uw6Bn4SVAAHNZD0BLoo146.jpg]()
里面的4个目录均为 hadoop-configurations 驱动集,链接HBase 需要 zookeeper-*.jar 文件
如在cdh52目录 lib 下:
![QQ截图20150612113021.jpg wKioL1V6VAaSbHIBAANfL7yknK0523.jpg]()
那么 cdh52 就驱动集可以使用。
HBase启动时会绑定服务器的hostname值,所以在spoon机器中需要绑定相同的host否则无法连接。
在HBase机器上输入命令:
如:
然后修改spoon机器上的hosts
打开 C:\Windows\System32\drivers\etc\hosts 文件
如HBase服务器的IP是 192.168.0.10
则在 hosts 文件中新加一行,并保存。
打开spoon,进入spoon解压目录双击 Spoon.bat 文件
注:其实在linux下也可以运行(远程连接不行)只要打开spoon.sh脚本即可
新建转换,并且点击 Big Data > HBase Input
![QQ截图20150612115802.jpg wKiom1V6WRmgKrRxAAKWkYZubnc066.jpg]()
双击 HBase Input 图标 > 点击New 弹出编辑 Hadoop cluster窗口
![QQ截图20150612130541.jpg wKioL1V6amHBCVRlAAFtH6esi2I084.jpg]()
修改Cluster Name 值(即这个HBase 连接别名),修改ZooKeeper 如HBase所在服务器IP为192.168.0.10 默认HBase 端口号为 2182
![QQ截图20150612130909.jpg wKiom1V6aYegtVpfAAFta83RSCU163.jpg]()
确定,然后在 Hadoop Cluster 选中 hbase-test
![QQ截图20150612131943.jpg wKiom1V6bBOzHgaiAAHheCcZuRc636.jpg]()
进入Create/Edit mappings选择卡,按以下步骤操作
![QQ截图20150612134203.jpg wKioL1V6cuODaaDpAAOHv_6i7Q0379.jpg]()
然后返回 Configure query 选项卡,按步骤操作
![QQ截图20150612142813.jpg wKioL1V6fbvzD5a6AASY4jt-GQI436.jpg]()
然后鼠标右键HBase Input > 选择Preview > 快速启动
即可查看数据。
本文转自 ttlxihuan 51CTO博客,原文链接:http://blog.51cto.com/php2012web/1661247