Sqoop数据导入到HBase遇上的问题及解决方法
运行bin/sqoop import --connect jdbc:mysql://ip:port/database --username *** --password ****--hbase-bulkload --hbase-create-table --column-family info --hbase-row-key username --hbase-table detects --table detects将Mysql中detects表导入到Hbase中的detects表,提示找不到users Class错误
解决方法: 将/tmp/sqoop-hadoop/compile 文件夹下的 detects.jar包 放到sqoop安装目录lib下。重新执行即可。确实重新运行好了.
2.使用importtsv将文件数据导入到Hbase中,x运行${HADOOP_HOME}/bin/hadoop jar ${HBASE_HOME}/lib/hbase-server-1.2.6.jar,提示:
解决方法: 错误提示说明hadoop中找不到hbase的jar包,只要将hbase的路径添加到hadoop路径就可以了HADOOP_CLASSPATH=`${HBASE_HOME}/bin/hbase classpath` ${HADOOP_HOME}/bin/hadoop jar ${HBASE_HOME}/lib/hbase-server-1.2.6.jar;
最后可以使用命令将文件数据导入到hbase中,例子:HADOOP_CLASSPATH=`${HBASE_HOME}/bin/hbase classpath` ${HADOOP_HOME}/bin/hadoop jar ${HBASE_HOME}/lib/hbase-server-1.2.6.jar importtsv -Dimporttsv.columns=HBASE_ROW_KEY,info:name,info:age -Dimporttsv.separator=, user /hbase_user -Dimporttsv.bulk.output=/hbase_user 将use数据导入到hbase的user中,提示Bad lines =0 就说明全部导入成功啦
ps: 下图这个错误提示可以不用管他,不影响运行
原文发布时间为:2018-06-1本文作者:网络大数据本文来自云栖社区合作伙伴“ IT168”,了解相关信息可以关注“ IT168”。
低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。
持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。
转载内容版权归作者及来源网站所有,本站原创内容转载请注明来源。
- 上一篇
如何避免HBase写入过快引起的各种问题
整个写入流程从客户端调用API开始,数据会通过protobuf编码成一个请求,通过scoket实现的IPC模块被送达server的RPC队列中。最后由负责处理RPC的handler取出请求完成写入操作。写入会先写WAL文件,然后再写一份到内存中,也就是memstore模块,当满足条件时,memstore才会被flush到底层文件系统,形成HFile。 当写入过快时会遇见什么问题? 写入过快时,memstore的水位会马上被推高。 你可能会看到以下类似日志: 这个是Region的memstore占用内存大小超过正常的4倍,这时候会抛异常,写入请求会被拒绝,客户端开始重试请求。当达到128M的时候会触发flush memstore,当达到128M * 4还没法触发flush时候会抛异常来拒绝写入。两个相关参数的默认值如下: 或者这样的日志: 这是所有region的memstore内存总和开销超过配置上限,默认是配置heap的40%,这会导致写入被阻塞。目的是等待flush的线程把内存里的数据flush下去,否则继续允许写入memestore会把内存写爆 当写入被阻塞,队列会开始积压,如果运...
- 下一篇
开源大数据周刊-第88期
资讯 天猫、盒马、饿了么、口碑,阿里想做的新零售到底是什么? 阿里巴巴近日宣布,将通过天猫、盒马、口碑、饿了么等多个业态,在全国范围内打造“新零售之城”。作为全国首都,北京成为阿里新零售布局和试点的主要阵地之一。本文详细介绍了阿里巴巴的新零售业态是如何具体运作的。 大数据如何改变一座城? 本文介绍了贵阳筚路蓝缕的大数据创业之路。在这个从未有过成功先例的行业,贵阳摸着石头过河,探索有别于东部发达地区的特色发展之路。 Apache Flink 1.5.0 正式发布,多项重要更新 Apache Flink 1.5.0 近日正式发布。在过去五个月的时间里,Flink 社区共解决了超过 780 个 issues。本文介绍了该版本的几项重要更新。 技术 Spark Streaming 实时计算在甜橙金融监控系统中的应用及优化 本文介绍了天翼电子商务有限公司(简
相关文章
文章评论
共有0条评论来说两句吧...