DolphinScheduler+Sqoop 入门避坑:一文搞定数据同步常见异常
- 在DolphinScheduler中假如遇到创建租户时,报错,错误日志显示权限不足:
可以使用下面的语句去开启权限:
hdfs dfs -chmod 777 /
- 遇见下面的错误
检查 DolphinScheduler 如何整合 Sqoop 呢?
按照上边的图片里的路径和文档在最后边添加下边的代码:
export SQOOP_HOME=/opt/installs/sqoop export PATH=$SQOOP_HOME/bin:$HADOOP_HOME/bin:$SPARK_HOME1/bin:$SPARK_HOME2/bin:$PYTHON_HOME/bin:$JAVA_HOME/bin:$HIVE_HOME/bin:$FLINK_HOME/bin:$DATAX_HOME/bin:$SEATUNNEL_HOME/bin:$CHUNJUN_HOME/bin:$PATH
然后重启一下DolphinScheduler:
查看ds状态:bash ./bin/dolphinscheduler-daemon.sh status standalone-server 关闭ds:bash ./bin/dolphinscheduler-daemon.sh stop standalone-server 开启ds:bash ./bin/dolphinscheduler-daemon.sh start standalone-server
-
若出现下边的错误
Caused by: java.lang.ClassNotFoundException: Class QueryResult not found at org.apache.hadoop.conf.Configuration.getClassByName(Configuration.java:2571) at org.apache.hadoop.conf.Configuration.getClass(Configuration.java:2665) ... 12 more
解决方案就是:拷贝一个 QueryResult.jar
到 sqoop 的 lib
下 【临时解决方案】
[INFO] 2024-09-25 06:19:16.083 +0000 - -> 注: /tmp/sqoop-root/compile/46c0c4b3def5aba0c202ae9664234de6/QueryResult.java使用或覆盖了已过时的 API。 注: 有关详细信息, 请使用 -Xlint:deprecation 重新编译。 通过日志看到一个位置: cd /tmp/sqoop-root/compile/46c0c4b3def5aba0c202ae9664234de6
将此jar包拷贝 cp /tmp/sqoop-root/compile/46c0c4b3def5aba0c202ae9664234de6/QueryResult.jar /opt/installs/sqoop/lib/
永久解决方案:
在 DolphinScheduler的配置文件中添加一句话:
在文档的最下边添加下边的代码
export HADOOP_CONF_DIR=/opt/installs/hadoop/etc/hadoop
配置完成后,重启 DolphinScheduler。
查看ds状态:bash ./bin/dolphinscheduler-daemon.sh status standalone-server 关闭ds:bash ./bin/dolphinscheduler-daemon.sh stop standalone-server 开启ds:bash ./bin/dolphinscheduler-daemon.sh start standalone-server
-
报错如下:
[INFO] 2024-09-25 06:27:53.628 +0000 - -> 2024-09-25 14:27:52,757 INFO [main] sqoop.Sqoop (Sqoop.java:<init>(96)) - Running Sqoop version: 1.4.7 2024-09-25 14:27:52,824 ERROR [main] tool.BaseSqoopTool (BaseSqoopTool.java:hasUnrecognizedArgs(333)) - Error parsing arguments for import: 2024-09-25 14:27:52,825 ERROR [main] tool.BaseSqoopTool (BaseSqoopTool.java:hasUnrecognizedArgs(336)) - Unrecognized argument: dt 2024-09-25 14:27:52,829 ERROR [main] tool.BaseSqoopTool (BaseSqoopTool.java:hasUnrecognizedArgs(336)) - Unrecognized argument: 2024-09-24 2024-09-25 14:27:52,829 ERROR [main] tool.BaseSqoopTool (BaseSqoopTool.java:hasUnrecognizedArgs(336)) - Unrecognized argument: -m 2024-09-25 14:27:52,829 ERROR [main] tool.BaseSqoopTool (BaseSqoopTool.java:hasUnrecognizedArgs(336)) - Unrecognized argument: 1 2024-09-25 14:27:52,829 ERROR [main] tool.BaseSqoopTool (BaseSqoopTool.java:hasUnrecognizedArgs(336)) - Unrecognized argument: --connect 2024-09-25 14:27:52,829 ERROR [main] tool.BaseSqoopTool (BaseSqoopTool.java:hasUnrecognizedArgs(336)) - Unrecognized argument: jdbc:mysql://192.168.233.131:3306/jrxd?allowLoadLocalInfile=false&autoDeserialize=false&allowLocalInfile=false&allowUrlInLocalInfile=false 2024-09-25 14:27:52,830 ERROR [main] tool.BaseSqoopTool (BaseSqoopTool.java:hasUnrecognizedArgs(336)) - Unrecognized argument: --username 2024-09-25 14:27:52,830 ERROR [main] tool.BaseSqoopTool (BaseSqoopTool.java:hasUnrecognizedArgs(336)) - Unrecognized argument: root 2024-09-25 14:27:52,830 ERROR [main] tool.BaseSqoopTool (BaseSqoopTool.java:hasUnrecognizedArgs(336)) - Unrecognized argument: --password
通过以上可以大概猜到,是 sqoop 命令写错了。
出现这个错误说明是 DolphinScheduler 工作流中的sqoop 语句出错了。
[INFO] 2024-09-25 06:34:34.639 +0000 - -> 2024-09-25 14:34:33,636 INFO [main] sqoop.Sqoop (Sqoop.java:<init>(96)) - Running Sqoop version: 1.4.7 2024-09-25 14:34:33,674 WARN [main] tool.BaseSqoopTool (BaseSqoopTool.java:applyCredentialsOptions(1120)) - Setting your password on the command-line is insecure. Consider using -P instead. Must specify destination with --target-dir. Try --help for usage instructions. [INFO] 2024-09-25 06:34:34.640 +0000 - FINALIZE_SESSION
再出现错误,则按照下边的格式进行修改 :
如果出现以下语法错误:
2024-09-25 14:36:53,044 ERROR [main] manager.SqlManager (LoggingUtils.java:logAll(43)) - Error executing statement: java.sql.SQLSyntaxErrorException: You have an error in your SQL syntax; check the manual that corresponds to your MySQL server version for the right syntax to use near '%Y-%m-%d) = 2024-09-24 AND (1 = 0)' at line 1 java.sql.SQLSyntaxErrorException: You have an error in your SQL syntax; check the manual that corresponds to your MySQL server version for the right syntax to use near '%Y-%m-%d) = 2024-09-24 AND (1 = 0)' at line 1 at com.mysql.cj.jdbc.exceptions.SQLError.createSQLException(SQLError.java:120)
则应该将双引号变单引号。
-
如果出现以下错误:
Caused by: org.apache.hive.service.cli.HiveSQLException: Error while compiling statement: FAILED: ParseException line 45:21 cannot recognize input near ';' '<EOF>' '<EOF>' in expression specification at org.apache.hive.service.cli.operation.Operation.toSQLException(Operation.java:335) at org.apache.hive.service.cli.operation.SQLOperation.prepare(SQLOperation.java:199)
解决方式:使用 sql 模块,不要添加分号;。
原文链接:https://blog.csdn.net/m0_51350088/article/details/148723463
本文由 白鲸开源科技 提供发布支持!

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。
持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。
转载内容版权归作者及来源网站所有,本站原创内容转载请注明来源。
- 上一篇
Apache DolphinScheduler保姆级实操指南:云原生任务调度实战
为什么需要DolphinScheduler? (解决小白认知痛点) 3分钟极速部署(小白友好版) 环境准备 最低配置(开发环境) JDK 8+ MySQL 5.7+ Zookeeper 3.8+ Docker一键启动(避坑推荐) docker run -d --name dolphinscheduler \ -e DATABASE_TYPE=mysql \ -e SPRING_DATASOURCE_URL="jdbc:mysql://localhost:3306/ds?useUnicode=true&characterEncoding=UTF-8" \ -e SPRING_DATASOURCE_USERNAME=root \ -p 12345:12345 \ apache/dolphinscheduler:3.2.0 核心概念可视化解析 手把手创建第一个工作流(含代码段) 场景:每日用户行为分析 步骤1:登录控制台 http://localhost:12345/dolphinscheduler (默认账号admin/dolphinscheduler123) 步骤...
- 下一篇
Linux 基金会报告解读:开源 AI 重塑经济格局,有人失业,有人涨薪!
译自 | Linux Foundation Research 随着生成式 AI 技术飞速发展,开源模式正在成为推动经济转型的重要驱动力。Linux Foundation Research 发布的报告《The Economic and Workforce Impacts of Open Source AI》(开源人工智能对经济和劳动力的影响) 全面分析了开源人工智能(Open Source AI, 简称 OSAI)对企业、行业和劳动力市场带来的深远影响。 本文摘录并概括了报告的主要内容,希望能为开源和 AI 相关从业人员、研究人员和学习者提供有价值的参考。 一、采用 OSAI 正在成为主流 该报告显示,94% 的受访企业已经在使用 AI,其中 89% 的 AI 用户采用了某种形式的开源 AI 解决方案。 小型企业对开源的依赖尤为明显。 根据调研,中小企业比大型企业更倾向于选择开源模型,以实现成本控制与快速部署。 二、经济效益:省钱又高效 报告总结出 OSAI 的三大经济效益: 成本优势 :66% 的企业认为开源 AI 的部署成本低于商业化模型; 生产力提升 :开发者使用 GitHub C...
相关文章
文章评论
共有0条评论来说两句吧...
文章二维码
点击排行
推荐阅读
最新文章
- CentOS6,7,8上安装Nginx,支持https2.0的开启
- CentOS7设置SWAP分区,小内存服务器的救世主
- SpringBoot2编写第一个Controller,响应你的http请求并返回结果
- SpringBoot2全家桶,快速入门学习开发网站教程
- Docker快速安装Oracle11G,搭建oracle11g学习环境
- CentOS7编译安装Cmake3.16.3,解决mysql等软件编译问题
- CentOS7编译安装Gcc9.2.0,解决mysql等软件编译问题
- CentOS7安装Docker,走上虚拟化容器引擎之路
- Jdk安装(Linux,MacOS,Windows),包含三大操作系统的最全安装
- CentOS8安装Docker,最新的服务器搭配容器使用