0021-使用JDBC向Kudu表插入中文字符-cast的秘密
温馨提示:要看高清无码套图,请使用手机打开并单击图片放大查看。
1.问题描述
使用Impala JDBC向Kudu表中插入中文字符,插入的中文字符串乱码,中文字符串被截断。
继之前文档使用sql拼接方式插入中文字符串乱码解决方法后,此文档描述使用jdbc的PreparedStatement方式插入中文字符串乱码问题。
2.问题复现
测试环境:
- CDH5.12.0
- Kudu1.4.0
- ImpalaJDBC41_2.5.35
1.使用ImpalaJDBC代码进行测试,测试代码
staticString JDBC_DRIVER ="com.cloudera.impala.jdbc41.Driver"; static String CONNECTION_URL ="jdbc:impala://ip-172-31-10-118:21050/default"; public static void main(String[] args) { Connection con = null; ResultSetrs = null; PreparedStatementps = null; try { Class.forName(JDBC_DRIVER); con =DriverManager.getConnection(CONNECTION_URL); Stringsql2 = "insert into my_first_table values(?, ?)"; ps =con.prepareStatement(sql2); ps.setInt(1,81); ps.setString(2,"测试中文字符"); ps.execute(); ps.close(); ps =con.prepareStatement("select * from my_first_table order byid asc"); rs = ps.executeQuery(); while (rs.next()){ System.out.println(rs.getLong(1)+ "\t" +rs.getString(2)); } } catch (Exceptione) { e.printStackTrace(); } finally{ try {// 关闭rs、ps和con rs.close(); ps.close(); con.close(); } catch(SQLException e) { // TODOAuto-generated catch block e.printStackTrace(); } } }
2.向Kudu表中分别插入测试数据,如“测试”,“测试中文”,“测试中文字符”
String sql2 = "insert into my_first_table values(?, ?)"; ps = con.prepareStatement(sql2); ps.setInt(1, 73); ps.setString(2, "测试"); ps.execute(); ps.close(); ps = con.prepareStatement(sql2); ps.setInt(1, 74); ps.setString(2, "测试中文"); ps.execute(); ps.close(); ps = con.prepareStatement(sql2); ps.setInt(1, 75); ps.setString(2, "测试中文字符"); ps.execute(); ps.close();
通过Hue查询结果如下:
中文字符全部乱码,部分乱码,字符串被截断问题重现。
3.解决方法
修改程序中插入语句,将插入字符串列使用cast函数转成String类型
String sql2 = "insert into my_first_table values(?, cast(?as string))"; ps = con.prepareStatement(sql2); ps.setInt(1, 60); ps.setString(2, "测试中文字符"); ps.execute(); ps.close(); ps = con.prepareStatement(sql2); ps.setInt(1, 61); ps.setString(2, "测试中文"); ps.execute(); ps.close(); ps = con.prepareStatement(sql2); ps.setInt(1, 62); ps.setString(2, "测试"); ps.execute(); ps.close();
修改后重新向Kudu中插入测试数据:“测试中文字符”,“测试中文”,“测试”
使用Hue查询显示如下:
中文字符串插入Kudu显示正常。
醉酒鞭名马,少年多浮夸! 岭南浣溪沙,呕吐酒肆下!挚友不肯放,数据玩的花!
温馨提示:要看高清无码套图,请使用手机打开并单击图片放大查看。
欢迎关注Hadoop实操,第一时间,分享更多Hadoop干货,喜欢请关注分享。
原创文章,欢迎转载,转载请注明:转载自微信公众号Hadoop实操
低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。
持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。
转载内容版权归作者及来源网站所有,本站原创内容转载请注明来源。
- 上一篇
使用Atlas进行元数据管理之Type(类型)
背景:笔者和团队的小伙伴近期在进行数据治理/元数据管理方向的探索,会在接下来的系列文章中, 将经验与收获和读者们进行分享。 元数据系列文章: [1] - 使用Atlas进行元数据管理之Glossary(术语) [2] - 使用Atlas进行元数据管理之Type(类型) 1. 概述 Atlas允许用户为他们想要管理的元数据对象定义模型。该模型由称为type(类型)的定义组成。称为entities(实体)的type(类型)实例表示受管理的实际元数据对象。 Type System是一个允许用户定义和管理类型和实体的组件。开箱即用的Atlas管理的所有元数据对象(例如Hive表)都使用类型建模并表示为实体。要在Atlas中存储新类型的元数据,需要了解类型系统组件的概念。 2. Types(类型) Atlas中的Type是对特定类型的元数据对象如何存储和访问的定义。Type表示定义元数据对象属性的一个或一组属性。具有开发基础的用户能了解到,类型就相当于面向对象编程语言的“Class”定义或关系数据库的“table schema”。 使用Atlas的类型的其中一个示例是Hive表。 Hive表定义...
- 下一篇
分布式图数据库JanusGraph-简介
JanusGraph设计的目的是处理大图,单机无论是在存储和计算能力上都无法满足大图处理。大规模图实时计算和分析是JanusGraph最基本的优势。本节将讨论更多JanusGraph特有的优势以及它底层支持的存储方案。 转自:JanusGraph中文翻译文档 1.1. JanusGraph 基本优势 支持非常大的图。JanusGraph通过添加机器横向扩展集群。 支持很大的并发事务处理和图操作处理。通过添加机器横向扩展JanusGraph的事务处理能力,可以在毫秒级别相应大图的复杂查询。 支持使用Hadoop框架进行全局图分析和批量图处理。 支持在很大的图上对顶点和边进行地理位置、数值范围、全文搜索。 原生支持Apache TinkerPop 描述的当前流行的属性图数据模型。 原生支持图遍历语言Gremlin。 通过使用非编程的方式连接很容易与Gremlin Server集成 提供了很多图级别配置选项用于调节性能。 以顶点为中心的索引提供顶点级查询,以缓解臭名昭着的超级节点问题。 提供优化的磁盘表示,从而允许有效地使用存储和访问速度。 基于Apache 2 许可协议开放源码。 1.2....
相关文章
文章评论
共有0条评论来说两句吧...
文章二维码
点击排行
推荐阅读
最新文章
- CentOS7,8上快速安装Gitea,搭建Git服务器
- SpringBoot2更换Tomcat为Jetty,小型站点的福音
- Docker使用Oracle官方镜像安装(12C,18C,19C)
- CentOS关闭SELinux安全模块
- Docker安装Oracle12C,快速搭建Oracle学习环境
- Hadoop3单机部署,实现最简伪集群
- Jdk安装(Linux,MacOS,Windows),包含三大操作系统的最全安装
- CentOS7编译安装Cmake3.16.3,解决mysql等软件编译问题
- SpringBoot2配置默认Tomcat设置,开启更多高级功能
- CentOS7安装Docker,走上虚拟化容器引擎之路