首页 文章 精选 留言 我的
优秀的个人博客,低调大师

微信关注我们

原文链接:https://yq.aliyun.com/articles/481899

转载内容版权归作者及来源网站所有!

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。

Hive partition prune的一个Bug

昨天跑了一个Hive查询发现启动的MAP数远远多于预期,很奇怪;查询可以简单抽象如下: 比如有一个表t的分区键dt string;查询select count(*) from t where dt=20130926; 是哪里出了问题呢?首先看一下执行计划果然发现问题了: 首先出现了: expr: (dt = 2.0130926E7) type: boolean 其次partition values是dt和__HIVE_DEFAULT_PARTITION__ 应该发生了类似隐式转换的事情吧?修改成dt=’20130926’再看正确了. 因为隐式转换而无法使用索引的情况在RDBMS比较常见,但是这个如果是隐式转换也说不通,因为只是多扫描了一个分区而不是全部分区,带着这样的疑问看源码:得到的结论就是Hive的分区键列和值都必须是String类型,如果不是就可能会Hit到bug 4878(pruneBySequentialScan),不知道为什么CDH4.2没有merge这个patch. Update:这个Bug已经在Hive 0.12被fixed掉了 本文转自MIKE老毕 51CTO博客,原...

Sqoop commit failure

线上一个Sqoop抽取Job报如下错误: [ERROR]: Utils - Caused by: java.sql.SQLException: Communicationslink failure during commit(). Transaction resolution unknown. [ERROR]: Utils - at com.mysql.jdbc.Connection.commit(Connection.java:2171) [ERROR]: Utils - atorg.apache.sqoop.mapreduce.db.DBRecordReader.close(DBRecordReader.java:167) 看报错应该是Sqoop在导出数据后,处理数据到提交超过了MySQL的wait_timeout(线上是2分钟); 引起这个的原因会有很多,服务器高负载,HDFS高负载,网卡跑满等等,可以通过在jdbc url里设置interactiveClient=true(线上interactive_timeout是1小时)后没有再报过错; BTW:在写blog的时候想起其实可...

相关文章

发表评论

资源下载

更多资源
优质分享App

优质分享App

近一个月的开发和优化,本站点的第一个app全新上线。该app采用极致压缩,本体才4.36MB。系统里面做了大量数据访问、缓存优化。方便用户在手机上查看文章。后续会推出HarmonyOS的适配版本。

Nacos

Nacos

Nacos /nɑ:kəʊs/ 是 Dynamic Naming and Configuration Service 的首字母简称,一个易于构建 AI Agent 应用的动态服务发现、配置管理和AI智能体管理平台。Nacos 致力于帮助您发现、配置和管理微服务及AI智能体应用。Nacos 提供了一组简单易用的特性集,帮助您快速实现动态服务发现、服务配置、服务元数据、流量管理。Nacos 帮助您更敏捷和容易地构建、交付和管理微服务平台。

Spring

Spring

Spring框架(Spring Framework)是由Rod Johnson于2002年提出的开源Java企业级应用框架,旨在通过使用JavaBean替代传统EJB实现方式降低企业级编程开发的复杂性。该框架基于简单性、可测试性和松耦合性设计理念,提供核心容器、应用上下文、数据访问集成等模块,支持整合Hibernate、Struts等第三方框架,其适用范围不仅限于服务器端开发,绝大多数Java应用均可从中受益。

Rocky Linux

Rocky Linux

Rocky Linux(中文名:洛基)是由Gregory Kurtzer于2020年12月发起的企业级Linux发行版,作为CentOS稳定版停止维护后与RHEL(Red Hat Enterprise Linux)完全兼容的开源替代方案,由社区拥有并管理,支持x86_64、aarch64等架构。其通过重新编译RHEL源代码提供长期稳定性,采用模块化包装和SELinux安全架构,默认包含GNOME桌面环境及XFS文件系统,支持十年生命周期更新。

用户登录
用户注册