HBase+Spark技术双周刊 第四期
直播往期回顾——视频回看及PPT下载
Solr增强HBase检索能力基础介绍及场景
在本期视频中,阿里高级开发工程师天斯介绍了Solr如何增强HBase检索能力,并通过示例帮助大家快速上手HBase+Solr查询应用。
HBase钉钉群直播预告
1月22日 Phoenix 全局索引原理与实践 张赟
1月29日 Spark on rds/MongoDB/HBase/Redis/OSS多数据源 云覆
阿里云栖开发者沙龙——线下活动
【1月18日 下午1:30】 阿里云栖开发者沙龙北京专场—互联网下半场的角逐:玩转轻资产的大数据服务
【1月19日 下午1:30】 阿里云栖开发者沙龙合肥专场:高并发企业级应用架构实践分享
推荐专家
沐远——阿里云数据库技术专家
沐远,专注大数据分布式计算数据库领域, 研发Spark及自主研发内存计算,目前为广大公有云用户
低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。
持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。
转载内容版权归作者及来源网站所有,本站原创内容转载请注明来源。
- 上一篇
大数据和大数据平台的内在联系,大数据的实用价值是什么?
大数据是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力来适应海量、高增长率和多样化的信息资产。大数据,又称巨量资料,指的是所涉及的数据资料量规模巨大到无法通过人脑甚至主流软件工具,在合理时间内达到撷取、管理、处理、并整理成为帮助企业经营决策更积极目的的资讯。 大数据根基于互联网,数据仓库、数据挖掘、云计算等互联网技术的发展为大数据的应用奠定了基础。1.大数据是什么?引用3个比较常用的大数据定义:Gartner:需要信息处理模式才能具有更强的决策力,洞察发现力和流程优化能力的海量、高增长率很多样化的信息资产。IDC:海量的数据规模(Volunme)、快速的数据流转和数据体系(Velocity)、多样的数据类型(Variety)、巨大的数据价值(Value)。Wiki:或称巨量数据、海量数据、大资料,指所涉及的数据量规模巨大到无法通过人工,在合理时间内达到截取、管理、处理、并整理成为人类所能解读的信息。2.大数据平台是什么?新一代的大数据平台应该是集数据整合、数据处理、数据存储、数据分析、可视化**等功能为一体,真正帮助我们能挖掘数据背后的业务逻辑,发现数据背后的问题,及时调...
- 下一篇
Adaptive Execution如何让Spark SQL更高效更好用?
本文转发自技术世界,原文链接 http://www.jasongj.com/spark/adaptive_execution/ 1 背 景 Spark SQL / Catalyst 和 CBO 的优化,从查询本身与目标数据的特点的角度尽可能保证了最终生成的执行计划的高效性。但是 执行计划一旦生成,便不可更改,即使执行过程中发现后续执行计划可以进一步优化,也只能按原计划执行; CBO 基于统计信息生成最优执行计划,需要提前生成统计信息,成本较大,且不适合数据更新频繁的场景; CBO 基于基础表的统计信息与操作对数据的影响推测中间结果的信息,只是估算,不够精确。 本文介绍的 Adaptive Execution 将可以根据执行过程中的中间数据优化后续执行,从而提高整体执行效率。核心在于两点: 执行计划可动态调整 调整的依据是中间结果的精确统计信息 2
相关文章
文章评论
共有0条评论来说两句吧...
文章二维码
点击排行
推荐阅读
最新文章
- Docker使用Oracle官方镜像安装(12C,18C,19C)
- CentOS7,CentOS8安装Elasticsearch6.8.6
- CentOS6,CentOS7官方镜像安装Oracle11G
- CentOS7编译安装Cmake3.16.3,解决mysql等软件编译问题
- SpringBoot2编写第一个Controller,响应你的http请求并返回结果
- CentOS8编译安装MySQL8.0.19
- SpringBoot2配置默认Tomcat设置,开启更多高级功能
- Windows10,CentOS7,CentOS8安装Nodejs环境
- Docker快速安装Oracle11G,搭建oracle11g学习环境
- CentOS8,CentOS7,CentOS6编译安装Redis5.0.7