HBase+Spark技术双周刊第四期-低调大师

HBase+Spark技术双周刊第四期

2019-01-18 742

a7c54fbf1d2733e0ce75cdade4ccc903ffd2d0e6

直播往期回顾——视频回看及PPT下载

Solr增强HBase检索能力基础介绍及场景
在本期视频中，阿里高级开发工程师天斯介绍了Solr如何增强HBase检索能力，并通过示例帮助大家快速上手HBase+Solr查询应用。

HBase钉钉群直播预告

1月22日 Phoenix 全局索引原理与实践张赟
1月29日 Spark on rds/MongoDB/HBase/Redis/OSS多数据源云覆

阿里云栖开发者沙龙——线下活动

【1月18日下午1:30】阿里云栖开发者沙龙北京专场—互联网下半场的角逐：玩转轻资产的大数据服务
【1月19日下午1:30】阿里云栖开发者沙龙合肥专场：高并发企业级应用架构实践分享

推荐专家

沐远——阿里云数据库技术专家
沐远，专注大数据分布式计算数据库领域，研发Spark及自主研发内存计算，目前为广大公有云用户

微信关注我们

原文链接：https://yq.aliyun.com/articles/688191

转载内容版权归作者及来源网站所有！

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。

大数据和大数据平台的内在联系，大数据的实用价值是什么？

大数据是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力来适应海量、高增长率和多样化的信息资产。大数据，又称巨量资料，指的是所涉及的数据资料量规模巨大到无法通过人脑甚至主流软件工具，在合理时间内达到撷取、管理、处理、并整理成为帮助企业经营决策更积极目的的资讯。大数据根基于互联网，数据仓库、数据挖掘、云计算等互联网技术的发展为大数据的应用奠定了基础。1.大数据是什么？引用3个比较常用的大数据定义：Gartner：需要信息处理模式才能具有更强的决策力，洞察发现力和流程优化能力的海量、高增长率很多样化的信息资产。IDC：海量的数据规模（Volunme）、快速的数据流转和数据体系（Velocity）、多样的数据类型（Variety）、巨大的数据价值（Value）。Wiki：或称巨量数据、海量数据、大资料，指所涉及的数据量规模巨大到无法通过人工，在合理时间内达到截取、管理、处理、并整理成为人类所能解读的信息。2．大数据平台是什么？新一代的大数据平台应该是集数据整合、数据处理、数据存储、数据分析、可视化**等功能为一体，真正帮助我们能挖掘数据背后的业务逻辑，发现数据背后的问题，及时调...

2019-01-17

676

本文转发自技术世界，原文链接　http://www.jasongj.com/spark/adaptive_execution/ 1 背景 Spark SQL / Catalyst 和 CBO 的优化，从查询本身与目标数据的特点的角度尽可能保证了最终生成的执行计划的高效性。但是执行计划一旦生成，便不可更改，即使执行过程中发现后续执行计划可以进一步优化，也只能按原计划执行； CBO 基于统计信息生成最优执行计划，需要提前生成统计信息，成本较大，且不适合数据更新频繁的场景； CBO 基于基础表的统计信息与操作对数据的影响推测中间结果的信息，只是估算，不够精确。本文介绍的 Adaptive Execution 将可以根据执行过程中的中间数据优化后续执行，从而提高整体执行效率。核心在于两点：执行计划可动态调整调整的依据是中间结果的精确统计信息 2

2019-01-19

812

资源下载

更多资源

Mario

马里奥是站在游戏界顶峰的超人气多面角色。马里奥靠吃蘑菇成长，特征是大鼻子、头戴帽子、身穿背带裤，还留着胡子。与他的双胞胎兄弟路易基一起，长年担任任天堂的招牌角色。

腾讯云软件源

为解决软件依赖安装时官方源访问速度慢的问题，腾讯云为一些软件搭建了缓存服务。您可以通过使用腾讯云软件源站来提升依赖包的安装速度。为了方便用户自由搭建服务架构，目前腾讯云软件源站支持公网访问和内网访问。

Rocky Linux

Rocky Linux（中文名：洛基）是由Gregory Kurtzer于2020年12月发起的企业级Linux发行版，作为CentOS稳定版停止维护后与RHEL（Red Hat Enterprise Linux）完全兼容的开源替代方案，由社区拥有并管理，支持x86_64、aarch64等架构。其通过重新编译RHEL源代码提供长期稳定性，采用模块化包装和SELinux安全架构，默认包含GNOME桌面环境及XFS文件系统，支持十年生命周期更新。

WebStorm

WebStorm 是jetbrains公司旗下一款JavaScript 开发工具。目前已经被广大中国JS开发者誉为“Web前端开发神器”、“最强大的HTML5编辑器”、“最智能的JavaScript IDE”等。与IntelliJ IDEA同源，继承了IntelliJ IDEA强大的JS部分的功能。