EMR Spark Relational Cache如何支持雪花模型中的关联匹配-低调大师

EMR Spark Relational Cache如何支持雪花模型中的关联匹配

2019-06-27 719

Relational Cache相关文章链接：

使用Relational Cache加速EMR Spark数据分析
 使用EMR Spark Relational Cache跨集群同步数据
 EMR Spark Relational Cache的执行计划重写

背景

Join是Spark SQL中非常常见的操作，数据表按照业务语义的范式化表定义，便于用户理解与使用，而且可以消除冗余数据。用户通过join操作将相关的数据关联后进行进一步的过滤，聚合等操作。在Spark中，Join通常是代价比较大，尤其是当join的两个表的数据都比较大，无法优化为map join时，需要通过网络shuffle两个表的数据，对数据按照jion字段进行重新组织。Relational Cache是EMR Spark支持的重要特性，类似于数据仓库的物化视图，将反范式化表（即

微信关注我们

原文链接：https://yq.aliyun.com/articles/706758

转载内容版权归作者及来源网站所有！

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。

数据库的七种武器-序章

数据库简介名称特点劣势描述 Oracle 多表关联事务收费贵水平扩展麻烦重剑无锋，大巧不工，数年前持之横行天下 Mysql 水平扩展容易多表关联效率较慢不滞于物，草木竹石均可为剑 Postgresql 多表关联相比Mysql效率较高水平扩展相对麻烦凌厉刚猛，无坚不摧，现以之与河朔群雄争锋 Redis 缓存、效率极高 key不能涉及太大不要一次操作太多key1 小李飞刀，迅疾如电，例无虚发 MongoDB NOSQL支持二级索引水平扩展容易效率较高事务支持较差自此精修，渐进于无剑胜有剑之境 Hive 分布式数据库超大数据量存储查询效率较慢霸王长枪，破釜沈舟，势如破竹 Neo4J 图数据库支持事务数据量较大时效率较慢悠悠天地做棋盘，芸芸众生为棋子 redis ↩

2019-06-27

808

从1.5.0开始，Flink提供了一种新的State类型，称为Broadcast State。在这篇文章中，我们将解释什么是Broadcast State，并展示如何将其应用于评估事件流上的动态模式的应用的示例。我们将向您介绍处理步骤和源代码，以实现此应用。什么是Broadcast State？ Broadcast State可用于以特定方式组合和联合处理两个事件流。第一个流的事件被广播到一个算子的所有并行实例，该算子将它们保存为状态。另一个流的事件不广播，而是发送给同一个算子的单个实例，并与广播流的事件一起处理。对于需要连接低吞吐量和高吞吐量流或需要动态更新处理逻辑的应用来说，新的broadcast state非常适合。我们将使用一个具体示例来解释broadcast state，并在本文的其余部分更详细地展示其API。 Broadcast State下的动态模式评估想象一下，一个电子商务网站捕获所有用户的交互作为用户行为流。运营网站的公司有兴趣分析交互，以增加收入，改善用户体验，并检测和防止恶意行为。该网站实现了一个流应用，该应用检测用户事件流上的模式。但是，公司希望避免每次模式...

2019-06-27

742

资源下载

更多资源

腾讯云软件源

为解决软件依赖安装时官方源访问速度慢的问题，腾讯云为一些软件搭建了缓存服务。您可以通过使用腾讯云软件源站来提升依赖包的安装速度。为了方便用户自由搭建服务架构，目前腾讯云软件源站支持公网访问和内网访问。

Nacos

Nacos /nɑ:kəʊs/ 是 Dynamic Naming and Configuration Service 的首字母简称，一个易于构建 AI Agent 应用的动态服务发现、配置管理和AI智能体管理平台。Nacos 致力于帮助您发现、配置和管理微服务及AI智能体应用。Nacos 提供了一组简单易用的特性集，帮助您快速实现动态服务发现、服务配置、服务元数据、流量管理。Nacos 帮助您更敏捷和容易地构建、交付和管理微服务平台。

Sublime Text

Sublime Text具有漂亮的用户界面和强大的功能，例如代码缩略图，Python的插件，代码段等。还可自定义键绑定，菜单和工具栏。Sublime Text 的主要功能包括：拼写检查，书签，完整的 Python API ， Goto 功能，即时项目切换，多选择，多窗口等等。Sublime Text 是一个跨平台的编辑器，同时支持Windows、Linux、Mac OS X等操作系统。

WebStorm

WebStorm 是jetbrains公司旗下一款JavaScript 开发工具。目前已经被广大中国JS开发者誉为“Web前端开发神器”、“最强大的HTML5编辑器”、“最智能的JavaScript IDE”等。与IntelliJ IDEA同源，继承了IntelliJ IDEA强大的JS部分的功能。