实战 | 利用Delta Lake使Spark SQL支持跨表CRUD操作
本文转载自公众号: eBay技术荟
作者 | 金澜涛
原文链接:https://mp.weixin.qq.com/s/L64xhtKztwWhlBQrreiDfQ
摘要
大数据处理技术朝传统数据库领域靠拢已经成为行业趋势,目前开源的大数据处理引擎,如Apache Spark、Apache Hadoop、Apache Flink等等都已经支持SQL接口,且SQL的使用往往占据主导地位。各个公司使用以上开源软件构建自己的ETL框架和OLAP技术,但在OLTP技术上,仍然是传统数据库的强项。其中的一个主要原因是传统数据库对ACID的支持。具有ACID能力的传统商用数据库基本都实现了完整的CRUD操作。而在大数据技术领域,由于缺少ACID的支持,基本只实现了C/R操作,对U/D操作很少涉及。
eBay数据仓库的部分基础设施是构建在商用数据产品Ter
低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。
持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。
转载内容版权归作者及来源网站所有,本站原创内容转载请注明来源。
- 上一篇
每当我想放弃 Scala,我就写写 Python 和 Java
云栖号资讯:【点击查看更多行业资讯】在这里您可以找到不同行业的第一手的上云资讯,还在等什么,快来! 我的一位朋友最近在推特上表示:公众对 Scala 编程语言的兴趣似乎已经趋于稳定或减弱,这与我的感受一致。这篇博文将会讨论为什么会发生这种情况,并且聊聊 Scala 现在的地位以及 Scala 社区的未来。 本文最初发布于 Li Haoyi 的个人博客,经原作者授权由 InfoQ 中文站翻译并分享。 本文受下面这条推特启发:看到 Typesafe/Lightbend(注:Scala 的技术推广公司)的朋友被解雇是一件很遗憾的事情,但正如我一直说的,免费的东西很难卖出去。 我很想知道 Scala 现在的采用情况。它没死,但似乎在 2016 年就达到了热度的顶峰。不过我没有任何数据支持这个观点。——Jamie Allen Jamie 注意到,公众对 Scala 编程语言的兴趣似乎已经减弱了:对 Meetup 的兴趣减少了,对会议的兴趣减少了... 这或多或少跟我的观察一致。尽管面向 Scala 爱好者的 Scala 专门会议仍然很热门(或者说在新冠疫情之前,曾经很热门),但我认为毫无疑问,在...
- 下一篇
4月 Gartner 企业级网络设备市场份额报告:阿里云负载均衡增速全球第一
4月8日,Gartner发布最新的全球企业级网络设备市场份额报告,阿里云负载均衡(SLB)增速全球第一,单季度营收环比增长35.1%,远超欧美云服务厂商。 负载均衡被誉为IT系统的流量管家,它可以通过调度算法将流量平均分配到不同的服务器,是解决网络拥堵问题的关键技术之一。 (阿里云SLB环比增速全球第一) Gartner报告显示,传统负载均衡整体市场份额逐步下滑,以阿里云为代表的云原生负载均衡服务商市场份额正在快速上升,作为唯一上榜的亚洲云服务商,阿里云单季度环比增长35.1%,相比之下,传统负载均衡厂商F5营收则下降12.5%。 企业使用传统负载均衡服务需要专门购买硬件,价格昂贵、部署周期长、运维门槛高而且服务器连接数有限。云原生负载均衡先天拥有云的优势,拥有更强的性能,可从容应对亿万级高并发流量场景,已经成为企业应对大规模流量的首选。 据悉,阿里云SLB基于底层基于自研虚拟网络技术飞天洛神,可为企业提供强大的流量调度能力和弹性能力;此外,为满足大流量场景的需求,阿里云率先在业界通过软硬件结合技术,对最新的100G网卡硬件特性进行了深度定制,高并发流量完全由硬件处理,将SLB性能发挥...
相关文章
文章评论
共有0条评论来说两句吧...
文章二维码
点击排行
推荐阅读
最新文章
- Eclipse初始化配置,告别卡顿、闪退、编译时间过长
- SpringBoot2整合MyBatis,连接MySql数据库做增删改查操作
- SpringBoot2整合Thymeleaf,官方推荐html解决方案
- SpringBoot2整合Redis,开启缓存,提高访问速度
- CentOS8编译安装MySQL8.0.19
- Docker使用Oracle官方镜像安装(12C,18C,19C)
- CentOS7,8上快速安装Gitea,搭建Git服务器
- Docker安装Oracle12C,快速搭建Oracle学习环境
- Springboot2将连接池hikari替换为druid,体验最强大的数据库连接池
- Windows10,CentOS7,CentOS8安装Nodejs环境