MaxCompute技术人背后的故事:从ApacheORC到AliORC
2019大数据技术公开课第一季《技术人生专访》来袭,本季将带领开发者们探讨大数据技术,分享不同国家的工作体验。本文整理自阿里巴巴计算平台事业部高级技术专家吴刚的专访,将为大家介绍Apache ORC开源项目、主流的开源列存格式ORC和Parquet的区别以及MaxCompute选择ORC的原因。此外,吴还将分享他是如何一步步成为Apache开源项目的Committer和PMC的。
以下内容根据演讲视频以及PPT整理而成。
个人简介
吴刚,阿里巴巴计算平台事业部高级技术专家 ,Apache顶级开源项目ORC的PMC ,目前主要负责MaxCompute平台存储线 相关工作。之前就职于Uber总部,从事Spark和Hive等相关工作。
一、Apache ORC项目介绍以及阿里巴巴对于ORC项目的贡献
Apache ORC Project
正如Apa
低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。
持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。
转载内容版权归作者及来源网站所有,本站原创内容转载请注明来源。
- 上一篇
图数据库 Nebula Graph 在 HBaseCon Asia2019 的分享实录
Nebula Graph:一个开源的分布式图数据库。作为唯一能够存储万亿个带属性的节点和边的在线图数据库,Nebula Graph 不仅能够在高并发场景下满足毫秒级的低时延查询要求,还能够实现服务高可用且保障数据安全性。 本篇导读 HBaseCon Asia2019 活动于 2019 年 7 月 20 日于北京金隅喜来登酒店举办,应主办方邀请,Nebula Graph 技术总监-陈恒在活动中发表演讲“Nebula: A Graph DB based on HBase” 。本篇文章是根据此次演讲所整理出的技术干货,全文阅读需要 30 分钟。 大家下午好,我是陈恒,来自 VESoft,是开源图数据库 Nebula Graph 的开发者。同时,我也是 HBase 的 Commiter(刚才在后面和各位大佬谈笑风生),今天和大家分享的,是我们最近刚开源的分布式图数据库 Nebula Graph。 Nebula Graph 简要介绍 首先,介绍一下我们公司:欧若数网科技有限公司(英文名:VESoft),是 2018 年 10 月份成立的。我们的核心产品是分布式图数据库 Nebula Graph,...
- 下一篇
【降价信息】云HBase X-Pack最高降价31%,再次释放大数据处理红利
一、降价时间:北京时间7月16日降价内容:阿里云中国站云HBase X-Pack中的Spark服务将于2019年7月16日进行价格下调。本次降价策略覆盖国内北京、上海、杭州、深圳、张北。具体优惠详见下表: 规格 降幅 4CPU 8G 31% 8CPU 16G 31% 16CPU 32G 31% 32CPU 64G 31% 4CPU 16G 11% 8CPU 32G 11% 16CPU 64G 11% 32CPU 128G 11% 二、X-Pack Spark服务X-Pack Spark为HBase、RDS、MongoDB、Redis等服务提供复杂分析、流式处理及入库、机器学习等能力,从而更好的解决大数据处理等场景问题。帮助文档、购买入口
相关文章
文章评论
共有0条评论来说两句吧...