阿里巴巴如何打造“EB级计算平台存储引擎”?
阿里妹导读:MaxCompute是阿里EB级计算平台,经过十年磨砺,它成为阿里巴巴集团数据中台的计算核心和阿里云大数据的基础服务。MaxCompute的存储引擎基于开源的Apache ORC文件格式,打造了新一代列存文件格式AliORC。本文整理自阿里巴巴MaxCompute西雅图团队的高级技术专家吴刚的专访,将为大家介绍AliORC的核心技术,同时分享作为Apache ORC开源社区PMC的心得和一些个人成长经历。
一、MaxCompute平台存储引擎背景
阿里云大数据计算服务( MaxCompute,原名 ODPS )是阿里云提供的一种安全可靠、高效能、低成本、从GB到EB级别按需弹性伸缩的在线大数据计算服务。MaxCompute 不仅仅是一个计算平台,也承担着大数据的存储。阿里巴巴集团99%的数据存储都基于 MaxCompute
