阿里云 DataLakeAnalytics 团队招人啦!
团队介绍
我们是阿里巴巴集团数据库事业部的OLAP 平台团队,我们专注于提供全球领先的全栈式大规模OLAP产品,目前在阿里集团、公共云、专有云提供了分析型数据库AnalyticDB、时间序列数据库HiTSDB, 数据湖分析引擎: DataLakeAnalytics 等多个产品,得到了大规模应用。每天数据写入记录数在万亿级,查询请求十亿级。
岗位描述
在Data Lake Analytics团队,如果你追求技术,你是幸运的,因为在这里,你接触的面很广,云计算的各层技术,从IaaS、PaaS、DBasS、SaaS到FaaS,从网络、存储、计算到虚拟化,或用、或优化、或设计、或开发,你不会out!数据库的多个方面,从JDBC protocol、SQL parser、optimizer、MPP runtime execution到meta st
低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。
持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。
转载内容版权归作者及来源网站所有,本站原创内容转载请注明来源。
- 上一篇
Compression压缩
压缩所带来的好处,磁盘、IO,都来带来很多好处,同时也有很多的弊端。 查看自己的hadoop机器是否支持压缩命令 ./hadoop checknatice 如果压缩格式后面全是false,说明Hadoop是没有编译过的。 生产环境经常用的集中压缩 gzip 、 bzip2 、LZO、Snappy 先来看下他们之间的区别,主要体现在压缩比率、压缩与解压速度、是否支持分割等方面 Format extention 压缩比到 是否支持分割 Gzip .gz 40% NO Bzip2 .bz2 30% yes LZO .lzo 50% yes if indexed(前提是有索引) Snappy .snappy 50% NO 而对于我们刚刚说的速度问题,压缩比越高,压缩速度就越慢,成反比,这里就不在列图了。 下面来看下为什么要看是否支持分割呢,我们知道不管是mapreduce还是spark都会有map和reduce还有shuffer的过程, 假如一个1G的文件使用Gzip压缩后,大概是400M左右,执行mapre...
- 下一篇
有哪些Java源代码看了后让你收获很多?
曾经读过Erudika/para的源码,此源码托管在github,大致是2014年前后开源的云计算通用后端框架,基于spring boot体系,原生集成持久化(默认H2 DB,通过配置方式实现MongoDB、mysql等常用关系数据库的支持)、缓存(默认Caffeine、支持配置参数的Hazelcast、redis等)和搜索(默认Lucene,支持配置参数的Elasticsearch)三大功能,快速开发resful风格的API接口,其强大的分层思想和通用性设计能力,让我的架构思维有了很大的进步,其开源版本对于中小团队实践spring boot+spring cloud打通云计算服务具有借鉴意义,目前最新的版本为1.29.1。 下面,我就简单的分享Erudika/para源码官网的介绍,解释不到位的地方希望大家批评指正,同时,这款较为优秀的开源项目也推荐给大家去学习和使用。 特性: 多租户技术【多重租赁技术】支持——每个应用程序都有自己的表、索引和缓存; 用Amazon的签名算法进行安全的JSON; 数据库动态性,专为可伸缩和分布式数据存储而设计 全文搜索(Elasticsearch)...
相关文章
文章评论
共有0条评论来说两句吧...
文章二维码
点击排行
推荐阅读
最新文章
- Docker安装Oracle12C,快速搭建Oracle学习环境
- Windows10,CentOS7,CentOS8安装MongoDB4.0.16
- CentOS8编译安装MySQL8.0.19
- MySQL8.0.19开启GTID主从同步CentOS8
- CentOS8安装Docker,最新的服务器搭配容器使用
- CentOS8,CentOS7,CentOS6编译安装Redis5.0.7
- SpringBoot2整合Redis,开启缓存,提高访问速度
- CentOS7,8上快速安装Gitea,搭建Git服务器
- Docker使用Oracle官方镜像安装(12C,18C,19C)
- CentOS关闭SELinux安全模块