阿里云发布国内首个混合云大数据双活容灾服务
在6月上旬举行的云栖大会上海峰会上,阿里云发布了国内首个混合云大数据集群双活容灾产品-混合云容灾服务下的大数据容灾服务(HDR for Big Data,简称 HDR-BD),并已经在7月份开始邀测。采用业界领先的数据双向实时复制技术,HDR-BD可以实现Hadoop集群双活和准0 RPO容灾,为大数据灾备制定了全新的标准。
常见Hadoop灾备技术的挑战
当前比较常见的Hadoop集群灾备方式是用distcp将数据定期复制到一个备用集群做容灾用途,或者将数据复制到只读集群、二级存储作为备份。这些方案都有明显弱点:
- RPO大:distcp 的原理决定了期数据复制不能是实时的,用户必须承受小时到天级的RPO
- RTO长:主站宕机后,将只读集群或二级存储中的数据恢复出来会占用大量时间,而拉起standby集群重新启动业务依然是一个耗时的操作
- 资源