大数据时代下的备份与恢复革命
【大咖・来了 第7期】10月24日晚8点观看《智能导购对话机器人实践》
【51CTO.com快译】随着全球数据总量的爆炸式增长,我们必须改变对相关信息的保护方式。
过去五年以来,应用程序的规范已经迎来彻底转变。如今,我们需要在应用当中实现更多敏捷性、可扩展性与可用性要求。在如今这个时代,应用的主要趋势开始转向社交平台、移动设备与软件即服务(简称SaaS)。另外,其需要有能力从各种来源处获取批量数据,同时实时处理以提供背景信息或者业务洞穴能力,借此建立竞争优势。为了满足这些新型需求,企业无法再单纯依赖于传统关系型数据库。有鉴于此,一系列新型数据库系统应运而生,其本质上具备分布式与横向扩展特性,能够被部署在商用硬件之上,同时提供可协调的统一性与性能调整机制。更重要的是,为了满足敏捷性需求,云端数据库即服务模式亦得到广泛采用。
为了帮助大家理解这场分布式数据库变革的规模之大,我们整理出了以下图表,可以看到NoSQL类搜索数量正呈现出急剧上升之势。
这意味着数据保护要求已经彻底改变,且受到数据至上时代的大力推动(包括Web规模应用以及分布式数据库)。企业需要收集大量数据并从中获取有价值信息,用以带来更为可观的商业价值以及更为迅捷的决策制定能力。大部分分布式与云数据库已经提供复制功能,用于满足数据保护及可用性要求。然而,我们仍然需要解决可扩展时间点备份与恢复这一重大难题。如果没有时间点备份的支持,企业将时刻面临着因人为错误、逻辑损坏或者其它运营故障造成的数据丢失风险。
传统备份解决方案主要面向关系型数据库设计,即面向共享式存储并采用ACID事务模型。遗憾的是,这类设计无法满足分布式场景下的时间点备份要求(包括本地存储、最终一致性以及基础设施的弹性特质)。
考虑到数据库架构已经发生本质性转变,数据保护举措亦需要进行重新定义与重新设计。以下为数据保护在大数据时代下面临的新挑战:
·获取最终一致性数据库的一套持久性时间点备份副本,我们将其称为当前全新分布式时代下数据保护的“版本控制”新规范:备份到快照到复制到复制数据管理再到版本控制。
·***程度降低故障恢复时间(即低RTO)。
·随应用程序的实际需求进行规模扩展。
·允许轻松更新测试/开发环境以实现持续开发。
·在发生故障时提供运营弹性。
·提供立足于公有云或者内部数据中心的部署灵活性。
大多数企业正在积极投资企业级时间点备份与恢复产品,从而确保自身能够安心在分布式数据库之上部署并扩展下一代应用程序。在未来五年内,各企业将重新定义数据保护技术,从而切实满足下一代应用的实际需要。
原文题目:The Evolution of Backup and Recovery: The Big Data Era,作者:Jeannie Liou
【51CTO译稿,合作站点转载请注明原文译者和出处为51CTO.com】
点赞 0
低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。
持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。
转载内容版权归作者及来源网站所有,本站原创内容转载请注明来源。
- 上一篇
window + nginx-rtmp + php-cgi 服务器搭建
【大咖・来了 第7期】10月24日晚8点观看《智能导购对话机器人实践》 1、首先需要准备的应用程序包。 nginx : nginx-rtmp-win32 或 nginx/Windows-1.0.4 (无rtmp模块) php:php-5.2.16-nts-Win32-VC6-x86.zip (nginx下php是以FastCGI的方式运行,所以我们下载非线程安全也就是nts的php包) RunHiddenConsole: RunHiddenConsole.zip(用于cmd 非阻塞运行进程) 2、安装与配置。 1)php的安装与配置。 直接解压下载好的php包,到D盘wnmp目录(D:wnmp),这里把解压出来的文件夹重命名成php5。进入文件夹修改php.ini-recommended文件为php.ini,并用Editplus或者Notepad++打开来。找到 扩展目录(去掉注释) ;extension_dir="ext" mysql 扩展(去掉注释) ;extension=php_mysql.dll ;extension=php_mysqli.dll 前面指定了php的ext路径后...
- 下一篇
构建一套成功大数据基础设施需要遵循的七项要诀
【大咖・来了 第7期】10月24日晚8点观看《智能导购对话机器人实践》 【51CTO.com快译】 无论从硬件还是软件角度出发,您面向大数据构建的基础设施都会对所支持大数据系统的分析与操作带来巨大影响。在今天的文章中,我们将了解七项重要的大数据架构设计原则。 大数据不仅是Hadoop 在大多数人的理解当中,大数据与Hadoop几乎可以等而论之。事实上,大数据远不止Hadoop这么简单。Hadoop是一套文件系统(而非数据库),其负责将数据传播至成百上千个处理节点当中。其之所以在大数据应用中广泛出现,是因为作为文件系统,它能够很好地处理非结构化数据——甚至包括一些看起来根本不算是数据的素材。 Hive与Impala将数据库引入Hadoop 下面聊聊大数据世界中结构化数据部分的对应数据库选项。如果大家希望以明确次序管理Hadoop数据平台,那么Hive应是***选项。这是一款基础性结构工具,允许大家在非SQL Hadoop当中执行SQL类操作。 如果大家的一部分数据能够轻松旋转在结构化数据库当中,那么Impala则更为合适——除了自身功能外,它还能够直接利用您已经开发出的Hive命令。Ha...
相关文章
文章评论
共有0条评论来说两句吧...
文章二维码
点击排行
推荐阅读
最新文章
- Mario游戏-低调大师作品
- Docker安装Oracle12C,快速搭建Oracle学习环境
- CentOS6,CentOS7官方镜像安装Oracle11G
- CentOS关闭SELinux安全模块
- Docker使用Oracle官方镜像安装(12C,18C,19C)
- Jdk安装(Linux,MacOS,Windows),包含三大操作系统的最全安装
- Linux系统CentOS6、CentOS7手动修改IP地址
- CentOS7安装Docker,走上虚拟化容器引擎之路
- SpringBoot2初体验,简单认识spring boot2并且搭建基础工程
- Docker快速安装Oracle11G,搭建oracle11g学习环境