冷热分治,DT时代的数据存储必由之路
爆炸式增长的数据如何处理?
60秒的时间内可以做那些事呢?打字员可以打80个字,YouTube的用户可上传长达72小时的视频……言归正传,60秒,也就是一分钟内在互联网上到底发生了什么事呢?
在一分钟内,邮箱用户总共发送了2.04亿封邮件,亚马逊官网上的销售额约达到了8.3万美元,再说说社交网络上,Facebook的用户约推送了246万条的内容,Twitter用户发推数量约为27.7万条……
在这组数字表象的背后,不知道你有没有发现需要哪些支撑?让我们简单算一下,按照目前3.2ZB的数据量,需要至少4.5亿台12盘位采用6T硬盘的服务器来支撑。但是按照现有资料来看,全球运行的服务器总量应该是5000万台左右,这其中有近一个量级的差距!而这是按照较高的存储密度来算,何况有大量的服务器是用于计算而非存储!
据分析称,全球产生的数据量中仅有1%左右的数据能够被保存下来!如何保存更多的数据?最简单方法当然是,采购更多的存储介质--磁带、光盘、硬盘、SSD等,但是如何选择存储介质则成为了另一大难点。
冷热分治,浪潮如何处理海量数据
Google所处理搜索查询是极热的数据处理,需要快速处理海量的并发,而Facebook所面临的挑战则是如何保存每天20万张照片。Youtube似乎面临的问题更为复杂,因为视频的热度不一。举个中国的例子,最近热播的电视剧与1983年的春晚录像相比,热播剧需要更低的延时,而早期春晚的录像则由于热度较低而成为冷数据。
数据量的爆炸式增长以及数据类型的日益细化,让数据分级和冷热数据分治成为降低单位容量数据成本、提升数据存储效率和密度的有效方式。在企业的数据中心中,只有10%~15%的数据是被经常访问的,IOPS要求100K 级别,剩余的则访问频率急剧下降,在10k甚至以下。既然需求不同,那么是不是能够将不同类型的数据存储在不同的介质上,以最大化运用存储的效率?
为了更进一步细分数据等级,能够更好分配资源和提高收益,浪潮按照数据读取的热度,将数据分为寒带、温带、亚热带和热带数据,并通过不同速率的存储介质和不同处理速度的CPU的配比,实现数据存储的成本最优,使数据存储更适合上层业务应用。
高IOPS满足热数据高速、频繁读取
随着数据量的持续增加,单位时间内需要处理的请求越来越多,SATA SSD也显得力不从心,SATA接口6Gb/s的限制已经成为发挥SSD性能的瓶颈,因此各厂商将目光转向拥有更高带宽的PCI-E。
目前主流的PCI-E 3.0 x16的传输速度已经可达16Gb/s,而最新的PCI-E 4.0 x16将能够达到32GB/s!实测数据显示,采用了新的NVM SSD技术优化PCI-E SSD的连续读取和写入速度已经达到惊人的2.8GB/s和2GB/s!IOPS已经突破450000,是SATA SSD的6倍,单位IOPS成本降低71%!
经过测试,在热数据处理应用中,采用PCI-E加速,性能将提升10倍,而投资将减少一半以上!
PCI-E接口打破了SSD存储速率上限,但其仍受到接口标准的限制。举个例子,假如你有一辆豪车,时速能到300迈,在乡间小道上,犹豫路窄且泥泞,你只能开到60迈,这就相当于SATA SSD;过了好久,终于开到了高速,由2车道变成6车道,但是路上车多,最高速限制120公里,这就相当于采用AHCI标准的PCI-E SSD;又开了一段时间,已经远离城市,来到荒无人烟的大草原,这里的标准就是自由,限制车速的就是豪车本身。
当然,这个例子并没有把NVMe的特性解释全面,其实相对于AHCI,原生PCI-E主控与CPU直连,并且精简了调用方式,因此延迟大大降低。由于将队列深度从32提升至64000,NVMe提升了SSD的IOPS。另外,采用NVMe标准后,解决了不同PCI-E SSD之间的驱动适用性问题。
目前浪潮互联网定制化服务器SA5112M4、SA5212M4均可支持 NVMe 。其中密度较高的1U机架服务器SA5112M4可支持 4片 NVMe SSD,提供 100k 级别 IOPS,满足极热数据的高并发访问需求,完美解决被数据频繁访问的问题。
平衡的计算与存储配比
对于亚热带数据,SATA SSD 的性能可以满足,且在目前来看价格与PCIe SSD相比仍有一定的差距,因此对于每天访问约几十遍的数据可以使用SATA SSD存储。所以浪潮服务器满足单节点最多配置 8 块 SATA SSD,单盘提供 10k 级别的 IOPS 响应能力。而温带数据相比热数据体量陡然增高,所以相比较需要成本更低的存储方案,使用Intel E5双路服务器+大容量SATA硬盘是主流的配置。但是,温带数据存储目前有了一种新的选择。
去年3月,Intel官方宣布了基于14nm的Xeon首款单芯片产品,家族命名"Xeon D"。Xeon D基于Broadwell-DE架构,是真正的SoC系统,不仅有处理器,还整合了内存、I/O等子系统,定位介于Atom与Xeon E3之间。
今年9月,浪潮在其第三届互联网应用技术峰会上,在业界率先发布了基于Xeon-D SoC处理器的一系列产品,专为温数据存储设计,低功耗和高集成度为构建高密度的云数据中心提供支持。此前,浪潮已经拥有1U8盘、2U12盘、4U36盘等较为完整的数据分级存储产品,这次发布的Xeon-D新品,将为温冷数据存储提供了更多的选择。
Xeon-D产品同样会在浪潮整机柜服务器SR中应用,在1U的空间内支持18块3.5英寸硬盘,单节点可扩展支持一个JBOD,存储密度提升的同时,可进一步降低了存储成本,且支持硬盘休眠,从而实现超低闲置功耗。
寒带数据,更注重容量和能效比
目前,PCI-E SSD也可以做到超大的容量,但是对于温数据和冷数据来说,性能是过剩的。对于冷数据采用SATA硬盘,就足够满足性能需求。以目前国内较大的云存储--金山云为例。借助小米用户的基础,金山云已成为全国最大的云存储服务提供商。预计未来可能每天新增1PB的内容,全年将有1000个PB内容需要存储!如此海量的数据,不仅需要足够的硬盘来存储,也需要大量的机柜以及交换机、负载均衡等网络层来支撑,大规模的服务器集群无疑会增加运维与管理方面的复杂度,使数据中心的TCO不断攀升。
在笔者看来,未来互联网数据中心的存储介质选择上,PCI-E SSD将逐步替代SATA SSD成为热数据和温数据存储的首选。而冷数据存储上,大容量低成本的SATA HDD还将是最具性价比的选择。浪潮根据互联网客户需求,推出业界首款基于SAS协议的资源池化产品--SAS Switch,将从机柜层面推动冷热数据分离,并简化存储设备运维难度!
本文转自d1net(转载)

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。
持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。
转载内容版权归作者及来源网站所有,本站原创内容转载请注明来源。
- 上一篇
云存储技术的发展现状和创新方向
起初,云存储作为在存储领域兴起的一种新技术,将复杂的存储架构和组织管理封装在系统内部,而对上层系统提供统一、灵活、安全的“云存储服务”,由此将存储建设从系统建设上升到服务建设,对于存储的关注也达到空前的高度。然而随着需求的不断加深,以及对“服务”定义的多元化,云存储技术也如落入平静湖面的石子,激荡出一层又一层的波澜。 一、云存储的现状与创新 在安防行业中,存储的存在形式较为多样,传统如DVR/NVR、SAN、NAS等。各种存储方案的存在均满足于安防行业特定场景变化的需要和受力于市场作用的结果。云存储技术作为存储技术中的一项重大革新,在安防行业中的多项场景应用中填补了空白,同时随着技术创新的不断深化,在传统建设领域上的应用上也出现的云存储的身影。 在满足小型视频监控的需求时,用户通常会倾向于DVR或者NVR,当规模再大一些时会使用SAN或者NAS存储方案。而随着规模的不断加大,庞大存储系统的整合、资源利用率的提升、存储服务获取和管理的便利性等方面传统存储方式的弊端也非常明显,而云存储的产品化应用无疑是行业中的亮点。 随着云存储技术的发展创新,以及对多种用户场景的兼顾和调整。云存储的创新方...
- 下一篇
NFV:业务须知
我们现在看到越来越多的技术功能被虚拟化,以简化操作并降低成本。网络也不例外,虽然网络比其他领域采用的速度更慢,但不可否认的是网络也正在被虚拟化。 网络功能虚拟化使得网络任务能够在商用硬件上运行的软件来执行,以取代昂贵的专用硬件设备。这有助于轻松扩展功能,有助于服务交付的自动化。 在电信领域,产品通常围绕着专用的硬件和软件建立,以保证可靠性最大化。这些带来的缺点的,新的产品和服务需要很长时间才能推向市场。 互联网服务的快速增长,以及随之而来的对按需流媒体服务、云存储和软件即服务模式的需求,使得企业不得不寻求更快的方式来创新网络产品。欧洲电信标准协会(ETSI)的网络功能虚拟化标准工作组(NFV ISG)在2012年发布了一份白皮书,为NFV的发展铺平了道路。该白皮书制定了一个框架,指导厂商和服务提供商引入新的技术。 NFV如何工作NFV架构由三个组件组成,分别是:虚拟网络功能(VNF)、网络功能虚拟化基础设施(NFVI)和NFV管理编排(MANO)。简单来说,VNF提供了网络功能的软件实现,NFVI是硬件和软件环境,MANO是通过其控制一切数据存储和接口。 VNF是将一些小组件链接到一起...
相关文章
文章评论
共有0条评论来说两句吧...
文章二维码
点击排行
推荐阅读
最新文章
- 设置Eclipse缩进为4个空格,增强代码规范
- SpringBoot2整合Redis,开启缓存,提高访问速度
- SpringBoot2初体验,简单认识spring boot2并且搭建基础工程
- Hadoop3单机部署,实现最简伪集群
- CentOS8编译安装MySQL8.0.19
- MySQL8.0.19开启GTID主从同步CentOS8
- SpringBoot2整合Thymeleaf,官方推荐html解决方案
- CentOS6,CentOS7官方镜像安装Oracle11G
- CentOS8安装MyCat,轻松搞定数据库的读写分离、垂直分库、水平分库
- SpringBoot2配置默认Tomcat设置,开启更多高级功能