大数据和云计算的冲突
【大咖・来了 第7期】10月24日晚8点观看《智能导购对话机器人实践》
最近,IT行业专家在参加相关会议时发现了一个隐藏的主题,那就是虽然很多人将关注的重点转移到基于云计算的架构(混合云)以及所需要的云管理平台,但会议的报告表明,很多人都承认并没有密切关注全球数字数据量的巨大增长。
存储供应商PureStorage公司的演讲报告引用了其他两家供应商的两个数据点:首先,思科公司2017年6月发布的白皮书“Zettabyte时代:趋势与分析”推断了互联网带宽的增长。其次是由希捷公司委托IDC公司进行研究的调查报告“数据时代2025”推测了全球数据增长的趋势。PureStorage公司结合了这两家公司的推断,得出了结论。如下图所示。
PureStorage公司的报告描述了全球数据增长和全球互联网带宽增长之间的冲突
如果这些趋势成为现实,并且有足够的理由认为这些预测是合理的,那么这些趋势将在未来几年对计算和数据格局产生重大影响。并将对云计算的应用产生特别的影响。注意:云计算是真实的,将成为未来IT环境的重要组成部分,但是IT部门认为它是一种灵丹妙药这种简单化的想法,会让人想起当初网络热潮的破灭。而人们知道将会有什么样的结果。
不能回避的问题
无论如何,所有IT都有两个核心要素:数据与数据的逻辑。每个使用大数据的人都知道:要使用大量的数据,首先需要对数据进行处理,而其处理都会产生一个传输瓶颈,并严重影响其性能,并且这种逻辑的任何功能都变成纯粹的理论。
即使有少量的数据,这也可能是因为延迟而发生。例如,企业将其应用程序服务器迁移到云端,同时将数据库服务器保留在本地,这可能在理论上可行,但是当应用程序对数据库与数据库之间的网络延迟敏感时,就根本不起作用。对于少量的数据来说,情况就是如此。这就是为什么许多组织都在尝试调整软件的原因,使其对延迟的敏感度降低,从而能够进入云端。但是,如果数据量很大,则需要将数据处理和数据彼此靠近,否则就无法工作。企业增加对大量并行性的需求来处理这些数据,并获得Hadoop和其他处理大量数据问题的体系结构。
现在,全球的数据量呈指数增长。如果IDC公司的推测成为事实的话,那么在几年的时间里,全世界将存储大约50ZB的数据。另一方面,虽然互联网传输数据的总容量也在增长,但增长速度更为缓慢。在全球数据量增长到50ZB的同一时期,互联网总带宽将达到每年2.5ZB(如果思科的推断成为事实的话)。
从这两个推断(并不是不合理的)中得出的结论是,全球可用的互联网带宽远远不能满足移动大量数据的需求。而且这也忽略了目前大约80%的带宽用于流媒体视频的事实。因此,即使企业已经针对核心应用程序中的延迟问题编写了代码,对于数据量较大的情况,也会出现带宽问题。
现在这个隐患实际上成为了一个问题吗?如果处理或使用这些数据在本地部署的数据中心发生的话,也就是说在同一个数据中心中存储数据。但是,一方面,数据量呈指数增长,另一方面,全球各行业也在积极寻求云战略,就是把将所有类型的工作负载都迁移到云端,即使是“无服务器”(例如,AWS Lambda),这样的做法也是绝对极端的。
假设只有小规模的结果(从庞大的数据集中计算出来)也许会有所帮助,因为大量数据的实际价值来自它们的结合。这可能意味着将来自不同所有者的数据(例如企业的客户记录与来自Twitter的数据)结合起来。而这所有不同的集合将会成为一个难题。
所以,人们看到的是两个相反的事态发展。一方面,人们都忙于适应基于云的体系结构,这种体系结构最终是基于分布式数据的分布式处理。另一方面,人们使用的数据量越来越大,必须将数据和处理整合到一个物理位置。
那么这意味着什么?
人们可以预期,Hadoop在应用程序架构层面所做的工作也将在全球范围内发生:庞大的数据集将成为使数据的逻辑具有意义的吸引力。而那些庞大的数据集将会被吸引到一起。
举个例子:许多公司现在都在努力减少移动数据的需求。因此,在物联网领域有很多关于边缘计算的讨论:本地处理传感器和其他物联网设备的数据。当然,这也意味着处理过程也必须是本地化的,可以放心地假设一下,企业不会在一组传感器中拥有同样的计算能力,而不是在大分析中可以做到的设置。或者:也许自主驾驶汽车的数据很可能不会再采用Hadoop集群,而可以通过这种方式来最小化数据流量,但以计算量为代价。
这个问题还有另一个解决方案:与数据中心结合在一起。数据中心托管提供商提供的服务正在崛起。他们提供具有优化内部流量功能的大型数据中心,云计算提供商和大型云用户的服务器都在一起。从逻辑上讲,用户的业务可能在云端,但实际上与云计算服务提供商在同一处所。
企业不仅想在AWS或Azure上运行其逻辑数据,也想在数据中心这样做,企业也有自己的私有数据湖,所以所有的数据都在本地处理,数据聚合也在本地。但是数据中心托管模式是另一种可能的解决方案,用于解决因数据呈指数级增长而带来的带宽和延迟问题。
情况可能不像那两个调查报告描述的那样可怕。例如,所有数据的实际平均波动率最终将非常低。另一方面,企业不希望在陈旧的数据上运行分析。但是可以得出一个结论:简单地假设企业可以将其工作负载分配给不同的云提供商是有风险的,尤其是如果同时处理的数据量(如果企业都想把他们自己的数据与来自Twitter、Facebook的数据流结合起来,那么更不用说这些组合产生了各种各样的新数据流)。
因此,企业对数据和处理的位置做出良好的战略设计决策是成功的关键。
低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。
持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。
转载内容版权归作者及来源网站所有,本站原创内容转载请注明来源。
- 上一篇
出海印度 云计算厂商需要了解哪些政策?
【大咖・来了 第7期】10月24日晚8点观看《智能导购对话机器人实践》 印度云计算蓬勃发展 云计算改变了政府、企业和消费者处理与管理数据资源的方式。在印度,云计算为产业的发展提供了巨大潜力,并正在开辟新的机会窗口。零售、铁路、制造业、银行、教育和医疗保健等行业已经开始转移他们的内部部署到云服务。IaaS在印度云服务中贡献***,支出达到了1048万美元,根据Gartner的报告 ,印度53%的机构表示他们正在使用云服务。印度云服务市场规模在2015年达到了10.8亿美元。IT、电信、银行、金融服务和保险、制造业和政府部门对云服务市场贡献***,占据近78%的市场份额。Forrester预测,SaaS市场在2014年至2020年之间将会增加一倍的价值,达到12亿美元。2018年,印度的SaaS支出将达到7.35亿美元(2.49亿美元,2014年),IaaS将达到2.95亿美元。TechSci研究报告指出,印度云服务市场从2015年到2020年的复合年增长率(CAGR)将达到22%.目前,在印度寻求信息技术外包服务的组织越来越多,转向公共云服务替代传统信息技术外包。 总体来说,印度目前云计...
- 下一篇
2018年或成为云计算转折之年:IaaS整合 PaaS崛起 SaaS蓄势
【大咖・来了 第7期】10月24日晚8点观看《智能导购对话机器人实践》 回望2017年的云计算市场不难发现,这是云计算深入应用到各个行业企业的一年,被誉为是云计算的收获期;进入2018年,云计算的应用将会进一步加速,但在不同的云计算层面,依然会有一些新的趋势透露出来。 在笔者看来,从云计算传统的IaaS、PaaS和SaaS三个层面来看,将会呈现出不同的发展态势:IaaS整合,PaaS崛起,SaaS蓄势。但从另外一个角度看,云计算的发展将进入新一轮技术转折期,在这个转折期,传统的三层分类已经不再适用,而是要细分到更加具体的技术领域,比如:对象存储、OpenStack、容器、DevOps、微服务、人工智能(SaaS应用)…… 这样的发展也恰恰遵从了技术与应用彼此交替发展的规律:技术的发展日趋成熟,应用将会随之崛起,但应用的深入又会对技术创新提出新的要求,从而推动技术的继续发展。 抛开这些新的技术细分领域不谈,只从大的趋势上看,为什么说IaaS整合、PaaS崛起、SaaS蓄势呢? IaaS马太效应开始显现 不管是在中国的公有云市场还是在全球的公有云市场,马太效应都已经开始显现。全球范围内,亚...
相关文章
文章评论
共有0条评论来说两句吧...
文章二维码
点击排行
推荐阅读
最新文章
- Windows10,CentOS7,CentOS8安装MongoDB4.0.16
- CentOS7,CentOS8安装Elasticsearch6.8.6
- CentOS8安装Docker,最新的服务器搭配容器使用
- SpringBoot2整合Redis,开启缓存,提高访问速度
- CentOS8安装MyCat,轻松搞定数据库的读写分离、垂直分库、水平分库
- CentOS7编译安装Gcc9.2.0,解决mysql等软件编译问题
- Springboot2将连接池hikari替换为druid,体验最强大的数据库连接池
- MySQL8.0.19开启GTID主从同步CentOS8
- Jdk安装(Linux,MacOS,Windows),包含三大操作系统的最全安装
- CentOS7编译安装Cmake3.16.3,解决mysql等软件编译问题