应对Hadoop选择困难症 四大产品特征值得关注
虽然构成Hadoop生态系统堆栈均为开源技术,但是为使用商业Hadoop平台而支付一定的订阅费用还是大有裨益的。例如,订阅后提供技术支持和培训,而且会开放企业级功能,而这些功能是不向开源社区提供的。 虽然厂商Hadoop发行版的企业版本都提供了Hadoop生态系统堆栈的核心组件,但是这些厂商提供的超越公开可访问功能的部分才是其关键优势。 最近市场弱化了Hadoop厂商的层级。例如,就在本月,Pivotal Software取消了其自身的Hadoop发行版并宣布会转售Hortonworks作为替代。但是仍有很多不同的厂商需要考虑,包括独立Hadoop专家,云厂商和 本文根据几个主要特征将顶级Hadoop发行版进行了区分,帮助你决定哪家Hadoop厂商才是最适合你所在的企业;这些特征包括部署模型,企业级功能,安全性和数据保护功能,以及支持服务。 请注意虽然Hadoop大数据管理生态系统是设计来支持可扩展数据存储和高性能分布式计算的,但实际性能可能会因多个原因而有所不同,包括软件的实现。但是很多性能问题都依赖于计划应用程序本身。要解决这一问题,我们将进一步研究Hadoop产品发行版是如何来满...