实现Spark部署 依赖供应商还是"自力更生"?
【大咖・来了 第7期】10月24日晚8点观看《智能导购对话机器人实践》
Apache Spark用户经常面临一个困境:继续获取来自供应商的支持还是更新版本,使用具有更新功能的快速移动的开源软件?
Novantas公司将Spark数据处理引擎作为商业Hadoop发行版的一部分。这样使得分析服务和软件提供商与Spark版本的Hadoop软件包支持的Spark版本捆绑在一起,因此,它不一定能立即访问新的Spark功能
例如,Novantas在今年年初开发的基于Hadoop的应用程序中使用了Spark 1.4,以帮助银行的分析团队在内部系统中找到相关的客户和财务数据。该版本由Apache软件基金会于2015年6月发布,去年9月被Spark 1.5取代,1月被1.6取代。但是要升级,Novantas将不得不通过Cloudera放弃Spark支持。
“我们不想使用不受支持的版本,”纽约公司Novantas解决方案技术部门CTO和工程总监Kaushik Deka说。这是因为应用程序是该部门***次真正使用Hadoop和Spark。坚持使用Spark 1.4不太理想。Deka说,他希望当Novantas移动到一个新的技术版本可以解决问题。
这样的考虑在大数据环境中是常见的,其通常涉及以快速的速度更新的开源技术。Spark的情况尤其突出:在2014年7月到2016年7月之间,通过Apache共有18个版本,Spark 2.0版本一般都可以使用。
为了更好地使用新功能,一些组织已经避开了供应商提供的Spark支持,并自行部署了基本的Apache Spark软件。
例如,Synchronoss技术公司在2014年从Hadoop供应商MapR获得Spark。但移动管理公司Bridgewater的大数据分析平台高级主管Suren Nathan表示,公司有时直接升级到Apache Spark的新版本,以获得所需的功能。“现在,我的团队可以非常熟练地使用Spark,”他说。
Webtrends公司也一直使用基本的Spark软件。“我们正试图尽可能保持现有的发布,”来自美国的在线活动跟踪公司***技术官Peter Crossley说,“市场上没有其他技术像这种技术一样快。”
Crossley表示,他更喜欢通过Hadoop供应商Hortonworks获得支持的Spark版本。为了尽可能做到这一点,他的团队与Hortonworks合作开发了一个“双轨发布计划”,供应商去年3月加快了Sparkand与Hadoop相关的其他大数据技术的交付。

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。
持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。
转载内容版权归作者及来源网站所有,本站原创内容转载请注明来源。
- 上一篇
重磅!2017大数据十大趋势
【大咖・来了 第7期】10月24日晚8点观看《智能导购对话机器人实践》 2017年大数据将不再是Hadoop一家独大,也不再是编程者们的自娱自乐,企业和终端用户的不断涌入,海量数据“堆积如山”,随之而来的储存、分析、处理成为从业者的下一挑战。 随着对不同类型、不同体量数据的结构化存储、批量处理以及价值挖掘需求的增多,2016年注定是大数据里程碑式的一年。 2017年,支持大量结构化和非结构化数据的系统将继续增长。市场需要数据平台来帮助数据管理人员管理和保护大数据,同时允许最终用户进行数据分析。这些系统将逐步成熟,在企业内部的IT系统中更好地运行。 1、数据处理变得更加快速,数据也变得更加易于使用 选项扩展将加速Hadoop 当然,你可以在Hadoop上执行机器学习和情绪分析,但人们常常会问的***个问题是:交互式SQL(结构化查询语言,一种数据库查询和程序设计语言,用于存取数据以及查询、更新和管理关系数据库系统)究竟有多快?毕竟,SQL相当于企业用户的“导管”——他们希望使用Hadoop数据来更快的获得可复用的BI仪表盘(一种向企业展示度量信息和关键业务指标即KPI现状的数据虚拟化工具...
- 下一篇
解读Wikibon 2017年大数据分析预测报告
【大咖・来了 第7期】10月24日晚8点观看《智能导购对话机器人实践》 Wikibon最近完成了2017年大数据全球预测,该报告的作者是Wikibon分析师George Gilbert,以及Wikibon的Ralph Finos和Peter Burris,涉及到大数据的市场规模、增长和趋势等。 解读Wikibon 2017年大数据分析预测报告 今年,我们把重点放在构建实现大数据成果所必需的战略业务能力来说最重要的大数据软件技术上。下面是该报告主要的一些研究发现: – 2016年,全球大数据硬件、软件和服务整体市场增长22%达到281亿美元,让大数据成为技术领域更具吸引力的领域之一。 – 我们的模型显示,到2027年期间,在大数据硬件、软件和服务上的整体开支的复合年增长率为12%,将达到大约970亿美元,而这主要是受到了大数据软件的推动。 – 不过,即使大数据仍然是企业关注热点,但是严重的问题也使得大数据市场出现了一些黯淡之处。特别是,大数据项目的故障率很高,甚至是信息技术标准。 – 大数据市场正在快速变革,以应对项目故障率较高的问题。正如我们所预测的,对基础设施的关注正在转移到对使用实...
相关文章
文章评论
共有0条评论来说两句吧...
文章二维码
点击排行
推荐阅读
最新文章
- Jdk安装(Linux,MacOS,Windows),包含三大操作系统的最全安装
- CentOS8,CentOS7,CentOS6编译安装Redis5.0.7
- CentOS6,7,8上安装Nginx,支持https2.0的开启
- CentOS关闭SELinux安全模块
- 2048小游戏-低调大师作品
- Windows10,CentOS7,CentOS8安装MongoDB4.0.16
- 设置Eclipse缩进为4个空格,增强代码规范
- CentOS8安装MyCat,轻松搞定数据库的读写分离、垂直分库、水平分库
- Docker快速安装Oracle11G,搭建oracle11g学习环境
- SpringBoot2全家桶,快速入门学习开发网站教程