首页 文章 精选 留言 我的
优秀的个人博客,低调大师

微信关注我们

原文链接:https://yq.aliyun.com/articles/203157

转载内容版权归作者及来源网站所有!

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。

四大云端大数据平台评测分析

当你已经准备好实施大数据,请仔细的评估云提供商提供的大数据功能,确保找到最合适的。下面我们来看一下四种云服务产品。 当谈到在云端实施大数据战略时,好消息是你会有很多选择。但是,这同时也是一个坏消息。来自Forrester Research最近的一份报告强调,尽管大数据云服务很强大,他们也有可能造成混乱,从而需要企业采用比传统的方式更加灵活,琐碎的方法。该报告的结论是:在云计算领域中没有一种服务是适合所有状况的。 最大的三家公有云平台—亚马逊Web服务(AWS)、微软的Azure和Google--提供了范围广泛的大数据服务,但每一种服务又完全不同。由于每个公司的大数据需求不同,技能集也不同,评估所有的平台来确保你获得的是正确组合的服务非常重要,Kirk Borne,乔治梅森大学的数据科学家,天文物理和计算科学教授同时也是一位知名的大数据专家这样建议道。 “任何大数据的实施都必须从你试图解决的问题开始,”Borne说。“你需要在花大把资金之前先了解企业的情况,确保你从可用的服务中选择正确的那个。” 下面来看下这三大主流云平台提供的大数据产品,以及第四家Altiscale,这是一家比较新的公...

《Scala机器学习》一一3.1 安装Spark

3.1 安装Spark如果读者还没有安装过Spark,可从http://spark.apache.org/downloads.html下载预先编译好的Spark包。在写本书时的发布版本为1.6.1。 图3-1 本章建议的下载链接http://spark.apache.org/downloads.html读者也可通过下面的链接下载完整的源代码来构建Spark: 命令将下载必要的依赖并在Spark目录中创建spark-2.0.0-SNAPSHOT-bin-alex-spark-build-2.6-yarn.tgz文件,其版本是2.0.0,这是在写本书时最新的发行版本。一般来说,如果不是对最新功能感兴趣,不建议从主分支进行构建。如果需要一个发行版本,可以从相应标签迁出(checkout)。通过git branch -r命令可以获得有效版本的

相关文章

发表评论

资源下载

更多资源
Mario

Mario

马里奥是站在游戏界顶峰的超人气多面角色。马里奥靠吃蘑菇成长,特征是大鼻子、头戴帽子、身穿背带裤,还留着胡子。与他的双胞胎兄弟路易基一起,长年担任任天堂的招牌角色。

Oracle

Oracle

Oracle Database,又名Oracle RDBMS,或简称Oracle。是甲骨文公司的一款关系数据库管理系统。它是在数据库领域一直处于领先地位的产品。可以说Oracle数据库系统是目前世界上流行的关系数据库管理系统,系统可移植性好、使用方便、功能强,适用于各类大、中、小、微机环境。它是一种高效率、可靠性好的、适应高吞吐量的数据库方案。

Apache Tomcat

Apache Tomcat

Tomcat是Apache 软件基金会(Apache Software Foundation)的Jakarta 项目中的一个核心项目,由Apache、Sun 和其他一些公司及个人共同开发而成。因为Tomcat 技术先进、性能稳定,而且免费,因而深受Java 爱好者的喜爱并得到了部分软件开发商的认可,成为目前比较流行的Web 应用服务器。

Eclipse

Eclipse

Eclipse 是一个开放源代码的、基于Java的可扩展开发平台。就其本身而言,它只是一个框架和一组服务,用于通过插件组件构建开发环境。幸运的是,Eclipse 附带了一个标准的插件集,包括Java开发工具(Java Development Kit,JDK)。