《Spark大数据处理:技术、应用与性能优化》——1.5 Spark的企业级应用
本节书摘来自华章计算机《Spark大数据处理:技术、应用与性能优化》一书中的第1章,第1.5节,作者:高彦杰 更多章节内容可以访问云栖社区“华章计算机”公众号查看。 1.5 Spark的企业级应用 随着企业数据量的增长,对大数据的处理和分析已经成为企业的迫切需求。Spark作为Hadoop的替代者,引起学术界和工业界的普遍兴趣,大量应用在工业界落地,许多科研院校开始了对Spark的研究。在学术界,Spark得到各院校的关注。Spark源自学术界,最初是由加州大学伯克利分校的AMPLab设计开发。国内的中科院、中国人民大学、南京大学、华东师范大学等也开始对Spark展开相关研究。涉及Benchmark、SQL、并行算法、性能优化、高可用性等多个方面。在工业界,Spark已经在互联网领域得到广泛应用。互联网用户群体庞大,需要存储大数据并进