big data 文章汇总-低调大师

big data 文章汇总

2017-10-18 807

flink和spark的异同：
https://www.zhihu.com/question/30151872

presto 还是hive？
http://geek.csdn.net/news/detail/98839

devops的思考：
http://www.jianshu.com/p/a01f912f1f66

postgres的黑科技：
https://yq.aliyun.com/articles/2727

kafka的应用场景：
http://blog.csdn.net/code52/article/details/50475511

OLAP常用框架：spark-sql，presto，druid，kylin的区别
https://www.zhihu.com/question/41541395?sort=created

微信关注我们

原文链接：https://yq.aliyun.com/articles/350208

转载内容版权归作者及来源网站所有！

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。

基于浏览器的 MapReduce

本文讲的是基于浏览器的 MapReduce，在分布式计算和海量数据中摸爬滚打了很久之后，你一定会感谢优雅的Google Map-Reduce 框架。它的map，emit和reduce模块既通用又简洁，这使它成为了一个强有力的工具。虽然 Google 公开了理论，但是底层的软件实现仍然是闭源的，而这可以说是他们最大的竞争优势之一（GFS，BigTable，等等）。当然，现在有很多开源的分支（Apache Hadoop，Disco，Skynet，以及其他），但是人们总会发现，优美简洁的理论和惨痛的实现之间存在的断层：诸如自定义协议，自定义服务器，文件系统，冗余，等等等等。问题来了，我们怎样能把这个差距缩短一点？大规模并行计算在我和Michael Nielsen进行了多次迭代、试错、深入的对话之后，一个念头突然闪现出来:

2017-10-18

748

Elasticsearch是一个分布式的文档(document)存储引擎。它能够实时存储并检索复杂数据结构——序列化的JSON文档。换言说，一旦文档被存储在Elasticsearch中，它就能够在集群的任一节点上被检索。当然，我们不仅须要存储数据。还要高速的批量查询。尽管已经有非常多NoSQL的解决方式同意我们以文档的形式存储对象，但它们依然须要考虑怎样查询这些数据，以及哪些字段须要被索引以便检索时更加高速。程序中大多的实体或对象可以被序列化为包括键值对的JSON对象，键(key)是字段(field)或属性(property)的名字，值(value)可以是字符串、数字、波尔类型、还有一个对象、值数组或者其它特殊类型，比方表示日期的字符串或者表示地理位置的对象。文档元数据（DocumentMetaData）：一个文档不仅仅有数据。它还包括了元数据(metadata)——关于文档的信息。三个必须的元数据节点是：节点说明 _index 文档存储的地方 _type 文档代表的对象的类 _id 文档的唯一标识 _index 索引(index)类似于关系型数据库里的“数据库”——它是...

2017-10-18

733

资源下载

更多资源

腾讯云软件源

为解决软件依赖安装时官方源访问速度慢的问题，腾讯云为一些软件搭建了缓存服务。您可以通过使用腾讯云软件源站来提升依赖包的安装速度。为了方便用户自由搭建服务架构，目前腾讯云软件源站支持公网访问和内网访问。

Nacos

Nacos /nɑ:kəʊs/ 是 Dynamic Naming and Configuration Service 的首字母简称，一个易于构建 AI Agent 应用的动态服务发现、配置管理和AI智能体管理平台。Nacos 致力于帮助您发现、配置和管理微服务及AI智能体应用。Nacos 提供了一组简单易用的特性集，帮助您快速实现动态服务发现、服务配置、服务元数据、流量管理。Nacos 帮助您更敏捷和容易地构建、交付和管理微服务平台。

Spring

Spring框架（Spring Framework）是由Rod Johnson于2002年提出的开源Java企业级应用框架，旨在通过使用JavaBean替代传统EJB实现方式降低企业级编程开发的复杂性。该框架基于简单性、可测试性和松耦合性设计理念，提供核心容器、应用上下文、数据访问集成等模块，支持整合Hibernate、Struts等第三方框架，其适用范围不仅限于服务器端开发，绝大多数Java应用均可从中受益。

Rocky Linux

Rocky Linux（中文名：洛基）是由Gregory Kurtzer于2020年12月发起的企业级Linux发行版，作为CentOS稳定版停止维护后与RHEL（Red Hat Enterprise Linux）完全兼容的开源替代方案，由社区拥有并管理，支持x86_64、aarch64等架构。其通过重新编译RHEL源代码提供长期稳定性，采用模块化包装和SELinux安全架构，默认包含GNOME桌面环境及XFS文件系统，支持十年生命周期更新。