hadoop,spark,Zookeeper,,, 这些名字都是怎么来的呢?
Apache
首先我们要明白,Apache 是一个 http 服务器,而我们熟悉的另一种说法"Apache Hadoop"中的 Apache 则指的是 Apache 软件基金会。"Apache"是 Apache 软件基金会中的一个项目。
关于其名字,流传最广的解释是(也是最显而易见的):这个名字来自于一个事实:当Apache在1995年初开发的时候,它是由当时最流行的HTTP服务器NCSA HTTPd 1.3的代码修改而成的,因此是“一个修补的(a patchy)”服务器。
然而,在Apache服务器官方网站的FAQ中是这么解释的:“Apache这个名字是为了纪念名为Apache的美洲原住民印第安人的一支,众所周知他们拥有高超的作战策略和无穷的耐性。”贝伦多夫说:“我选择阿帕奇这个名字是取其积极含义。阿帕奇族是最后一个屈服于美国政府的民族。当时我们担心大公司迟早会参与竞争并‘教化’这块最早的网络之地,所以在我看来,阿帕奇是个很好的名称,也有人说这个词一语双关-因为正如Apache(与"a patchy"谐音)的名字所表明的那样,他们确实是在给服务器打补丁。”
Hadoop
说起 hadoop ,可能现在许多人都不会陌生,但读就不一定读的对了。
Hadoop的发音是 [hædu:p]。
Hadoop这个名字是Hadoop项目创建者Doug Cutting 的儿子的一只玩具的名字。他的儿子一直称呼一只黄色的大象玩具为 Hadoop 。这刚好满足Cutting 的命名需求,简短,容易拼写和发音,毫无意义,不会在别处使用。于是 Hadoop 就诞生了。
spark
Apache Spark的故事始于2009年,当时加州大学伯克利分校中一个名为的Matei Zaharia班级项目,项目名为Mesos。 当时的想法是构建一个可以支持各种集群系统的集群管理框架,类似 Yarn 。 在构建了 Mesos 后,开发人员需要一个基于 Mesos 架构的实际产品。 这,这就是Spark的诞生方式。
Spark有火花,鼓舞的意思,称之为Spark的原因是,他们希望这款产品能够激发基于Mesos的几款创新产品。
但是,正如我们现在所知,Spark现在已成为自己的项目,并且比大数据生态系统中的任何其他产品都具有更大的吸引力。
所谓无心插柳,莫过于此。
Kafka
如果你记性比较好,你应该会记得一篇高中的语文课文《变形记》。它的作者也叫kafka,全名是“Franz Kafka”。
那么apache kafka和Franz Kafka的名字相同只是巧合吗。这还真不是!
根据作者原话,因为apache kafka是一个用来优化读写的系统,所以用一个作家的名字来命名并不奇怪。而且作者在大学时非常喜欢Franz Kafka。此外,这个名字对于开源来说听起来很酷(emm...有点道理啊)。
Zookeeper
关于“ZooKeeper”这个项目的名字,其实也有一段趣闻。在立项初期,考虑到之前内部很多项目都是使用动物的名字来命名的(例如著名的Pig项目),雅虎的工程师希望给这个项目也取一个动物的名字。时任研究院的首席科学家RaghuRamakrishnan开玩笑地说:“在这样下去,我们这儿就变成动物园了!”此话一出,大家纷纷表示就叫动物园管理员吧一一一因为各个以动物命名的分布式组件放在一起,雅虎的整个分布式系统看上去就像一个大型的动物园了,而Zookeeper正好要用来进行分布式环境的协调一一于是,Zookeeper的名字也就由此诞生了。
如果你也知道哪些有意思的名字由来,不妨在评论里分享吧~~

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。
持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。
转载内容版权归作者及来源网站所有,本站原创内容转载请注明来源。
- 上一篇
PWA实践
PWA实践 引言 最近在搞基础框架,使用Docker部署到我1M带宽,1核CPU的阿里云上,在演示或者被别人打开的时候老是被吐槽加载太慢了,那么问题来了,怎么优化哪? 思考 硬件优化 我的阿里云硬件已经限制了我的带宽,扩容对我来说没必要,毕竟只是有人需要看得时候才访问,再者又不是要用流量挣钱,所以升级硬件不可能。 Docker 优化 我的阿里云本来就是个喳喳机器,上面还跑着别的几个服务,每个有1-2各实例,再跑两个实例,估计连SSH都用不成了。下面是我docker-compose的配置。还有打包的镜像我用的是caddy,而且caddy也作了gzip压缩, 以下两段代码是我 docker-compose 和 caddy 的配置文件 docker-compose.yml services: summit: image: gu****ab ports: - "80:80" deploy: mode: replicated replicas: 1 restart_policy: condition: on-failure delay: 5s max_attempts: 3 update_con...
- 下一篇
ByteTCC 0.5.0-ALPHA1 发布,基于 TCC 的分布式事务管理器
该版本主要特性: 新增事务日志MongoDB存储方式,提升对docker容器化部署的支持; 新增对spring boot的集成支持; 新增对spring cloud 2.x版本的支持; 提升对dubbo的集成支持力度,支持2.6.x版本; 改进故障恢复重试间隔为指数退避策略; 进一步简化集成相关配置,提升使用体验。 ByteTCC主要特性: 支持Spring容器的声明式事务管理; 支持普通事务、TCC事务、业务补偿型事务等事务机制; 支持多数据源、跨应用、跨服务器等分布式事务场景; 支持长事务; 支持dubbo服务框架; 提供框架层面的服务幂等性解决方案; 相关链接 ByteTCC 的详细介绍:点击查看 ByteTCC 的下载地址:点击下载 本文来自云栖社区合作伙伴“开源中国” 本文作者: bytesoft 原文链接
相关文章
文章评论
共有0条评论来说两句吧...