(翻译)Pachyderm介绍-建造一个现代的Hadoop
背景 最近在调研时发现了Pachyderm这个项目,感觉他们做的工作挺有意思的。Pachyderm将Docker和Hadoop联合起来,旨在使得大数据分析的过程更加便捷,众多非Java语言的工具也可以方便的使用到大数据的分析中来,并在HDFS的基础上增加了版本控制,使得数据可以进行增量分析。我在Medium上看到一篇相关介绍,讲的比较详细,原文是英文的,因此翻译下来分享一下,也方便自己之后的查阅。 原文链接 Let’s Build a modern Hadoop 我的个人博客 http://www.wangjialong.cc 翻译正文 让我们建造一个现代的Hadoop 我承诺,这不仅仅是另一个Hadoop的激情演说 如果你做过大数据的相关工作,那么你很可能已经感受到Hadoop带来的烦恼。但我们仍然坚持使用它,因为我们告诉自己:“这就是Hadoop作为基础设施软件必须工作的方式”。然而,在过去的十年内,像NoSQL数据库,分布式部署工具,云计算等工具,都随着量级的由小到大产生了很大的改进。为什么大数据分析软件就要被远远甩在身后?是什么让Redis,Docker和CoreOS看起来那么...