基于浏览器的 MapReduce
本文讲的是基于浏览器的 MapReduce, 在分布式计算和海量数据中摸爬滚打了很久之后,你一定会感谢优雅的Google Map-Reduce 框架。它的map,emit和reduce模块既通用又简洁,这使它成为了一个强有力的工具。虽然 Google 公开了理论,但是底层的软件实现仍然是闭源的,而这可以说是他们最大的竞争优势之一(GFS,BigTable,等等)。当然,现在有很多开源的分支(Apache Hadoop,Disco,Skynet,以及其他),但是人们总会发现,优美简洁的理论和惨痛的实现之间存在的断层:诸如自定义协议,自定义服务器,文件系统,冗余,等等等等。问题来了,我们怎样能把这个差距缩短一点? 大规模并行计算 在我和Michael Nielsen进行了多次迭代、试错、深入的对话之后,一个念头突然闪现出来: