文件拷贝
有两周没有看过论文了,五一假期抽空看了Berkeley的PH.D Ganesh的最新发表在Eurosys11上的牛文---Scarlett:coping with Skewed Content Popularity in MapReduce Clusters 收获良多,这里和大家分享一下。 背景:经过对于Bing上执行Hadoop和Dryad的集群的日志分析,框架为了提高作业的执行效率,使得尽可能地将计算迁移到数据所在位置,这里位置可以是数据块所在的节点或者所在rack。一般认为,Rack之间的数据传输是应该尽量避免的。但是,Hadoop和Dryad分别都是如何做的呢? withSkewedContentPopularityinMapReduceClusters" alt="Eurosys2011---Scarlett:copingwithSkewedContentPopularityinMapReduceClusters" style="border:0px;" data-original="http://s11.sinaimg.cn/middle/4a1f59bfta25f1b7c...