《MapReduce设计模式》一1.5 Pig和Hive
本节书摘来异步社区《MapReduce设计模式》一书中的第1章,第1.5节,作者: 【美】Donald Miner , Adam Shook 译者: 徐钊 , 赵重庆 责编: 杨海玲,更多章节内容可以访问云栖社区“异步社区”公众号查看。 1.5 Pig和Hive 在Hadoop生态系统中有了Hive和Pig这类工具,对MapReduce设计模式没有太强烈的需求。但我们还是想借本书的开始部分解释为什么MapReduce设计模式依然如此重要。 Pig和Hive是对MapReduce更高层次的抽象。虽然它们提供的接口与“map”和“reduce”无关,但实际上它们会将较高级的语言翻译成一组MapReduce作业。就像关系型数据库管理系统(RDBMS)中的查询计划器(query planner)会将SQL语句解析成对数据的实际操作一样,Hive和Pig也是将它们各自的语言翻译成MapReduce操作。 在本书相关章节中可以看到,相对于用Java写的原生Hadoop实现,使用Pig和SQL(或HiveQL)将更为简洁。例如,用Java实现一个全排序,可能要写上几页代码,但用Pig只需要几行。 既...