《Hadoop实战手册》一导读
前 言 Hadoop实战手册本书能帮助开发者更方便地使用Hadoop,从而熟练地解决问题。读者会更加熟悉Hadoop相关的各种工具从而进行最佳的实践。 本书指导读者使用各种工具解决各种问题。这些工具包括:Apache Hive、Pig、MapReduce、Mahout、Giraph、HDFS、Accumulo、Redis以及Ganglia。 本书提供了深入的解释以及代码实例。每章的内容包含一组问题集的描述,并对面临的技术挑战提出了解决方案,最后完整地解决了这些问题。每节将单一问题分解成不同的步骤,这样更容易按照步骤执行相关操作。本书覆盖的内容包括:关于HDFS的导入、导出数据,使用Giraph进行图分析,使用Hive、Pig以及MapReduce进行批量数据分析,使用Mahout进行机器学习方法,调试并修改MapReduce作业的错误,使用Apache Accumulo对结构数据进行列存储与检索。 本书的示例中涉及的Hadoop技术同样也可以应用于读者自己所面对的问题。 目 录 第1章 Hadoop分布式文件系统——导入和导出数据 1.1 介绍1.2 使用Hadoop shell命令导...
