hadoop 原生MapReduce 实现数据连接
其实很简单,输入两个文件,一个作为基础数据(学生信息文件),一个是分数信息文件。 学生信息文件:存放学生数据:包括学号,学生名称 分数信息数据:存放学生的分数信息:包括学号,学科,分数。 我们将通过M/R实现根据学号,进行数据关联,最终结果为:学生名称,学科,分数。 模拟数据 学生数据 [hadoop@hadoop11 student_data]$ cat students.txt 1 Randy 2 Tom 3 kitty 4 Lucy 5 Lily 6 Bruce 7 King 8 Jay 9 Melody 10 Kimy ///////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////// 分数数据 [hadoop@hadoop11 student_data]$ cat scores.txt 1 English 89 2 English 77 3 English 54 4 Englis...