ItermCF的MR并行实现
版权声明:本文为博主原创文章,未经博主允许不得转载。 https://blog.csdn.net/qq1010885678/article/details/50751607 ItermCF的MR并行实现 @(Hadoop) ItermCF的基本思想 基于物品相似度的协同过滤推荐的思想大致可分为两部分: 1.计算物与物之前的相似度 2.根据用户的行为历史,给出和历史列表中的物品相似度最高的推荐 通俗的来讲就是: 对于物品 A,根据所有用户的历史偏好,喜欢物品 A 的用户都 喜欢物品 C,得出物品 A 和物品 C 比较相似,而用户 C 喜欢物品 A,那么可以推断出 用户 C 可能也喜欢物品 C。 ItermCF的算法实现思路 对于以下的数据集: UserId ItermId Preference 1 101 5 1 102 3 1 103 2.5 2 101 2 2 102 2.5 2 103 5 2 104 2 3 101 2 3 104 4 3 105 4.5 3 107 5 4 101 5 4 103 3 4 104 4.5 4 106 4 5 101 4 5 102 3 5 103...
