Spark排序算法系列之GBTs使用方式介绍
01
—
前言
【Spark排序算法系列】主要介绍的是目前推荐系统或者广告点击方面用的比较广的几种算法,和他们在Spark中的应用实现,本篇文章主要介绍GBDT算法,本系列还包括(持续更新):
Spark排序算法系列之LR(逻辑回归)
Spark排序算法系列之模型融合(GBDT+LR)
Spark排序算法系列之XGBoost
Spark排序算法系列之FTRL(Follow-the-regularized-Leader)
Spark排序算法系列之FM与FFM
在本篇文章中你可以学到:
Spark MLLib包中的GBDT使用方式
模型的通过保存、加载、预测
PipeLine
ML包中的GBDT
02
—
概述
LR因为其容易并行最早应用到推荐排序中的,但学习能力有限,需要大量的特征工程来增加模型的学习能力。但大量的特征工程耗时耗力,且不一定带来效果的提升,因此在如何