文章目录
1 前言
相比于协同过滤和矩阵分解利用用户的物品“相似度”进行推荐, 逻辑回归模型将问题看成了一个分类问题, 通过预测正样本的概率对物品进行排序。
这里的正样本可以是用户“点击”了某个商品或者“观看”了某个视频, 均是推荐系统希望用户产生“正反馈”行为, 因此逻辑回归模型将推荐问题转成成了一个点击率预估问题。
要注意这和前面的协同过滤不太一样了, 那里是“TOPN"推荐的问题, 而这里通过逻辑回归转成了一种点击率预估问题, 成了一种二分类, 如果模型预测用户会点击, 那么就进行推荐。
但是由于LR表达能力不强,无法进行特征交叉,特征筛选等一些列“高级”操作,所以在LR的基础上引入了GBDT模型(利用该模型可以有效的构建交叉特征)。
2 传统的推荐系统模型
传统模型演化关系

这里对应的核心是 ——> gbdt+lr进行点击预测,然后应用到推荐系统当中。
3 GBDT+LR
3.1 LR简介
总的来说:
- 逻辑回归假设数据服从伯努利分布,通过极大化似然函数的方法,运用梯度下降来求解参数,来达到将数据二分类的目。
对于LR来讲有以下优点:
- LR模型形式简单,可解释性好,从特征的权重可以看到不同的特征对最后结果的影响。
- 训练时便于并行化,在预测时只需要对特征进行线性加权,所以性能比较好,往往适合处理海量id类特征,用id类特征

本文介绍了GBDT+LR模型在推荐系统中的使用,逻辑回归(LR)模型作为基础,用于点击率预估,而GBDT则通过构建特征交叉增强模型表达能力。GBDT通过学习残差逐步改进预测,两者结合能有效提升推荐系统的性能。在训练过程中,GBDT的特征组合和LR的线性模型相互补充,形成强大的预测能力。
&spm=1001.2101.3001.5002&articleId=118640251&d=1&t=3&u=b5ce9d219d694eefabb9499ed6cb7ceb)
1151

被折叠的 条评论
为什么被折叠?



