【推荐系统】复合模型:GBDT+LR(特征组合的开端)

本文介绍了GBDT+LR模型在推荐系统中的使用,逻辑回归(LR)模型作为基础,用于点击率预估,而GBDT则通过构建特征交叉增强模型表达能力。GBDT通过学习残差逐步改进预测,两者结合能有效提升推荐系统的性能。在训练过程中,GBDT的特征组合和LR的线性模型相互补充,形成强大的预测能力。

1 前言

相比于协同过滤和矩阵分解利用用户的物品“相似度”进行推荐, 逻辑回归模型将问题看成了一个分类问题, 通过预测正样本的概率对物品进行排序。

这里的正样本可以是用户“点击”了某个商品或者“观看”了某个视频, 均是推荐系统希望用户产生“正反馈”行为, 因此逻辑回归模型将推荐问题转成成了一个点击率预估问题。

要注意这和前面的协同过滤不太一样了, 那里是“TOPN"推荐的问题, 而这里通过逻辑回归转成了一种点击率预估问题, 成了一种二分类, 如果模型预测用户会点击, 那么就进行推荐。

但是由于LR表达能力不强,无法进行特征交叉,特征筛选等一些列“高级”操作,所以在LR的基础上引入了GBDT模型(利用该模型可以有效的构建交叉特征)。

2 传统的推荐系统模型

传统模型演化关系
在这里插入图片描述

这里对应的核心是 ——> gbdt+lr进行点击预测,然后应用到推荐系统当中。

3 GBDT+LR

3.1 LR简介

总的来说:

  • 逻辑回归假设数据服从伯努利分布,通过极大化似然函数的方法,运用梯度下降来求解参数,来达到将数据二分类的目。

对于LR来讲有以下优点:

  1. LR模型形式简单,可解释性好,从特征的权重可以看到不同的特征对最后结果的影响。
  2. 训练时便于并行化,在预测时只需要对特征进行线性加权,所以性能比较好,往往适合处理海量id类特征,用id类特征
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值