推荐系统经典模型YouTubeDNN

最新推荐文章于 2025-02-26 14:39:00 发布

原创

最新推荐文章于 2025-02-26 14:39:00 发布 · 2.5k 阅读

·

28

·

标签

#大数据 #推荐算法 #逻辑回归

本文详细介绍了YouTubeDNN推荐系统，包括其召回阶段的多模型筛选策略，排序阶段的复杂模型以及关键的负采样、特征构造和上下文选择技巧。文章强调了YouTubeDNN如何解决大数据量下的推荐问题和模型效率优化。

文章目录

YouTubeDNN概念

YouTubeDNN是YouTube用于做视频推荐的落地模型，其大体思路就是召回阶段使用多个简单的模型来进行筛选，这样可以大量地筛除相关度较低的内容，而排序阶段则是使用相对复杂的模型来获得精准的推荐结果。YouTubeDNN模型主要分为两个阶段：召回阶段和排序阶段。
YouTubeDNN模型的召回主要是完成候选视频的快速筛选（在论文中被称为 Candidate Generation Model），也就是候选集的生成模型。在这一部分中，模型要做的就是将整个YouTube数据库中的视频数量由百万级别降到数百级别。
为什么要使用YouTubeDNN模型？
- 答：传统的协同过滤算法处理百万级数据量，很明显是不够的，因为CF算法的本质就是计算两两内容之间的关系矩阵，然后将结果保存在内存当中，当然随着数据量的增大，就会很容易地出现OOM的现象。假设有个无限大的内存的分布式计算系统（Spark等），对于百万级矩阵计算处理时所耗费的时间，也不是我们想看到的结果。而YouTubeDNN则利用了Embedding向量加上对负样本的特殊采样处理，巧妙地解决了这一问题。

YouTubeDNN模型架构图

YouTube推荐系统架构图
- 从论文的解释中我们可以得知这个架构就像是一个沙漏（funnel）一样，从最初的百万级→数百级→十级别。

YouTubeDNN召回阶段

YouTubeDNN召回模型架构图

最低0.47元/天解锁文章

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。