【论文阅读】GNN在推荐系统中的应用

最新推荐文章于 2025-05-06 17:51:22 发布

原创

最新推荐文章于 2025-05-06 17:51:22 发布 · 4.2k 阅读

标签

#论文阅读 #深度学习 #人工智能

文章详细介绍了图神经网络(GNN)在推荐系统中的应用，包括如何利用GNN改进传统推荐算法，如协同过滤，以及GNN在匹配、排序和重排序阶段的作用。此外，文章还探讨了GNN在社交推荐、序列推荐等不同场景下的应用，以及面临的图构建、网络设计、模型优化和计算效率等挑战。

推荐系统的目的是为用户定制个性化的信息，改善用户体验，提高企业利润
关于推荐系统的发展，大致可以分成3个阶段：浅层模型，神经模型和基于GNN的模型

最早出现的推荐模型是协同过滤(CF)，基于模型的CF方法有矩阵分解和因子分解机，但是这些方法在复杂用户
行为或者数据输入中效果并不好
因此基于神经网络的模型，比如神经协同过滤模型通过MLP扩展了MF的点积操作，相似的，深度因子分解机（DeepFM)
在FM的基础上加上MLP。但是这些方法还是有问题，因为它在关于预测和训练图表中，忽视观察数据中的高阶的结构信息
最近GNN的发展给上面提到的推荐系统存在的问题带来了解决思路。GNN通过迭代进行嵌入传播和邻居节点嵌入聚合的方式，每个节点能够获得高阶的邻居节点的信息，而不是像传统方法中的一阶邻居节点信息。

但是基于GNN的推荐系统仍然具有很多挑战：

本文着重介绍如何通过图神经网络改进推荐系统，以及如何去解决相应挑战的。

推荐系统主要可以从4个方面来认识：阶段，场景，目标和应用。

在工业应用场景中，推荐系统主要分成3个阶段：匹配，排序，重排序，这样形成了一个标准的流水线，每个阶段在数据输入，输出和模型设计上有不同的特点。
在特定的推荐场景上，比如社交网络在最近20年来引起了广泛关注。
推荐系统有不同的目标，之前推荐的准确度是推荐系统最重要的性能指标，而在最近的推荐系统中，商品推荐的多样性可以避免用户陷入无聊的体验，保护用户的隐私免收攻击，保证系统公平地对待所有的用户，成为了新的推荐目标。
在应用上，GNN模型被广泛应用在电子商务推荐，兴趣点推荐，新闻推荐，电影推荐，音乐推荐等。

在item池中，通常有上百万个items，所有的items对于推荐系统都是可用的，因此推荐系统需要支持多状态的结构，在items pool中可以逐阶段地过滤商品。

匹配（召回）：第一阶段是在item pool池中产生上百个候选商品，由于考虑到线上服务的响应时间，复杂的算法（比如DNN）并不适用。
在这个阶段，核心任务是高效召回相关items，获取粗粒度的用户兴趣，模型要求高准确。值得注意点是，在现实中常常需要考虑到多重匹配问题，这时就会利用多个模型：
比如相关嵌入召回，地理位置召回，热点召回和社交召回等。
排序：待多源的候选items召回之后，需要先merge成一个list，并且通过单一评分模型对所有候选items进行评分，然后根据得分，通过排序模型抽取前top个商品。
该阶段可以使用复杂的算法，比如可以通过用户偏好和商品属性来获得丰富特征，自注意力机制也可以使用。该阶段的目的是通过设计合适的模型来捕获复杂的交互特征。
重排：虽然排序阶段可以获得最优相关性的items，但是却没有满足其他重要的需求，比如商品的freshness，多样性和公平性等。

在这里插入图片描述

社交推荐：随着不同用户间的交互，个人行为受个人和社会因素的影响。用户趋向于与自己行为相似的人建立社交关系。以商务为例子，来自普通家庭的用户可能有相同的商品偏好，因此社会关系常集成在推荐系统中来提高推荐性能。（fig3）

在这里插入图片描述

序列推荐：在推荐系统中，用户会产生大量的行为交互行为，这些交互行为（比如浏览了哪些商品）包含时间戳，而序列推荐方法通过从这些行为序列中提取信息，对用户的下一个行为进行预测。
常见的方法是将每个用户的行为作为一个样本，使用协同过滤方法训练模型（fig4）。对于序列推荐存在的挑战，无法设计一个模型来对短时，长时和兴趣动态变化的用户进行行为预测。

在这里插入图片描述

会话推荐（SBR）：对于一些小的零售商和移动流媒体（tiktok），由于存储资源有限（冷启动），不太可能也没有必要去追踪每个用户在长时间内的行为，换句话说，这些长时交互信息在这些应用中没用。
因此，传统的推荐方法（CF）在该场景下表现差。基于会话推荐的目的是通过给定的匿名行为会话数据，来预测下一个商品（fig5）。SBR不同于序列推荐，对于同一个用户的子会话数据在SBR中是独立处理的，
user的session数据仅包含SBR中的某些特征（换句话说，user session数据不够用），所以需要使用匿名用户的session。
捆绑推荐：捆绑推荐是商场中商品促销的常用手段。在线平台也有很多使用这种策略，比如卖计算机设备的Amazon，买家具的IKEA（fig6）
跨域推荐(CDR)：随着越来越多的用户在多个域间进行多模态信息的交互（理解1：taobao，xianyu，理解2：Fig7，卖衣服，卖水果，卖零食），CDR成为了一种降低冷启动和数据稀疏问题的有效手段，CDR可以划分成两类：单目标的CDR，多目标的CDR，STCDR强调从源域到目标域单向迁移信息，而DTCDR强调两个域相互交互信息。

在这里插入图片描述

多行为推荐：当用户点击一个视频时，往往会在下面评论或者收藏。在电子商务中，用户往往有点击，加入购物车，分享，收藏和购买等行为。虽然推荐系统的目标是尽可能多地推荐相关商品给用户，促成用户交易，然而购买行为相对于其他行为是稀疏的。假设有K种不同行为 ${y_1,y_2,...,y_K\}$ ，多行为推荐的目的是提高某种目标行为 $y_t$