【论文阅读】GNN在推荐系统中的应用
参考Graph Neural Networks for Recommender Systems: Challenges, Methods, and Directions
文章目录
1、本文结构
- 推荐系统可分成4类:阶段,场景,目标和应用
- 图神经网络可分成2类:谱模型和空间模型
- 讨论GNN应用在推荐系统中的动机,主要包括高阶连接,结构化数据,增强监督信号
- 分析了关于图的构造,嵌入传播,嵌入聚合,模型优化和计算效率的挑战
2、推荐系统的目的,发展和基于GNN模型的挑战
推荐系统的目的是为用户定制个性化的信息,改善用户体验,提高企业利润
关于推荐系统的发展,大致可以分成3个阶段:浅层模型,神经模型和基于GNN的模型
- 最早出现的推荐模型是协同过滤(CF),基于模型的CF方法有矩阵分解和因子分解机,但是这些方法在复杂用户
行为或者数据输入中效果并不好 - 因此基于神经网络的模型,比如神经协同过滤模型通过MLP扩展了MF的点积操作,相似的,深度因子分解机(DeepFM)
在FM的基础上加上MLP。但是这些方法还是有问题,因为它在关于预测和训练图表中,忽视观察数据中的高阶的结构信息 - 最近GNN的发展给上面提到的推荐系统存在的问题带来了解决思路。GNN通过迭代进行嵌入传播和邻居节点嵌入聚合的方式,每个节点能够获得高阶的邻居节点的信息,而不是像传统方法中的一阶邻居节点信息。
但是基于GNN的推荐系统仍然具有很多挑战:
- 1)推荐系统数据的输入需要格外注意,才能很好地构造出图
- 2)对于特定的任务,GNN需要自适应地设计组件,包括如何的传播和聚合。毕竟现有的工作提供很多解决思路,这些解决思路有好有坏
- 3)对于GNN模型的优化问题,包括优化目标,损失函数和数据采样等,需要和任务要求保持一致
- 4)因为推荐系统计算开销往往比较大,主要是GNN的嵌入传播算子造成的。
本文着重介绍如何通过图神经网络改进推荐系统,以及如何去解决相应挑战的。
3、推荐系统相应背景(可以从哪些角度来认识推荐系统)
推荐系统主要可以从4个方面来认识:阶段,场景,目标和应用。
- 在工业应用场景中,推荐系统主要分成3个阶段:匹配,排序,重排序,这样形成了一个标准的流水线,每个阶段在数据输入,输出和模型设计上有不同的特点。
- 在特定的推荐场景上,比如社交网络在最近20年来引起了广泛关注。
- 推荐系统有不同的目标,之前推荐的准确度是推荐系统最重要的性能指标,而在最近的推荐系统中,商品推荐的多样性可以避免用户陷入无聊的体验,保护用户的隐私免收攻击,保证系统公平地对待所有的用户,成为了新的推荐目标。
- 在应用上,GNN模型被广泛应用在电子商务推荐,兴趣点推荐,新闻推荐,电影推荐,音乐推荐等。
1)阶段
在item池中,通常有上百万个items,所有的items对于推荐系统都是可用的,因此推荐系统需要支持多状态的结构,在items pool中可以逐阶段地过滤商品。
- 匹配(召回):第一阶段是在item pool池中产生上百个候选商品,由于考虑到线上服务的响应时间,复杂的算法(比如DNN)并不适用。
在这个阶段,核心任务是高效召回相关items,获取粗粒度的用户兴趣,模型要求高准确。值得注意点是,在现实中常常需要考虑到多重匹配问题,这时就会利用多个模型:
比如相关嵌入召回,地理位置召回,热点召回和社交召回等。 - 排序:待多源的候选items召回之后,需要先merge成一个list,并且通过单一评分模型对所有候选items进行评分,然后根据得分,通过排序模型抽取前top个商品。
该阶段可以使用复杂的算法,比如可以通过用户偏好和商品属性来获得丰富特征,自注意力机制也可以使用。该阶段的目的是通过设计合适的模型来捕获复杂的交互特征。 - 重排:虽然排序阶段可以获得最优相关性的items,但是却没有满足其他重要的需求,比如商品的freshness,多样性和公平性等。

2)场景
- 社交推荐:随着不同用户间的交互,个人行为受个人和社会因素的影响。用户趋向于与自己行为相似的人建立社交关系。以商务为例子,来自普通家庭的用户可能有相同的商品偏好,因此社会关系常集成在推荐系统中来提高推荐性能。(fig3)

- 序列推荐:在推荐系统中,用户会产生大量的行为交互行为,这些交互行为(比如浏览了哪些商品)包含时间戳,而序列推荐方法通过从这些行为序列中提取信息,对用户的下一个行为进行预测。
常见的方法是将每个用户的行为作为一个样本,使用协同过滤方法训练模型(fig4)。对于序列推荐存在的挑战,无法设计一个模型来对短时,长时和兴趣动态变化的用户进行行为预测。

-
会话推荐(SBR):对于一些小的零售商和移动流媒体(tiktok),由于存储资源有限(冷启动),不太可能也没有必要去追踪每个用户在长时间内的行为,换句话说,这些长时交互信息在这些应用中没用。
因此,传统的推荐方法(CF)在该场景下表现差。基于会话推荐的目的是通过给定的匿名行为会话数据,来预测下一个商品(fig5)。SBR不同于序列推荐,对于同一个用户的子会话数据在SBR中是独立处理的,
user的session数据仅包含SBR中的某些特征(换句话说,user session数据不够用),所以需要使用匿名用户的session。
-
捆绑推荐:捆绑推荐是商场中商品促销的常用手段。在线平台也有很多使用这种策略,比如卖计算机设备的Amazon,买家具的IKEA(fig6)

-
跨域推荐(CDR):随着越来越多的用户在多个域间进行多模态信息的交互(理解1:taobao,xianyu,理解2:Fig7,卖衣服,卖水果,卖零食),CDR成为了一种降低冷启动和数据稀疏问题的有效手段,CDR可以划分成两类:单目标的CDR,多目标的CDR,STCDR强调从源域到目标域单向迁移信息,而DTCDR强调两个域相互交互信息。

-
多行为推荐:当用户点击一个视频时,往往会在下面评论或者收藏。在电子商务中,用户往往有点击,加入购物车,分享,收藏和购买等行为。虽然推荐系统的目标是尽可能多地推荐相关商品给用户,促成用户交易,然而购买行为相对于其他行为是稀疏的。假设有K种不同行为 { y 1 , y 2 , . . . , y K } \{y_1,y_2,...,y_K\} { y1,y2,...,yK},多行为推荐的目的是提高某种目标行为 y t y_t

文章详细介绍了图神经网络(GNN)在推荐系统中的应用,包括如何利用GNN改进传统推荐算法,如协同过滤,以及GNN在匹配、排序和重排序阶段的作用。此外,文章还探讨了GNN在社交推荐、序列推荐等不同场景下的应用,以及面临的图构建、网络设计、模型优化和计算效率等挑战。

3307

被折叠的 条评论
为什么被折叠?



