龙空技术网

「算法」最新基于图神经网络的社交推荐算法综述

mistlike 23

前言:

而今同学们对“信息融合的常用算法”大概比较注意,看官们都需要剖析一些“信息融合的常用算法”的相关内容。那么小编同时在网上网罗了一些有关“信息融合的常用算法””的相关知识,希望同学们能喜欢,你们快快来了解一下吧!

如果您喜欢这篇文章可以到我的主页看更多内容或者点击右上方的“关注”。感谢您的支持和鼓励!

社交推荐,又名社会化推荐算法,旨在利用用户的社交信息(比如好友关注信息、信任信息等)来补充用户的行为信息以此来提供更加精准的推荐。换句话说,通过利用社交域的信息来提高用户行为域的预测精准度,以此来缓解行为域存在的数据稀疏等固有问题。根据社交推荐算法的脉络发展,其大体上经历了基于传统的协同过滤的方法(比如基于矩阵分解的社交推荐方法)、基于图嵌入的深度社交推荐方法以及近年来大火的基于图神经网络的社交推荐方法。关于传统的社交推荐方法-社会化推荐浅谈和基于深度学习社交推荐方法-深度学习技术在社会化推荐场景中的总结在以往的公众号总结文章中都有提及,欢迎大家移步阅读。本文根据最近发布的一篇图神经网络社交推荐综述来主要回顾下图神经网络在社交推荐领域的发展。

由于用户-物品交互和用户-用户社会关系可以自然地表示为图数据,因此基于图神经网络(GNN)的社交推荐算法(SocialRS)近年来越来越受到关注。然而,将图神经网络应用于社交推荐算法中并非易事,其面临诸多挑战。

首先,许多社交推荐方法构建两个独立的图:一个用户与物品的行为图,一个用户与用户的社交图。因此,社交推荐算法利用图神经网络需要同时从两个图中提取知识,以进行准确的推理。这与大多数只考虑单个网络的常规图神经网络不同。另外,我们注意到两个图中存在有价值的输入特征,如用户/物品属性、物品图谱/关系和组信息。因此,在基于图神经网络的社交推荐方法中,需要将特征和图数据融合在一起。

然后,基于图神经网络的社交推荐方法的性能在很大程度上依赖于它们的编码器,这些编码器旨在将用户和物品表示为低维嵌入。因此,现有的社交推荐算法探索了关于图神经网络编码器的各种设计,并根据其目标采用了不同的架构。需要注意的是,面向社交网络的图神经网络编码器需要同时考虑用户-物品交互和用户-用户社交关系的特征。这与仅对用户-物品交互建模的非社交推荐方法的图神经网络编码器形成了对比。

最后,基于图神经网络的社交推荐算法的训练应该能够在低维嵌入空间反映用户的品味和物品的特征。值得一提的是,基于图神经网络的社交推荐算法使用的损失函数可以利用丰富的结构信息来进行设计,比如图数据和属性信息。而非社交推荐算法的损失函数则不考虑这些。

根据模型输入数据的类型,我们将基于图神经网络的社交推荐算法使用的输入类型分为5类:用户-物品评分、用户-用户社交关系、属性、知识图谱和组。下表根据所使用的输入数据类型对所有论文进行了分类,并根据用户-物品的评分信息和用户-用户社交信息以及附加信息的细分类型进行了区分。

为了有效地使用图神经网络模型的可用输入,基于图神经网络的社交推荐算法将它们表示为不同类型的图。具体而言,基于图神经网络的社交推荐算法采用的输入表示可以分为7类:U-U/U-I图、U-U-I图、属性图、复用图、U-U/U-I/I-I图、超图和去中心化图。下表则根据论文使用输入数据的输入表示对论文进行分类。

然后,本文提出了基于图神经网络的社交推荐算法的架构分类法。模型架构由三个关键组件组成,如下图所示:(C1)编码器;(C2)解码器;(C3)损失函数。在(C1)中,编码器通过使用不同的图神经网络编码器将用户和物品表示为低维向量(即嵌入)。在这里,一些工作利用了用户和/或物品的附加信息(例如,他们的属性和组)以构建更准确的用户和物品嵌入。在(C2)中,解码器通过对(C1)中获得的用户和物品嵌入的不同操作来预测每个用户对每个物品的偏好。最后,在(C3)中,不同的损失函数被优化,以端到端的方式学习嵌入。

首先将基于图神经网络的社交推荐算法编码器分为8类:图卷积网络(GCN)、轻量级GCN (LightGCN)、图注意力神经网络(GANN)、异构GNN (HetGNN)、图循环神经网络(GRNN)、超图神经网络(HyperGNN)、图自编码器(GAE)和双曲GNN。下表详细列出了现有工作中使用的编码器的分类。

下图则按照时间线的方式展示了近年来(2019-2022年)使用的不同的编码器在社交推荐算法上的发展情况。

然后将基于图神经网络的社交推荐算法的解码器分为两类:点积和多层感知器(MLP)。下表总结了这些解码器的分类。可见大部分还是利用简单的内积操作来建模用户和物品的特征交互。

最后将基于图神经网络的社交推荐算法的主要损失函数分为4类:贝叶斯个性化排序(BPR)、均方误差(MSE)、交叉熵(CE)和铰链损失(Hinge)。此外,还总结了一些工作额外采用了辅助损失函数。本文进一步将这些损失函数分为8类:社交链接预测(LP)损失、自监督损失(SSL)、基于组的损失、对抗(Adv)损失、基于路径的损失、知识蒸馏(KD)损失、情感感知损失和基于策略网络(Policy Net)的损失。下表总结了现有工作中使用的损失函数的分类。

下表总结了现有的基于图神经网络的社交推荐算法广泛使用的数据集。这些数据集来自8个不同的应用领域:产品、位置、电影、图像、音乐、书签、微博和其他。给出了每个数据集的统计数据,包括用户、物品、评分和社交关系的数量,以及使用相应数据集的论文列表。由于每个数据集都有多个版本,因此我们选择了包含评分信息最多的版本。

在文章最后作者给出了关于这个领域的未来研究展望,具体包括对于基于图神经网络社交推荐算法中图结构的数据增强探究、可信图神经网络社交推荐算法以及图神经网络社交推荐算法的异质性、效率性以及可扩展性等。

如果您喜欢这篇文章可以到我的主页看更多内容或者点击右上方的“关注”。感谢您的支持和鼓励!

标签: #信息融合的常用算法 #信息融合的常用算法有哪些 #推荐算法的步骤