龙空技术网

电影推荐的作用,用知识感知注意神经网络,构建电影专业推荐之路

青梅旭史 119

前言:

眼前大家对“推荐系统概念”大约比较关切,朋友们都想要分析一些“推荐系统概念”的相关知识。那么小编在网上收集了一些对于“推荐系统概念””的相关内容,希望姐妹们能喜欢,我们一起来学习一下吧!

在本文中,我们提出了一种知识感知注意神经网络,通过从电影评论中提取知识实体并在知识层面捕获用户与电影之间可理解的交互来处理电影推荐任务。

在大多数推荐系统中,评论信息已经被广泛用于揭示用户对项目的明确偏好,特别是对于包括电影推荐、音乐推荐和书籍推荐在内的领域,因为评论充满了与该领域相关的知识实体。

在处理评论信息时,当前的方法通常使用词嵌入来表示对用户和项目进行建模的评论。结果,他们可能会分裂一个短语的含义,从而引发错误的预测。

此外,大多数方法在获得潜在的低维表示后捕获用户和项目之间的高阶交互,这意味着它们无法发现可理解的交互或提供知识级解释。

通过将知识图谱表示纳入电影推荐任务,提出的KANN不仅可以捕获用户(电影)评论中的内在注意力,还可以在生成相应的潜在向量表示之前计算用户与电影之间的外部注意力值。

这些特征使用户对电影的明确偏好能够被学习和理解。我们在两个数据集(IMDb 和亚马逊)上测试了我们的模型,用于电影评级预测任务和点击率预测任务,并表明它优于一些现有的最先进的模型。

并在评论量非常少的情况下获得了出色的预测性能。此外,我们通过案例研究可视化用户与电影之间的交互,证明了所提出的KANN的高度可解释性。

我们的结果和分析强调了KANN在电影推荐任务中相对较高的有效性和可靠性。

介绍

推荐系统(RS)对于许多在线服务至关重要,可以将用户从不断增长的选择中解放出来。因此,越来越多的研究一直在研究带有解释的RS。

带有解释的透明 RS 有可能增加用户的信任并帮助他们更快地选择合适的项目。显然,评论反映了用户的偏好,并揭示了无法通过评级传达的项目的丰富属性。

因此,用户的这些偏好和项目的属性可用于向用户提供可解释的建议。此外,评论的丰富功能可用于解决稀有评级引起的数据稀疏和冷启动问题。因此,人们对基于审查的建议产生了极大的兴趣,以提高推荐绩效并提供解释。

最近的工作提出使用评论的单词嵌入作为训练神经网络模型的输入,并通过注意力机制提供评论级或词级解释。这些作品遵循类似的模式,从评论中产生可解释的建议。

首先,它们连接用户(项目)评论的词嵌入来表示用户(项目)。然后,神经网络处理评论嵌入并为用户(项目)学习单个潜在向量。同时,根据注意力机制产生的高权重值选择信息性单词或评论。

最后,用户-项目对内的特征交互是通过用户(项目)的固定维向量获得的,该向量是通过压缩评论生成的。

上面的描述揭示了基于评论的可解释 RS 的两个关键方面:首先,它从评论中提取有意义和有效的特征,其次,它捕获用户和项目之间的交互,以便从评论中学习重要特征,这些特征可以对用户的偏好进行建模。

这两点也给使用在线评论推荐带来了两个挑战。其次,许多工作采用了卷积神经网络(CNN)来处理综述。尽管CNN可以保留短序列信息并识别信息丰富的单词,但它们对嘈片化和长尾评论数据建模的能力有限。

此外,当使用词嵌入时,低频词的语义表达质量比高频词的语义表达质量下降更显着。

此外,单词级别的解释可能会拆分短语的含义并引起误解,这可能导致用户难以理解突出显示的单词的含义,除非他们也阅读了评论或整个评论本身的上下文信息。

至于第二个挑战,捕获用户和项目之间的不同顺序特征交互是繁重的。目前大多数工作都集中在使用神经网络从词嵌入中提取高阶特征交互,然后在获得潜在语义向量后捕获用户-项目交互。

尽管这些方法可以有效地生成隐式特征组合,但它们几乎无法在较低层次上探索丰富的交互信息。Tay等人考虑了基于词嵌入特征的低阶关系。

但由于他们选择将评论的所有词嵌入汇总到低维向量中作为输入向量,因此这种处理方法不可避免地降低了用户(项目)的建模能力并导致错误的预测。

近年来,知识图谱(KG)已成功应用于基于内容的推荐、机器阅读和文本分类等场景中。一般来说,电影推荐、音乐推荐、图书推荐等特定领域的评论包含许多知识实体和很多常识。

考虑到上面提到的基于评论的RS的挑战,并受到使用KG成功的启发,我们提出了一种知识感知神经网络(KANN)来预测电影评论评级并提供知识级解释。

为了避免拆分短语和低频词引起的语义错误问题,我们首先通过引入KG从评论中提取知识特征。然后,我们从KG学习知识嵌入,以观察相关性的传递性和对新特征的探索。

随后,我们探索用户(电影)不同知识嵌入之间的内部交互,并通过注意力机制捕获用户与电影对之间的外部交互。因此,交互学习可以捕获任何两个特征之间的关系,而不管它们之间的距离如何。

之后,我们还根据潜在知识的低维表示来捕获用户和电影之间的高阶交互。最后,我们将交互权重可视化,并通过案例研究提供知识层面的解释。

相关作品

许多研究利用综述来改善推荐效果。 这些方法不仅缓解了用户与项关系稀疏导致的冷启动问题,还探索了用户和项的语义表示。其中一些工作侧重于评论的主题建模或情感分类,以更好地了解用户行为和项目属性。

例如,Diao等人提出通过应用主题建模所发现的特定于方面的情感词来表示用户偏好和电影属性。其他工作利用神经网络来学习用户和评论项目的潜在语义表示。

Catherine等人和Zheng等人引入了CNN作为提取器,以并行编码用户评论和项目评论,然后通过将用户的输出输入分解机来匹配用户和项目。

Almahairi等人提出了一种语言正则化潜在因子(Love My LifeF)模型,该模型采用RNN来规范化协同过滤矩阵分解。

基于评论的推荐工作不仅考虑了项目属性,还提取了评论中的用户偏好,有助于提高推荐性能。

然而,这些作品有三个限制。首先,基于主题和基于情感的模型通常需要专业知识来定义或识别评论中的主题或情绪。其次,基于CNN的模型通常忽略不同单词之间的长距离依赖关系,这可能导致短语的含义被切断并引入噪声。

第三,大多数基于评论的模型只关注用户与项目之间的高阶交互,而忽略了基于低阶用户-项目关系的可理解交互的提取。

带有解释的注意力模型

注意力机制最近在自然语言处理中得到了广泛的应用。对于机器翻译,Bahdanau等人提出了一种基于注意力的编码器-解码器架构,以选择源句子中与目标单词相关的部分。

在另一项工作中,转换器仅依靠自我注意来减少顺序计算,并将位置信息编码为机器翻译中输入的一部分以保持词序。在RS领域,Seo等人提出了一个模型,该模型通过CNN从评论中学习用户偏好和项目属性,具有本地和全球双重关注。

Chen等人提出了带有评论级别解释(NARRE)的神经注意评级回归,以探索评论的有用性。Tay等人提出了一种多指针协同注意力网络(MPCN)方法。

该方法采用硬注意力提取每个用户和项目信息量最大的评论,然后使用共同注意力对匹配评论之间的单词级交互进行建模。

RSS 字段中基于评论的注意力模型可以将重要的评论或单词识别为对应推荐结果的解释。虽然这些模型大大提高了其系统的透明度,并且能够为用户提供令人信服的推荐结果,但它们也有其局限性。

Tay等人建议将评论的所有单词嵌入汇总到一个短向量中以表示评论,然后将所有评论连接起来以对用户或项目进行建模。

但是,此方法仅从所有评论中选择固定数量,这可能会导致重要功能被忽略。Chen等人提出了一种联合建模评级和评论信息以选择信息性评论的方法,但无法识别评论对推荐结果的贡献。

用于推荐的知识图谱

KG在建议中被广泛使用。一些作品使用它们来提取潜在的知识级连接,以进行基于内容的推荐。Wang等人从新闻标题中提取知识嵌入,并融合语义表示以进行点击率预测。

Cheekula等人引入了一个名为DBpedia的KG,根据Movielens中的电影标识符搜索与电影相关的实体。然后,他们使用扩展激活算法来识别个性化实体以进行推荐。

Zhu等人基于手动定义的关系构建了专用KG,然后将用户点击的历史序列和用户与项目之间的预搜索路径合并到KG中,以提高推荐的准确性。其他作品仅提取与项目对应的知识实体。

Wang等人提出了一种用于KG增强推荐的多任务特征学习方法,其中两个任务用于共同学习评级和实体以进行点击率预测。

Wang等人提出了一种基于路径的知识感知模型,用于搜索从与点击率预测(CTR)任务的实体对应的项目开始的路径。具有知识解释的方法通常通过在KG中定义元路径或学习传播路径来提供解释结果。

Ma等人提出了一种规则引导的神经推荐方法,该方法从以项目为中心的KG中挖掘归纳规则。Wang等人提取了携带来自项目侧KG的高阶关系信息的路径。

将KG集成到建议中的技术为提高RS的性能和可解释性提供了新的视角。然而,目前的知识型工作主要关注知识实体与项目之间的联系,或者基于其自身定义的项目-项目交互的联系,导致其KG中的知识信息有限。

此外,它们通常从项目或标识符信息的内容描述中提取知识实体,但忽略评论中包含的用户和知识实体之间的显式联系。

结论

在这项工作中,我们提出了KANN,一个处理电影推荐任务的模型,具有很高的可解释性。KANN利用在多个知识语义空间中利用的注意力机制,在知识层面对用户和电影之间的可理解交互进行建模。

我们的实验结果表明,KANN在预测收视率和点击率任务方面优于IMDb和Amazon数据集上的许多最先进的方法。

通过探索用户与电影之间的潜在联系,提出的KANN可以为用户提供极具说服力和准确的推荐。我们对用户偏好分布的分析进一步加强了我们模型的可解释性。

作为未来的工作,我们将通过实施众包评估来评估我们的模型给出的解释的说服力。我们还将扩展 KANN 以对辅助信息(如时态信息)进行建模。

此外,我们有兴趣从多个角度探索更有效的复习功能,例如单词和字符级别。

标签: #推荐系统概念