Machine de factorisation attentionnelle avec révision

Rapports scientifiques volume 13, Numéro d'article : 13454 (2023) Citer cet article

278 accès

1 Altmétrique

Détails des métriques

Dans les systèmes de recommandation, les avis des utilisateurs sur les articles contiennent de riches informations sémantiques, qui peuvent exprimer les préférences des utilisateurs et les caractéristiques des articles. Cependant, les méthodes de recommandation existantes basées sur les avis utilisent le modèle vectoriel de mots statique ou ne peuvent pas extraire efficacement les caractéristiques de séquence longue dans les avis, ce qui limite la capacité d'expression des caractéristiques de l'utilisateur. De plus, l’impact des interactions de fonctionnalités différentes ou inutiles entre les utilisateurs et les éléments sur les performances des recommandations est ignoré. Par conséquent, nous proposons une machine de factorisation attentionnelle avec une interaction utilisateur-élément basée sur l'évaluation pour la recommandation (AFMRUI), qui exploite d'abord RoBERTa pour obtenir la fonctionnalité d'intégration de chaque évaluation utilisateur/élément, et combine des unités récurrentes bidirectionnelles avec un réseau d'attention pour mettre en évidence davantage. informations utiles dans les avis des utilisateurs et des articles. Ensuite, nous adoptons l'AFM pour apprendre les interactions entre les fonctionnalités utilisateur-élément afin de distinguer l'importance des différentes interactions entre les fonctionnalités utilisateur-élément et en outre pour obtenir une prédiction de notation plus précise, afin de promouvoir la recommandation. Enfin, nous avons effectué une évaluation des performances sur cinq ensembles de données du monde réel. Les résultats expérimentaux sur cinq ensembles de données ont démontré que l'AFMRUI proposé surpassait les méthodes basées sur l'examen de pointe concernant deux mesures d'évaluation couramment utilisées.

Avec le développement rapide de l’industrie Internet et de la technologie du Big Data, les systèmes de recommandation jouent un rôle de plus en plus important dans les réseaux sociaux1, l’enseignement universitaire2, le commerce électronique3, etc. De nos jours, les systèmes de recommandation sont devenus un élément indispensable de la vie quotidienne, comme les achats en ligne4, la recommandation du prochain point d'intérêt5, la recommandation musicale6 et le push vidéo7. Selon les données comportementales historiques des utilisateurs, les systèmes de recommandation peuvent prédire les évaluations des articles par les utilisateurs et effectuer des recommandations personnalisées, de manière à aider les utilisateurs à découvrir rapidement les articles qui les intéressent et à améliorer leur satisfaction. Par conséquent, afin de fournir de meilleurs services de recommandation personnalisés, la manière de prédire avec précision les notes des utilisateurs sur les éléments afin d'améliorer la recommandation devient un défi.

Pour résoudre le problème ci-dessus, les chercheurs ont proposé diverses méthodes de prédiction de l’évaluation des éléments, parmi lesquelles la méthode de prédiction de l’évaluation8 basée sur le filtrage collaboratif (CF) est l’une des méthodes les plus largement utilisées. La plupart des méthodes CF sont basées sur la factorisation matricielle9,10, apprenant les caractéristiques latentes des utilisateurs et les éléments des modèles matriciels à des fins de recommandation. Considérant que les évaluations des utilisateurs pour les éléments reflètent leurs comportements d'interaction et leurs caractéristiques explicites, Zhang et al.11 ont obtenu les caractéristiques des utilisateurs et des éléments à partir des informations d'évaluation utilisateur-élément basées sur une factorisation matricielle approfondie. Cependant, avec la croissance rapide du nombre d'utilisateurs et d'articles, des problèmes tels que la rareté des données d'évaluation se posent de plus en plus. Malheureusement, les informations extraites des données de notation sont limitées, ce qui limite les performances des recommandations.

Par rapport aux données d'évaluation, les informations d'évaluation contiennent une sémantique riche, qui peut non seulement refléter la satisfaction des utilisateurs quant à la qualité et à la fonction des articles, mais aussi exprimer indirectement les préférences des utilisateurs et les caractéristiques des articles12. Ainsi, la prédiction de l'évaluation des éléments basée sur les évaluations a attiré une grande attention de la part des chercheurs, tels que ConvMF13, DeepCoNN14, D-Attn15, NARRE16 et DAML17, etc. Ces méthodes peuvent atténuer le problème de rareté causé par les données d'évaluation grâce aux informations d'évaluation, et ainsi obtenir évaluations de prédiction relativement précises pour la recommandation. Il existe cependant deux limitations majeures :

La capacité d’expression des fonctionnalités utilisateur/élément est insuffisante. Dans les recherches ci-dessus, D-Attn15, DAML17, etc., exploitent des vecteurs de mots codés statiquement tels que word2vec ou Glove, ce qui entraîne une représentation clairsemée des caractéristiques, une sémantique insuffisante et une polysémie, qui affectent la capacité du modèle à extraire les caractéristiques des utilisateurs et des éléments. De plus, des modèles tels que ConvMF13, DeepCoNN14 et NARRE16 utilisent des réseaux de neurones convolutifs (CNN) pour extraire les caractéristiques des utilisateurs et des articles des avis, ce qui ne peut pas extraire efficacement les caractéristiques de texte à longue séquence dans les avis, et ne peut donc pas exprimer avec précision les caractéristiques des utilisateurs ou des articles, ce qui limite la performances du modèle.