基于文本理解的推荐系统
作者:葛苏昱 电子工程系
指导老师:黄永峰教授 电子工程系
关键词:文本挖掘,推荐系统,用户建模
摘要
本项目旨在从商品用户相关的文本信息中学习出精确的商品用户表示,从而更好进行个性化推荐。方法上,不同于传统的矩阵分解,该项目通过对原始文本的语义建模,有效避免了矩阵稀疏性和冷启动问题。针对文本和交互信息的噪声问题,我们采用自注意力机制对一句话中的单词进行上下文编码,实现了自动降噪。另外,项目还为推荐任务引入更多的信息,如利用用户的反馈信息来区别不同商品对兴趣建模的重要程度,利用图交互信息引入用户或商品之间的相似性等。我们在大规模的真实数据上进行了大量实验,取得了一定的推荐效果提升。
项目背景
互联网上天然存在着海量用户和商品相关信息,它们反映商品属性,隐含用户偏好,且很多属于非结构化文本数据(新闻内容,商品描述,用户评论等)。因此,本项目旨在从商品用户相关的文本信息中学习出精确的商品用户表示,从而更好进行个性化推荐。
图1 用于推荐任务的文本信息
关键技术
结合可靠性感知的商品推荐:学习用户表示时,自动给予可靠性高的文本更大权重
图2 结合可靠性感知的商品推荐
图表示增强的新闻推荐:以交互图中的邻居信息弥补交互稀疏,学习更加丰富的用户与新闻表示
图3图表示增强的新闻推荐
项目成果
结合可靠性感知的商品推荐:
图4亚马逊数据集商品推荐效果对比
图表示增强的新闻推荐:
图5微软新闻数据集推荐效果对比