学位论文 > 优秀研究生学位论文题录展示

协同过滤推荐系统中的冷启动问题研究

作 者: 孙冬婷
导 师: 黄旭慧
学 校: 国防科学技术大学
专 业: 计算机科学与技术
关键词: 推荐系统 协同过滤 冷启动 k-means 决策树
分类号: TP391.3
类 型: 硕士论文
年 份: 2011年
下 载: 146次
引 用: 1次
阅 读: 论文下载
 

内容摘要


随着互联网的普及和电子商务的迅猛发展,人们在享受越来越多信息服务的同时也面临着信息过载问题所带来的困扰。如何在不断膨胀的资源中迅速、准确地找到适合用户的信息,满足用户的个性化需求,逐渐成为众多研究者和网络用户关注的热点问题。个性化推荐系统就是在这样的背景下应运而生。它最大的优势在于能够快捷,准确地定位用户真正需要的信息,缓解信息检索的压力。协同过滤推荐技术是推荐系统中应用最广泛和成功的推荐技术,但随着用户数量的急剧增长,协同过滤推荐算法面临着一些挑战。冷启动是推荐算法中尚未得到有效解决的一个关键问题。现有协同过滤算法主要通过分析与挖掘评分矩阵,找到与目标用户兴趣相似的最近邻,根据这些最近邻的建议得到推荐。然而系统无法对新用户、新项目进行有效推荐,因为它们缺乏足够的评分信息。由于推荐系统中一般都保存了用户和项目的内容信息,这启发我们结合内容信息对传统的协同过滤算法进行改进。本文的主要工作如下:(1)提出一个用于解决协同过滤推荐算法冷启动问题的算法框架。该框架首先利用用户-项目评分信息进行聚类、然后利用内容信息和聚类结果建立分类模型,借助分类模型对新用户新项目进行分类,最后结合传统的协同过滤技术产生推荐。所提算法框架克服了新用户新项目由于缺乏评分信息而无法找到相似邻居的不足。通过对算法框架的具体细化可以同时适用于解决新用户和新项目问题。(2)对所提算法框架进行改进和细化。针对用户评分矩阵非常稀疏,根据原始评分矩阵进行聚类得到的结果不具有代表性的问题,本文在聚类前对原始评分矩阵进行预填充,在填充后的评分矩阵上利用K-means算法进行聚类。而K-means算法中聚类效果受初始点选择影响,对初始点选择进行了优化,选择评分个数较多,所有评分均误差最小的用户或项目作为初始聚类中心点。利用改进后的所提算法分别对新用户和新项目问题进行了有效的解决。最后,本文通过实验对所提算法进行评估,并与传统的协同过滤算法和现有解决冷启动问题常用算法进行相比较,实验结果证实了本文提出的算法在解决冷启动问题上的可行性、正确性和有效性。

全文目录


相似论文

  1. 基于支持向量机的故障诊断方法研究,TP18
  2. 基于遗传算法和粗糙集的聚类算法研究,TP18
  3. 基于论文关键词聚类的用户兴趣模型细化方法研究,TP391.3
  4. 基于数据流挖掘技术的流量识别,TP393.06
  5. 教学质量评估数据挖掘系统设计与开发,TP311.13
  6. Web使用挖掘与网页个性化服务推荐研究,TP311.13
  7. 基于粒子群优化的Fuzzy c-mean聚类算法的基因芯片图像处理,TP391.41
  8. 数据挖掘技术在教务管理中的应用,TP311.13
  9. 基于自然遗忘的个性化推荐算法研究,TP311.52
  10. 基于大众标注的个性化推荐系统研究,TP393.09
  11. 模糊聚类和决策树分类算法在高职学生就业方面的应用研究,TP399-C1
  12. 基于SOA构架的社区医疗管理系统研究与实现,TP311.52
  13. 协同过滤推荐系统中关键问题研究与实现,TP311.52
  14. 能力导向终身学习个性化推荐系统学习者模型构建,G720
  15. 面向终身学习的能力导向个性化推荐系统中资源的建设与共享机制研究,G720
  16. 基于纹理特征的图像分类研究,TP391.41
  17. 基于数据挖掘技术的高校毕业生就业管理信息系统的设计与实现,TP311.52
  18. 面向电子商务的Web数据挖掘应用研究,TP311.13
  19. 改进的协同过滤算法在推荐系统中的研究,TP391.3
  20. 复杂网络社团结构探测研究,O157.5
  21. 数据挖掘技术在预防电信客户流失中的应用研究,TP311.13

中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机的应用 > 信息处理(信息加工) > 检索机
© 2012 www.xueweilunwen.com