学位论文 > 优秀研究生学位论文题录展示

基于协同过滤推荐算法电影网站的构建

作 者: 季昀
导 师: 张乃通
学 校: 哈尔滨工业大学
专 业: 通信与信息系统
关键词: 协同过滤 稀疏性 冷启动 可扩展性 电子商务推荐系统
分类号: TP393.092
类 型: 硕士论文
年 份: 2009年
下 载: 179次
引 用: 0次
阅 读: 论文下载
 

内容摘要


随着互联网的迅猛发展,推荐系统已经渗透到了互联网中的各方各面,包括电影、书籍、音乐、新闻、网上购物等等。并且在如今信息暴涨的背景下,推荐系统显得尤为重要,推荐技术也越来越受到学者的关注。协同过滤技术是推荐系统(Recommender System)最为核心的技术之一,也是目前应用最为广泛和成功的技术。虽然协同过滤推荐技术取得了很大的成功,但是传统的算法本身还是存在一些问题,这些问题包括:数据稀疏性问题;冷启动性问题;系统可扩展性问题。其中数据稀疏性问题直接影响了推荐系统的推荐精度,冷启动问题造成了新用户对推荐系统忠诚的下降以及新项目的无法被推荐。这些问题都是协同过滤推荐系统中必须要想办法解决的问题。本文对协同过滤推荐算法中的这些经典问题做了深入的分析和探讨,针对稀疏性问题本文采用了基于项目与项目间的交集个数权重的相似度改进计算公式;针对冷启动问题,论文采用了利用项目本身的类别属性来缓解新项目问题的方法。该方法通过类别属性计算新项目和其它项目间的相似度,得到新项目的最近邻,通过新项目的最近邻的评分数据来预测新项目的评分。实验表明,本文提出的改进算法在推荐精度上优于传统算法。目前改进的算法已经被运用到一个的具有推荐功能的电影网站,实现了理论到实际应用的过渡。该网站除了具备智能推荐功能,还实现了比较特色的好友系统,通过好友系统,你可以发现和你兴趣相似的用户并加为好友。通过上述的研究工作,从一定程度上解决了推荐系统的协同过滤算法所遇到的稀疏性问题、冷启动问题。

全文目录


摘要  4-5
Abstract  5-9
第1章 绪论  9-13
  1.1 研究背景  9-10
  1.2 国内外研究现状  10-11
  1.3 协同过滤技术存在的问题和挑战  11-12
  1.4 学位论文的主要研究内容  12-13
第2章 电子商务推荐系统  13-27
  2.1 引言  13
  2.2 概念  13
  2.3 电子商务推荐系统的作用  13-14
  2.4 电子商务推荐系统的框架结构  14-15
  2.5 现有推荐系统  15
  2.6 电子商务推荐系统研究内容、热点及难点  15-16
  2.7 推荐技术及分类  16-19
    2.7.1 基于关联规则的推荐技术  16-17
    2.7.2 基于内容过滤的推荐技术  17-18
    2.7.3 基于效用的推荐技术  18
    2.7.4 基于知识的推荐技术  18
    2.7.5 基于组合的推荐技术  18-19
    2.7.6 协同过滤推荐技术  19
  2.8 协同过滤过滤算法及分类  19-26
    2.8.1 基于用户(User-based)的协同过滤推荐技术  21-23
    2.8.2 基于项目(Item-based) 的协同过滤推荐技术  23-26
  2.9 本章小结  26-27
第3章 基于协同过滤推荐算法的电影网站的系统结构  27-43
  3.1 引言  27
  3.2 网站的软件架构  27-33
    3.2.1 传统表现层技术: JSP  27
    3.2.2 MVC 框架  27-29
    3.2.3 Spring 框架  29-31
    3.2.4 Hibernate 框架  31-32
    3.2.5 系统结构  32-33
    3.2.6 系统功能模块  33
  3.3 网站的功能模块详细介绍  33-42
    3.3.1 游客模块  34-36
    3.3.2 注册用户模块  36-38
    3.3.3 好友系统  38-41
    3.3.4 系统的后台管理模块  41-42
  3.4 本章小结  42-43
第4章 协同过滤推荐算法的改进  43-50
  4.1 引言  43
  4.2 稀疏性冷启动问题的深入分析和探讨  43-45
    4.2.1 稀疏性问题  43-44
    4.2.2 冷启动问题  44-45
  4.3 协同过滤推荐算法的改进  45-49
    4.3.1 交集个数权重因子f(num_(ab)) 的选取  45-46
    4.3.2 项目类别相似度的计算  46
    4.3.3 评分预测公式的改进  46-48
    4.3.4 总结  48-49
  4.4 本章小结  49-50
第5章 协同过滤算法的实验与数据分析  50-61
  5.1 引言  50
  5.2 实验数据集  50
  5.3 度量标准  50-51
    5.3.1 度量方法的介绍  50-51
  5.4 实验过程与分析  51-60
    5.4.1 普通算法中项目间相似度的三种计算公式的比较实验  51-53
    5.4.2 考虑和不考虑用户评分风格的两种评分预测公式的比较实验  53-55
    5.4.3 改进算法实验  55-60
  5.5 本章小结  60-61
结论  61-62
参考文献  62-66
致谢  66

相似论文

  1. 基于自然遗忘的个性化推荐算法研究,TP311.52
  2. 一种高性能可扩展公钥密码协处理器的研究与设计,TN918.1
  3. 构建分布式系统的关键技术研究与实现,TP338.8
  4. 微放电通道的径向扩展与放电均匀性的研究,TM83
  5. 基于蚁群算法的移动商务个性化推荐体系研究,TP391.3
  6. 基于协同过滤的用户兴趣发现,TP391.3
  7. 基于信息型模型的音乐推荐算法,TP391.3
  8. 基于社会化标签体系的个性化推荐引擎技术研究,TP391.3
  9. 基于随机游走模型的个性化信息推荐,TP391.3
  10. 基于GPU的图书推荐系统研究与实现,TP391.3
  11. 基于C2C电子商务模式下商品推荐系统应用研究,F724.6
  12. 面向IICCD相机不完全随机采样遥感图像的重建算法,TP751
  13. 基于用户兴趣和浏览行为的个性化推荐技术研究,TP391.3
  14. 基于特征向量的个性化推荐算法研究,TP391.3
  15. 基于语用情境的资源推荐研究及应用,TP391.3
  16. 动态推荐技术的研究及在个性化电子警务中的应用,D631.1
  17. 可扩展高性能分布式报文分类算法研究,TP393.06
  18. 跨系统个性化服务中隐私保持问题研究,TP393.08
  19. Agent电子商务推荐系统下协同过滤技术研究,F713.36
  20. 基于双信息源的协同过滤算法及其应用研究,TP301.6
  21. 基于AJAX的个性化图书馆信息系统的设计与实现,TP311.52

中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机的应用 > 计算机网络 > 一般性问题 > 计算机网络应用程序 > 网络浏览器
© 2012 www.xueweilunwen.com