学位论文 > 优秀研究生学位论文题录展示
基于标签主题建模的图书推荐系统研究
作 者: 高成
导 师: 魏宝刚; 张寅
学 校: 浙江大学
专 业: 计算机应用技术
关键词: 数字图书馆 推荐系统 主题模型 多模型集成 概念漂移
分类号: TP391.3
类 型: 硕士论文
年 份: 2014年
下 载: 39次
引 用: 0次
阅 读: 论文下载
内容摘要
我们正身处一个信息爆炸的社会,人们逐渐从信息匮乏的时代走进了信息过载的时代。计算机和网络技术的发展使得人们对知识和信息的获取变得前所未有的便捷,数字图书馆的出现就是一个最佳例证。在过去的数十年里,数字图书馆因为其传播知识所带来的巨大社会效益而受到各国政府的重视,得到了迅速的发展。随着数字图书馆的不断建设,数字资源的不断丰富,读者在面对如此海量的数字资源的时候也显得手足无措,不知道如何寻找自己感兴趣的图书。大量的数字资源因此而未被充分利用。本文针对CADAL数字图书馆中资源具有标签这一特点,结合CADAL用户的阅读行为日志,提出了一种基于标签主题建模的图书推荐方法,提高CADAL平台中资源的利用效率。本文围绕基于标签主题建模的图书推荐系统的研发,做了以下工作:第一,提出了一种基于LDA主题建模图书推荐方法。通过利用CADAL图书资源中的标签信息,挖掘隐含主题,使用Gibbs采样方法得到每个主题-标签模型。然后根据用户的阅读行为日志获得已读图书列表,使用LDA-inference算法推算出用户在各个主题上的概率分布。最后根据用户在各个主题分布上的相似性来进行基于用户的图书推荐。第二,研究了采用多模型集成追踪用户阅读兴趣变化的方法。通过设定时间窗口,对用户的阅读行为日志进行分段,针对每个时间窗口使用前面提到的主题建模方法建立用户-主题模型。然后计算两个相邻时间窗口中生成的模型的差异程度,以检测用户的阅读兴趣是否发生概念漂移。通过保留具有代表性的用户-主题模型,并且使用多模型集成的方式,本文研究的推荐系统在迅速捕捉用户新阅读兴趣的同时不会过快的丢弃之前学习到的知识。最后,介绍了推荐系统的架构,并通过实验对算法相关参数对推荐效果的影响进行了探讨。
|
全文目录
摘要 5-6 Abstract 6-9 图目录 9-10 表目录 10-11 第1章 绪论 11-16 1.1 课题背景 11-12 1.2 研究意义 12-13 1.3 本文所作的工作 13 1.4 论文结构安排 13-14 1.5 本章小结 14-16 第2章 相关研究 16-27 2.1 个性化推荐技术 16-18 2.2 基于内容的推荐算法 18 2.3 协同过滤算法 18-22 2.3.1 基于用户的协同过滤 19-21 2.3.2 基于项目的协同过滤 21-22 2.4 主题模型 22-23 2.4.1 LDA模型 22-23 2.5 概念漂移 23-26 2.5.1 概念漂移问题概述 23-24 2.5.2 概念漂移问题的主要研究领域 24-26 2.6 本章小结 26-27 第3章 基于LDA的标签主题建模图书推荐方法 27-46 3.1 算法思想概述 27-28 3.2 数据集 28-32 3.2.1 用户阅读记录的处理 28-31 3.2.2 图书标签的处理 31-32 3.3 图书标签主题模型的建立 32-38 3.4 用户模型的建立 38-42 3.5 推荐结果的生成 42-44 3.5.1 对用户-主题矩阵的理解 42-43 3.5.2 用户相似度的计算 43 3.5.3 预测推荐项目的评分 43-44 3.6 本章小结 44-46 第4章 主题模型的集成方法 46-54 4.1 用户兴趣的概念漂移 46-47 4.2 概念漂移的检测 47-50 4.2.1 数据流的定义 48 4.2.2 窗口的定义 48-49 4.2.3 概念漂移的检测方法 49-50 4.3 多模型集成方法 50-53 4.3.1 模型的选择 50-51 4.3.2 模型集成的权重 51-53 4.4 本章小结 53-54 第5章 基于标签主题建模的图书推荐系统实现与实验 54-63 5.1 系统总体架构 54-55 5.2 日志处理模块 55-57 5.3 算法实验 57-61 5.3.1 实验数据 57-58 5.3.2 实验设计 58 5.3.3 实验结果 58-61 5.4 本章小结 61-63 第6章 总结与展望 63-65 6.1 总结 63 6.2 展望 63-65 参考文献 65-68 致谢 68-69 作者简历 69
|
相似论文
- 数字图书馆信息资源开发利用中的著作权集体管理研究,D923.41
- 基于论文关键词聚类的用户兴趣模型细化方法研究,TP391.3
- 数字图书馆信息服务视域下的著作权问题研究,D923.41
- 基于云计算的数字图书馆服务模式研究,G250.76
- 数字图书馆网络服务架构研究与实践,TP393.09
- 数字图书馆适用法定许可制度研究,D923.41
- 基于自然遗忘的个性化推荐算法研究,TP311.52
- 基于大众标注的个性化推荐系统研究,TP393.09
- 基于知识链的数字图书馆信息资源整合研究,G250.76
- 协同过滤推荐系统中关键问题研究与实现,TP311.52
- 国内外数字图书馆版权问题解决方案研究,D923.41
- 面向数字图书馆的信息网络传播权优化研究,D923.41
- 能力导向终身学习个性化推荐系统学习者模型构建,G720
- 面向终身学习的能力导向个性化推荐系统中资源的建设与共享机制研究,G720
- 基于VRML的数字图书馆网上漫游系统设计,TP391.9
- 面向电子商务的Web数据挖掘应用研究,TP311.13
- 改进的协同过滤算法在推荐系统中的研究,TP391.3
- 可持续发展的宁波市区域数字图书馆建设模式探析,G250.76
- 农业知识推送模型及向量特征项提取算法研究,F320.1
- 终身学习个性化推荐系统中学习者个人能力发展研究,G77
- 基于知识整合的数据流分类算法研究,TP311.13
中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机的应用 > 信息处理(信息加工) > 检索机
© 2012 www.xueweilunwen.com
|