学位论文 > 优秀研究生学位论文题录展示
关联规则增量挖掘算法研究及应用
作 者: 王琰
导 师: 周爱武
学 校: 安徽大学
专 业: 计算机应用技术
关键词: 关联规则增量挖掘 FUP TD-FP-Tree更新 元搜索引擎 查询扩展 个性化
分类号: TP311.13
类 型: 硕士论文
年 份: 2013年
下 载: 29次
引 用: 0次
阅 读: 论文下载
内容摘要
如何从大量数据中获取不同的个性化信息是信息检索领域的研究热点。此方面的研究主要包括元搜索引擎和查询扩展。综合多个搜索引擎返回结果的元搜索引擎其关注点在于为用户提供更多查询结果,查询扩展则通过将用户提交短查询扩展为更多关键词使得查询结果更贴近用户需求。关联规则挖掘是数据挖掘中的一个重要研究方向,也是查询扩展使用的一种重要方法。本文不仅提出了一种改进的关联规则增量挖掘算法,而且结合元搜索引擎和基于此关联规则的查询扩展,提出个性化元搜索引擎的概念。本文首先讨论查询扩展使用的关联规则增量挖掘算法。分析在基于FP-Tree的结构上进行增量挖掘时影响挖掘效率的因素以及FUFP中快速更新FP-Tree实现增量挖掘的策略。本文将基于Apriori的典型增量挖掘算法FUP思想引入TD-FP-Growth算法中TD-FP-Tree的快速更新,提出TD-FP-Tree快速更新算法(PFU-TDFP)。算法通过将所有涉及项分类处理,减少扫描原始事务数据库的可能和次数,且当出现由非频繁转为频繁的项时减少重新排序事务中项所要处理的事务数目,并在某些步骤采用并行处理进一步提高效率。实验表明,本文提出的算法不仅可以快速更新TD-FP-Tree,而且在同基于FP-Tree结构的增量挖掘相比可以进一步提升整体挖掘效率。接着使用PFU-TDFP算法挖掘用户的搜索结果浏览习惯用于查询扩展,使得查询关键词组可以体现用户的行业背景和兴趣倾向,结合元搜索引擎提出个性化元搜索引擎的概念。对元搜索引擎的结果融合提出基于搜索结果的排序、题目和摘要等局部相似度的一种新的结果融合评分模型。最终实现了系统原型,对系统的实验表明,应用PFU-TDFP可以快速更新挖掘用户搜索浏览习惯,本文提出的元搜索引擎结果融合评分公式在P@N方法测试下也会为用户提供更个性化的搜索结果。
|
全文目录
摘要 3-4 Abstract 4-6 目录 6-8 第一章 绪论 8-15 1.1 研究背景、课题与意义 8-11 1.1.1 研究背景 8-9 1.1.2 研究课题 9-10 1.1.3 研究意义 10-11 1.2 国内外研究现状 11-13 1.2.1 关联规则挖掘研究现状 11-12 1.2.2 元搜索引擎发展现状 12-13 1.3 论文结构安排 13-14 1.4 论文创新点 14-15 第二章 基于FUP的TD-FP-Tree快速更新算法 15-29 2.1 关联规则挖掘与更新算法理论 15-18 2.1.1 关联规则静态挖掘算法 15-17 2.1.2 关联规则动态更新算法 17-18 2.2 TD-FP-Tree快速更新算法 18-25 2.2.1 算法思想 18-20 2.2.2 算法流程 20-22 2.2.3 算法分析 22-25 2.3 实验结果及分析 25-27 2.4 本章小结 27-29 第三章 基于PFU-TDFP的个性化元搜索引擎研究 29-63 3.1 元搜索引擎与查询扩展理论 29-40 3.1.1 独立搜索引擎存在的问题 29-31 3.1.2 元搜索引擎 31-32 3.1.3 查询分发 32-33 3.1.4 结果融合 33-37 3.1.5 个性化查询扩展 37-40 3.2 基于PFU-TDFP的个性化元搜索引擎设计思路 40-41 3.3 个性化元搜索引擎模块设计 41-54 3.3.1 总体设计 41-43 3.3.2 用户查询扩展模块 43-44 3.3.3 查询分发 44-48 3.3.4 结果融合 48-53 3.3.5 用户浏览行为挖掘模块 53-54 3.4 基于PFU-TDFP的个性化元搜索引擎算法 54-56 3.4.1 算法思想 54-55 3.4.2 算法流程 55-56 3.5 实验结果及分析 56-61 3.5.1 系统实现细节 56-59 3.5.2 实验结果 59-61 3.6 本章小结 61-63 第四章 总结与展望 63-65 4.1 本文的工作总结 63 4.2 今后的研究方向 63-65 参考文献 65-69 致谢 69-70 附录:攻读硕士学位期间发表论文 70
|
相似论文
- 万科模式的居住小区设计研究,TU984.12
- 个性化检索中相似用户群的获取与更新,TP391.3
- 生物医学领域检索系统查询扩展技术研究,TP391.3
- 个性化人工膝关节设计及其生物力学特性研究,R318.1
- 大学生思想政治教育工作个性化教育的研究,G641
- OQAS对不同制瓣方式的个性化LASIK手术术后视觉质量的评估,R779.63
- 网络搜索引擎的相关技术研究,G354
- 基于查询扩展的信息抽取技术研究及应用,TP391.1
- Deep Web接口集成及查询结果排序方法研究,TP274
- 中高档乘用车4S店售后技术服务研究,F273.1
- 开放式个性化网络教育学习流程设计研究,G434
- WEB个性化信息采集与管理关键技术研究,TP393.09
- 基于本体的教学资源语义检索研究,TP391.3
- 基于随机游走模型的个性化信息推荐,TP391.3
- 基于Agent元搜索引擎的个性化研究,TP391.3
- 英汉跨语言问答系统中的文档语义检索,TP391.1
- 网络舆情信息采集系统的设计与实现,TP393.09
- 广告搜索中的查询处理算法,TP391.3
- 基于本体的地理信息表示与检索,P208
- 关节式物体检测识别及应用,TP391.41
- 以鉴赏为中心的中学诗歌教学初探,G633.3
中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机软件 > 程序设计、软件工程 > 程序设计 > 数据库理论与系统
© 2012 www.xueweilunwen.com
|