学位论文 > 优秀研究生学位论文题录展示
一种冗余规则删减方法及其应用
作 者: 王娜
导 师: 叶鑫
学 校: 大连理工大学
专 业: 信息管理与电子政务
关键词: 关联规则挖掘 冗余规则 先验性知识 本体
分类号: TP311.13
类 型: 硕士论文
年 份: 2011年
下 载: 21次
引 用: 0次
阅 读: 论文下载
内容摘要
冗余规则的存在是导致超大数量关联规则产生的原因之一。冗余规则通常与用户所熟知的先验性知识相一致,或与已挖掘得到的规则表达相同信息,因此这类规则不能为用户带来新的信息,对辅助决策没有意义。这类无意义规则的存在不仅造成了挖掘资源的浪费,更影响了用户对有趣规则的选择和使用,降低了挖掘结果的有效性。针对上述问题,本文在对相关研究综述的基础上总结和明确了冗余规则的定义,对用于删减冗余规则的先验性知识的基本特征进行了分析,提出了冗余规则的判定定理和引理。在此基础上提出了一种新的冗余规则删减方法,并对其中的核心算法进行了设计和伪代码编写。该方法利用了先验性知识的必然性特征,同时使用先验性知识和已挖掘得到的置信度为100%的规则(special-rule)对频繁项集进行判断,能够在进行置信度计算之前就可以避免冗余规则的产生。为了便于方法的应用和检验,本文设计和初步实现了融入先验性知识的关联规则挖掘原型系统。该系统在原有关联规则挖掘系统的基础上增加了本体知识搜索功能和冗余规则删减功能,将先验性知识融入到了冗余规则的判断中,能够更有效地删减无意义规则。最后将该系统应用于公安刑事案件信息分析中。本文对先验性知识和置信度为100%的关联规则导致冗余规则产生的原因进行了分析,对融入先验性知识的冗余规则删减研究进行了尝试,为冗余规则的删减研究提供了一种新的思路和方法。本文的研究来源于项目实际问题,并将研究成果应用于实践,经初步验证,取得了一定的效果,证明了方法的有效性。
|
全文目录
摘要 4-5 Abstract 5-7 1 绪论 7-11 1.1 研究背景及问题的提出 7-8 1.2 研究意义 8 1.3 技术路线与研究内容 8-11 1.3.1 技术路线 8-9 1.3.2 研究内容 9-11 2 相关文献综述 11-20 2.1 数据挖掘流程 11-13 2.2 关联规则研究 13-16 2.3 本体研究 16-20 3 一种冗余关联规则删减方法 20-31 3.1 冗余关联规则的定义 20-21 3.2 冗余规则相关定理及证明 21-25 3.3 冗余关联规则删减方法 25-31 4 原型系统设计与构建 31-43 4.1 体系结构设计 31-32 4.2 系统主要模块功能设计 32-34 4.3 系统的实现 34-43 4.3.1 选择的工具 34-35 4.3.2 系统核心类的设计与开发 35-43 5 面向公安刑事案件领域的应用 43-51 5.1 数据采集及本体构建 43-46 5.2 非冗余关联规则挖掘及结果分析 46-51 结论 51-52 参考文献 52-55 攻读硕士学位期间发表学术论文情况 55-56 致谢 56-57
|
相似论文
- 哲学思想在指导中学数学教学中的作用,G633.6
- 基于本体的语义检索研究,TP391.3
- 不同人群本体感觉差异性比较及脑机制研究,B845
- 卢卡奇《关于社会存在本体论》中的劳动范畴,B515
- 基于分布式描述逻辑的本体模块化构建方法研究,TP391.1
- 一种基于领域本体的语义Web服务匹配和组合方法,TP393.09
- WordNet和《中国分类主题词表》的映射研究,G254
- 拉图尔的行动者网络理论研究,N02
- 基于跨语言信息检索的企业竞争情报收集系统模型研究,TP391.3
- 220kV输电线路除冰机器人机械本体研究,TP242
- 基于本体的食品投诉文档文本聚类研究,TP391.1
- 关系数据库到RDF(S)映射方法的研究,TP311.13
- 基于语义的Web服务发现研究,TP393.09
- 本体在智能小区中的应用研究,TP391.1
- 基于领域本体的海洋环境数据仓库设计,TP311.13
- 数据空间中数据资源之间关联关系发现模型研究,TP311.13
- 普适计算下智能空间的哲学探究,N02
- 企业级软件组件质量保障与快速部团策略的研究,TP311.53
- 情景应对模式下数字化应急预案的语义模型研究,TP391.1
- 一种基于语义的建筑工程质量检测方法研究,TP391.1
- 基于本体的医学命名实体识别技术研究,TP391.1
中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机软件 > 程序设计、软件工程 > 程序设计 > 数据库理论与系统
© 2012 www.xueweilunwen.com
|