学位论文 > 优秀研究生学位论文题录展示
序列模糊概念格模型及其分布处理研究
作 者: 袁运浩
导 师: 李云
学 校: 扬州大学
专 业: 计算机应用技术
关键词: 形式概念分析 概念格 模糊形式背景 模糊概念格 数据挖掘 序列模式挖掘 分布序列模式
分类号: TP311.13
类 型: 硕士论文
年 份: 2009年
下 载: 80次
引 用: 1次
阅 读: 论文下载
内容摘要
随着社会经济与科学技术的发展,信息技术得到了广泛的应用,许多领域积累了大量的数据,迫切需要一种新技术与工具来帮助人们快速地从海量的数据中找出重要的有价值的信息,数据挖掘技术就是基于这种背景应运而生。而作为数据挖掘的一个重要研究内容—序列模式挖掘,已经得到了许多研究,提出了许多有关序列模式挖掘的算法,如AprioriAll算法、SPADE算法以及PrifixSpan算法等等,而且序列模式挖掘在许多领域得到了广泛的应用,如顾客购买行为分析、Web访问模式分析以及DNA序列分析等等。但是,目前已经提出的许多序列模式挖掘算法仅仅是挖掘出满足用户指定的最小支持度minsup的序列模式,并没有考虑序列模式的重要性,即虽算法挖掘出的所有的序列模式都满足用户指定最小支持度minsup,但用户可能更关注比较重要的序列模式,它们虽然不能满足用户指定最小支持度,但是这些序列对用户来说比较有价值;相反地,有些序列模式可能对用户来说重要程度并不是很大,并不需要挖掘,这就需要算法能够自适应地调整以挖掘出符合用户需求的序列模式,但已提出的挖掘算法没有考虑这种特征,无法挖掘出这样的序列模式。由于形式概念分析中的概念格模型只需访问一次数据库就可构建成功,并且它的知识与层次表达能力强,将序列引入概念格中,只需存储最大公共子序列,减少了冗余序列的产生。为此,本文对序列模式挖掘与模糊概念格的结合进行了系统的研究,主要研究成果如下:(1)针对目前概念格构造算法在较大规模稀疏的数据集或分布式的数据集上,生成概念时仍然需要耗费大量的时间,本文提出了一种基于IE-Tree(Intension and Extension Tree)与特征空间划分的概念生成算法IETreeCS(Concept Set based on Intension and Extension Tree)。IETreeCS算法首先将形式背景转为IE-Tree,减少了数据集的存储量;然后该算法在IE-Tree的基础上进行了特征空间的描述与划分,最后给出了完整的IETreeCS算法。实验结果表明该算法在较大规模稀疏的数据集或分布式的数据集上性能优越,有明显地提高。同时,IETreeCS算法也为序列模糊概念格的构建提供了算法支持。(2)为了组织与挖掘有价值的满足多需求的序列模式,本文提出了一种序列模糊概念格模型,并给出了序列模糊概念格的构造算法SeqFuzCL(Sequence Fuzzy Concept Lattice)。在传统的模糊形式背景的基础上,本文将其在序列上进行了扩展,定义了序列模糊形式背景;利用扩展的序列模糊形式背景,定义了概念的Galois闭包连接、序列模糊概念及其格结构,最后给出了序列模糊概念格的构建算法SeqFuzCL。通过实验表明,序列模糊概念格模型不仅可以方便有效的组织自适应序列模式,在时间与空间上都具有良好的性能,而且还可以在序列模糊概念格上挖掘传统意义下的序列模式,同时,为进一步挖掘自适应序列模式提供了理论支持。(3)由于在实际应用中,许多大型数据库是以分布式的形式存在的,为了能够有效与方便地处理分布环境下的序列,本文在序列模糊概念格的基础上提出了分布序列模糊概念格模型及其构建算法DSeqFuzCL(Distributed Sequence Fuzzy Concept Lattice)。在分布序列模糊概念格模型上,不仅可以有效挖掘分布序列模式,而且还可以挖掘满足用户多需求的特殊分布序列模式,如分布加权序列模式等。通过实验证明,本文提出的分布序列模糊概念格构建算法DSeqFuzCL具有良好的时间与空间性能。(4)在序列模糊概念格的基础上,利用序列权重与序列的重要度阈值,本文定义了序列自适应系数及其自适应序列模式SASP(Self-adaptive Sequence Pattern),给出了基于序列模糊格的自适应序列模式的发现算法SASeqP(Self-adaptive Sequence Pattern)。它可以自适应地调整用户指定的最小支持度minsup,以挖掘出满足用户需求的特别有价值的序列模式。
|
全文目录
摘要 7-9 ABSTRACT 9-12 第一章 绪论 12-18 1.1 论文研究背景与选题依据 12-15 1.2 论文主要内容与创新 15-17 1.3 论文内容组织 17-18 第二章 概念格理论与序列模式挖掘 18-39 2.1 概念格模型 18-25 2.1.1 概念格的基本概念 18-20 2.1.2 概念格构造算法 20-25 2.1.3 概念格的应用 25 2.2 序列模式挖掘 25-38 2.2.1 序列模式挖掘的基本概念 26-29 2.2.2 序列模式挖掘典型算法 29-37 2.2.3 序列模式挖掘的应用 37-38 2.3 小结 38-39 第三章 基于IE-TREE 与特征空间划分的概念生成算法 39-50 3.1 引言 39 3.2 基于IE-TREE的概念生成 39-45 3.2.1 IE-Tree 的结构与描述 40-41 3.2.2 IE-Tree 生成算法 41-42 3.2.3 IE-Tree 上的特征空间与概念 42-45 3.3 概念生成算法IETREECS 的描述 45-46 3.4 实验结果与分析 46-49 3.5 小结 49-50 第四章 序列模糊概念格模型及其构造算法 50-69 4.1 引言 50-51 4.2 模糊形式概念分析概述 51-54 4.2.1 模糊概念格 51-53 4.2.2 模糊概念格构造算法 53-54 4.3 序列模糊概念格模型 54-62 4.3.1 序列模糊形式背景 54-58 4.3.2 序列模糊概念 58-62 4.4 序列模糊概念格及其构造算法 62-65 4.5 实验结果与分析 65-68 4.6 小结 68-69 第五章 分布序列模糊概念格模型及构造算法 69-87 5.1 引言 69-70 5.2 分布序列模糊概念格模型 70-76 5.2.1 局部与全局序列模糊形式背景 70-71 5.2.2 序列模糊概念格的分布处理 71-76 5.3 分布序列模糊概念格的构造算法 76-83 5.3.1 DSeqFuzCL 算法描述 76-79 5.3.2 DSeqFuzCL 算法实例分析 79-83 5.4 实验结果与分析 83-86 5.4.1 实验结果 83-84 5.4.2 实验分析 84-86 5.5 小结 86-87 第六章 基于序列模糊概念格的自适应序列模式挖掘 87-94 6.1 引言 87-88 6.2 自适应序列模式 88-91 6.2.1 自适应序列描述 88-90 6.2.2 自适应序列模式挖掘 90-91 6.3 实验结果与分析 91-93 6.4 小结 93-94 第七章 结束语 94-97 致谢 97-98 参考文献 98-106 攻读硕士期间撰写的主要论文 106 攻读硕士期间参加的科研项目 106
|
相似论文
- 基于数据挖掘技术的保健品营销研究,F426.72
- 高忠英学术思想与经验总结及运用补肺汤加减治疗呼吸系统常见病用药规律研究,R249.2
- 张炳厚学术思想与临床经验总结及应用地龟汤类方治疗慢性肾脏病的经验研究,R249.2
- 不完备信息系统的完备化及其上的知识获取,TP311.13
- 基于DFS的概念学习机制研究,TP181
- 基于兴趣度的Web日志用户访问序列模式挖掘,TP311.13
- 基于数据仓库与数据挖掘技术的计算机审计模型及其应用研究,TP311.13
- 基于WEB平台的家电类产品智能导购系统的研究,TP311.52
- 形式概念中的粒计算,TP18
- 基于改进的ID3算法的蛋白质纯化方法研究,Q51
- 基于数据挖掘的入侵检测技术的研究,TP393.08
- 基于蚁群算法的聚类算法研究,TP311.13
- 数据挖掘及决策支持技术在医院中的应用研究,TP311.13
- 基于数据挖掘的资费套餐优化,F626
- 一种城市应急智能决策系统的研究与实践,TP393.09
- 面向隐私保护的关联规则挖掘研究,TP311.13
- 高校图书馆管理系统的个性化服务的设计与实现,TP311.52
- 基于数据挖掘的三维模型表征、索引与检索研究,TP391.3
- 监狱警务综合管理系统的设计与实现,TP311.52
- 基于隐私保护的多步攻击关联方法研究,TP311.13
- 基于数据仓库的学生管理决策支持系统设计与实现,TP311.52
中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机软件 > 程序设计、软件工程 > 程序设计 > 数据库理论与系统
© 2012 www.xueweilunwen.com
|