学位论文 > 优秀研究生学位论文题录展示
基于约束的中垂面相似度准则及其应用
作 者: 高山
导 师: 张道强
学 校: 南京航空航天大学
专 业: 计算机软件与理论
关键词: 相似性度量 成对约束 距离度量学习 中垂面相似度 集成学习 半监督
分类号: TP311.13
类 型: 硕士论文
年 份: 2011年
下 载: 3次
引 用: 0次
阅 读: 论文下载
内容摘要
在数据挖掘和机器学习的基于距离的各种技术中,例如基于距离的聚类和基于距离的分类,如何度量数据间的相似性已经成为了一项基础任务。对于某一具体问题,采用合适的相似性度量,会使问题得到更有效的解决。越来越多的研究表明,通过对成对约束(正约束和负约束)的充分利用,从而得到与问题相匹配的相似性度量,能够大幅度的提升算法性能。目前基于约束的相似性度量研究主要是基于约束的距离度量学习,通过对约束信息的利用,学习一个距离度量矩阵,然后再进行分类或者聚类。本文通过对成对约束尤其是负约束的挖掘,提出种新的基于约束的相似性度量,主要创新和研究工作总结如下(1)通过对最近邻准则和支持向量机的分析,从中提取出中垂面的概念;从负约束对中挖掘出中垂面,提出一种基于约束的中垂面相似度准则,并在人工数据集上对如何计算相似度做了示例。(2)将基于约束的中垂面相似度准则应用于聚类任务中,提出基于约束的中垂面相似度聚类算法MPHS (Mid-Perpendicular Hyperplane Similarity)。分别在数据集线性可分和数据集线性不可分两种情况下进行聚类,提出多个具体算法。在多个UCI标准数据集和多个图像数据集上的实验表明,MPHS算法与所对比的算法在性能上有很大的提升。(3)通过在半监督聚类学习中引入集成学习的思想,提出了基于约束的中垂面相似度聚类集成算法。算法通过对约束的集成,有效的提高了在多个UCI标准数据集和多个图像数据集上的聚类性能。(4)将基于约束的中垂面相似度准则应用于分类任务中,提出了基于约束的中垂面相似度分类算法。在得到相似性矩阵后,分别应用最近邻算法和支持向量机进行分类,得到相应的分类算法mphs-1nn和mphs-svm。同时将集成学习的思想考虑到分类任务中,得到对应的集成学习算法mphs-Inn-bagging和mphs-svm-bagging。在多个UCI标准数据集上的实验结果验证了所提算法的有效性。
|
全文目录
摘要 4-5 ABSTRACT 5-10 第一章 绪论 10-16 1.1 研究背景及其意义 10 1.2 相似性度量基本知识 10-11 1.3 基于成对约束的学习 11-12 1.4 SSKK和PCP介绍 12-13 1.4.1 SSKK算法介绍 12 1.4.2 PCP算法介绍 12-13 1.5 本文的研究工作 13-14 1.6 本文的内容安排 14-16 第二章 基于约束的中垂面相似度准则 16-21 2.1 引言 16 2.2 中垂面相似度准则 16-18 2.2.1 最近邻准则 16-17 2.2.2 支持向量机 17 2.2.3 中垂面相似度准则 17-18 2.3 基于约束的中垂面相似度准则 18-19 2.4 本章小结 19-21 第三章 基于约束的中垂面相似度聚类算法 21-31 3.1 引言 21 3.2 基于约束的中垂面相似度聚类算法 21-24 3.2.1 线性可分情况 22-23 3.2.1.1 降维 22 3.2.1.2 相似度矩阵计算 22 3.2.1.3 聚类 22-23 3.2.2 线性不可分情况 23 3.2.3 MPHS算法 23-24 3.3 实验结果及分析 24-27 3.3.1 实验设置 24-26 3.3.2 聚类性能分析 26 3.3.3 参数u的选取 26-27 3.4 本章小结 27-31 第四章 基于约束的中垂面相似度聚类集成算法 31-40 4.1 引言 31-32 4.2 基于约束的中垂面相似度聚类集成算法 32-34 4.2.1 集成学习 32-33 4.2.2 BMPHS算法 33-34 4.3 实验结果与分析 34-35 4.3.1 实验设置 34 4.3.2 与单个聚类算法对比 34-35 4.3.3 与集成学习方法对比 35 4.4 本章小结 35-40 第五章 基于约束的中垂面相似度分类算法 40-46 5.1 引言 40 5.2 基于约束的中垂面相似度分类算法 40-42 5.3 基于约束的中垂面相似度分类集成算法 42-43 5.4 实验结果及分析 43-44 5.5 本章小结 44-46 第六章 总结与展望 46-48 6.1 已有工作总结 46 6.2 未来工作展望 46-48 参考文献 48-52 致谢 52-53 攻读硕士学位期间发表的学术论文 53
|
相似论文
- 人工免疫分类和异常识别算法的改进,R392.1
- 领域知识指导的半监督学习和主动学习倾向性分类研究,TP181
- 基于本体多Agent系统的交易伙伴智能发现相关技术研究,F713.36
- P2P流量识别方法研究,TP393.06
- 基于半监督哈希算法的图像检索方法研究,TP391.41
- 基于视图的三维模型检索技术研究,TP391.41
- 热点新闻间关系的研究,TP393.09
- 基于半监督学习的时间序列分类研究与实现,TP181
- 基于局部不变特征的图像匹配技术研究,TP391.41
- 图像配准技术与优化算法研究,TP391.41
- 生物医学信号的相似性度量研究,TP391.41
- 数据挖掘在研究生调剂中的应用研究,TP311.13
- 交通标志实时检测与识别技术研究,TP391.41
- 基于内容的图像检索技术研究,TP391.41
- 基于集成学习的垃圾短信多级分类技术研究,TN929.53
- 基于专家委员会的主动学习算法研究,TP181
- 半监督学习中协同训练与多视图方法的比较及改进,TP18
- 集成学习及其应用研究,TP181
- 基于粒子群优化算法的支持向量机集成学习方法研究,TP181
- 基于多任务的多层次选择性集成学习的研究,TP181
- 两种针对张量数据和多视图数据的半监督维数约简方法,TP181
中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机软件 > 程序设计、软件工程 > 程序设计 > 数据库理论与系统
© 2012 www.xueweilunwen.com
|