学位论文 > 优秀研究生学位论文题录展示
基于成对约束的聚类和降维算法研究
作 者: 朱凤梅
导 师: 张道强
学 校: 南京航空航天大学
专 业: 计算机应用技术
关键词: 半监督学习 半监督聚类 成对约束 降维 竞争聚类 集成学习 张量分析
分类号: TP18
类 型: 硕士论文
年 份: 2009年
下 载: 32次
引 用: 0次
阅 读: 论文下载
内容摘要
近年来,半监督学习因其卓越的性能逐渐受到模式识别和机器学习领域研究者的重视。半监督学习可利用的监督信息除了少量的标记样本外,还包括样本间的成对约束等其它信息。其中与样本标记相比,成对约束所含的信息较弱,因而更容易获取。本文主要针对基于成对约束的聚类和降维算法展开研究,所取得的主要研究成果如下:(1)在竞争Renyi熵和Shannon熵聚类算法的基础上,通过引入样本之间的成对约束信息,提出一种基于成对约束的半监督竞争熵聚类算法,在一系列国际标准数据集上的实验验证了该算法的有效性。(2)提出一种基于半监督降维的聚类算法,该算法首先用半监督降维方法对原始数据进行降维,然后在降维后的空间中进行半监督聚类,实验结果表明由于在降维和聚类两个阶段中都利用了监督信息,算法的聚类性能得到很大提升。(3)把集成学习的思想引入半监督聚类,通过对成对约束进行划分,提出一种半监督投影聚类集成算法,进一步提高了算法的聚类性能,并且对集成算法的多样性进行了分析。(4)通过对图像的张量分析,提出一种张量图像上的半监督降维算法,在一系列人脸数据集上的实验表明该算法不但可以有效降低数据的维数,还可以保留图像中像素之间的局部信息。
|
全文目录
摘要 4-5 Abstract 5-13 第一章 绪论 13-19 1.1 研究意义 13-14 1.1.1 机器学习 13 1.1.2 半监督学习 13-14 1.1.3 半监督学习中的成对约束信息 14 1.2 半监督聚类的研究基础 14-16 1.2.1 现有的聚类算法 15 1.2.2 半监督聚类 15-16 1.3 半监督降维的研究基础 16-17 1.3.1 传统降维算法 16-17 1.3.2 半监督降维算法 17 1.4 本文的研究工作 17-18 1.5 本文的内容安排 18-19 第二章 基于成对约束的半监督竞争熵聚类算法 19-29 2.1 引言 19 2.2 CA 算法的重新定义 19-20 2.3 CA 算法的推广 20-22 2.3.1 Renyi 熵诱导的竞争聚类(RECA) 20-22 2.3.2 Shannon 熵诱导的竞争聚类(SECA) 22 2.4 基于成对约束的竞争熵聚类算法 22-25 2.4.1 PCRECA 算法 23-25 2.5 实验 25-28 2.5.1 数据集描述 25 2.5.2 实验设置与结果分析 25-28 2.6 小结 28-29 第三章 半监督降维聚类算法 29-37 3.1 引言 29 3.2 半监督降维聚类算法 29-32 3.2.1 半监督降维 29-31 3.2.2 半监督降维聚类算法 31-32 3.3 实验 32-36 3.3.1 UCI 数据集 33-34 3.3.2 人脸数据集 34-35 3.3.3 文本数据集 35-36 3.4 总结 36-37 第四章 半监督投影聚类集成算法 37-47 4.1 引言 37 4.2 聚类集成的研究现状 37-38 4.2.1 集成学习 37-38 4.2.2 聚类集成 38 4.3 半监督投影聚类集成算法 38-42 4.3.1 半监督聚类集成算法 38-40 4.3.2 半监督投影聚类集成算法 40-42 4.4 实验 42-46 4.4.1 数据集说明 42 4.4.2 聚类准确性度量 42-43 4.4.3 实验结果及性能分析 43-46 4.5 小结 46-47 第五章 张量图像上的半监督降维算法 47-60 5.1 引言 47 5.2 研究背景 47-49 5.2.1 研究动机 47-48 5.2.2 相关工作 48-49 5.3 图像的张量表示 49-50 5.3.1 张量代数学 49-50 5.3.2 图像的张量表示 50 5.4 张量图像上的半监督降维算法 50-53 5.5 实验 53-59 5.5.1 ORL 数据集 53-55 5.5.2 Yale 数据集 55-56 5.5.3 Yaleb 数据集 56-58 5.5.4 图像数据库的二维可视化 58-59 5.6 总结与展望 59-60 第六章 总结与展望 60-62 6.1 工作总结 60-61 6.2 未来展望 61-62 参考文献 62-69 致谢 69-70 在学期间的研究成果及发表的学术论文 70
|
相似论文
- 基于流形学习的数据降维技术研究,TP311.13
- 领域知识指导的半监督学习和主动学习倾向性分类研究,TP181
- 基于电子鼻系统的混合气体的定性分析和定量估计,TP212
- P2P流量识别方法研究,TP393.06
- 基于半监督哈希算法的图像检索方法研究,TP391.41
- 基于半监督学习的时间序列分类研究与实现,TP181
- 基于非负矩阵分解的高光谱遥感图像混合像元分解研究,TP751.1
- 数据挖掘在研究生调剂中的应用研究,TP311.13
- 基于集成学习的垃圾短信多级分类技术研究,TN929.53
- 基于专家委员会的主动学习算法研究,TP181
- 半监督学习中协同训练与多视图方法的比较及改进,TP18
- 基于粒子群优化算法的支持向量机集成学习方法研究,TP181
- 基于多任务的多层次选择性集成学习的研究,TP181
- 基于半监督SVM的入侵检测研究,TP393.08
- 面向金融问答的论坛观点挖掘,TP391.3
- 基于自适应的LVCSR系统半监督学习方法的研究,TN912.34
- 基于T-S模糊模型的循环流化床烟气脱硫系统建模的研究,X701.3
- 基于支持向量机的水电故障分类器的设计与实现,TV738
- 半监督学习若干问题的研究,TP181
- 基于少量标记数据约束聚类算法的入侵检测技术研究,TP393.08
- 基于半监督学习的中文问句分类研究,TP391.1
中图分类: > 工业技术 > 自动化技术、计算机技术 > 自动化基础理论 > 人工智能理论
© 2012 www.xueweilunwen.com
|