学位论文 > 优秀研究生学位论文题录展示

基于约束的中垂面相似度准则及其应用

作 者: 高山
导 师: 张道强
学 校: 南京航空航天大学
专 业: 计算机软件与理论
关键词: 相似性度量 成对约束 距离度量学习 中垂面相似度 集成学习 半监督
分类号: TP311.13
类 型: 硕士论文
年 份: 2011年
下 载: 3次
引 用: 0次
阅 读: 论文下载
 

内容摘要


在数据挖掘和机器学习的基于距离的各种技术中,例如基于距离的聚类和基于距离的分类,如何度量数据间的相似性已经成为了一项基础任务。对于某一具体问题,采用合适的相似性度量,会使问题得到更有效的解决。越来越多的研究表明,通过对成对约束(正约束和负约束)的充分利用,从而得到与问题相匹配的相似性度量,能够大幅度的提升算法性能。目前基于约束的相似性度量研究主要是基于约束的距离度量学习,通过对约束信息的利用,学习一个距离度量矩阵,然后再进行分类或者聚类。本文通过对成对约束尤其是负约束的挖掘,提出种新的基于约束的相似性度量,主要创新和研究工作总结如下(1)通过对最近邻准则和支持向量机的分析,从中提取出中垂面的概念;从负约束对中挖掘出中垂面,提出一种基于约束的中垂面相似度准则,并在人工数据集上对如何计算相似度做了示例。(2)将基于约束的中垂面相似度准则应用于聚类任务中,提出基于约束的中垂面相似度聚类算法MPHS (Mid-Perpendicular Hyperplane Similarity)。分别在数据集线性可分和数据集线性不可分两种情况下进行聚类,提出多个具体算法。在多个UCI标准数据集和多个图像数据集上的实验表明,MPHS算法与所对比的算法在性能上有很大的提升。(3)通过在半监督聚类学习中引入集成学习的思想,提出了基于约束的中垂面相似度聚类集成算法。算法通过对约束的集成,有效的提高了在多个UCI标准数据集和多个图像数据集上的聚类性能。(4)将基于约束的中垂面相似度准则应用于分类任务中,提出了基于约束的中垂面相似度分类算法。在得到相似性矩阵后,分别应用最近邻算法和支持向量机进行分类,得到相应的分类算法mphs-1nn和mphs-svm。同时将集成学习的思想考虑到分类任务中,得到对应的集成学习算法mphs-Inn-bagging和mphs-svm-bagging。在多个UCI标准数据集上的实验结果验证了所提算法的有效性。

全文目录


摘要  4-5
ABSTRACT  5-10
第一章 绪论  10-16
  1.1 研究背景及其意义  10
  1.2 相似性度量基本知识  10-11
  1.3 基于成对约束的学习  11-12
  1.4 SSKK和PCP介绍  12-13
    1.4.1 SSKK算法介绍  12
    1.4.2 PCP算法介绍  12-13
  1.5 本文的研究工作  13-14
  1.6 本文的内容安排  14-16
第二章 基于约束的中垂面相似度准则  16-21
  2.1 引言  16
  2.2 中垂面相似度准则  16-18
    2.2.1 最近邻准则  16-17
    2.2.2 支持向量机  17
    2.2.3 中垂面相似度准则  17-18
  2.3 基于约束的中垂面相似度准则  18-19
  2.4 本章小结  19-21
第三章 基于约束的中垂面相似度聚类算法  21-31
  3.1 引言  21
  3.2 基于约束的中垂面相似度聚类算法  21-24
    3.2.1 线性可分情况  22-23
      3.2.1.1 降维  22
      3.2.1.2 相似度矩阵计算  22
      3.2.1.3 聚类  22-23
    3.2.2 线性不可分情况  23
    3.2.3 MPHS算法  23-24
  3.3 实验结果及分析  24-27
    3.3.1 实验设置  24-26
    3.3.2 聚类性能分析  26
    3.3.3 参数u的选取  26-27
  3.4 本章小结  27-31
第四章 基于约束的中垂面相似度聚类集成算法  31-40
  4.1 引言  31-32
  4.2 基于约束的中垂面相似度聚类集成算法  32-34
    4.2.1 集成学习  32-33
    4.2.2 BMPHS算法  33-34
  4.3 实验结果与分析  34-35
    4.3.1 实验设置  34
    4.3.2 与单个聚类算法对比  34-35
    4.3.3 与集成学习方法对比  35
  4.4 本章小结  35-40
第五章 基于约束的中垂面相似度分类算法  40-46
  5.1 引言  40
  5.2 基于约束的中垂面相似度分类算法  40-42
  5.3 基于约束的中垂面相似度分类集成算法  42-43
  5.4 实验结果及分析  43-44
  5.5 本章小结  44-46
第六章 总结与展望  46-48
  6.1 已有工作总结  46
  6.2 未来工作展望  46-48
参考文献  48-52
致谢  52-53
攻读硕士学位期间发表的学术论文  53

相似论文

  1. 人工免疫分类和异常识别算法的改进,R392.1
  2. 领域知识指导的半监督学习和主动学习倾向性分类研究,TP181
  3. 基于本体多Agent系统的交易伙伴智能发现相关技术研究,F713.36
  4. P2P流量识别方法研究,TP393.06
  5. 基于半监督哈希算法的图像检索方法研究,TP391.41
  6. 基于视图的三维模型检索技术研究,TP391.41
  7. 热点新闻间关系的研究,TP393.09
  8. 基于半监督学习的时间序列分类研究与实现,TP181
  9. 基于局部不变特征的图像匹配技术研究,TP391.41
  10. 图像配准技术与优化算法研究,TP391.41
  11. 生物医学信号的相似性度量研究,TP391.41
  12. 数据挖掘在研究生调剂中的应用研究,TP311.13
  13. 交通标志实时检测与识别技术研究,TP391.41
  14. 基于内容的图像检索技术研究,TP391.41
  15. 基于集成学习的垃圾短信多级分类技术研究,TN929.53
  16. 基于专家委员会的主动学习算法研究,TP181
  17. 半监督学习中协同训练与多视图方法的比较及改进,TP18
  18. 集成学习及其应用研究,TP181
  19. 基于粒子群优化算法的支持向量机集成学习方法研究,TP181
  20. 基于多任务的多层次选择性集成学习的研究,TP181
  21. 两种针对张量数据和多视图数据的半监督维数约简方法,TP181

中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机软件 > 程序设计、软件工程 > 程序设计 > 数据库理论与系统
© 2012 www.xueweilunwen.com