学位论文 > 优秀研究生学位论文题录展示

一种利用类标号关系的多类标号分类算法

作 者: 张亚亚
导 师: 范明
学 校: 郑州大学
专 业: 计算机软件与理论
关键词: 多类标号分类 特征选择 数据挖 互信息 机器学习
分类号: TP181
类 型: 硕士论文
年 份: 2012年
下 载: 44次
引 用: 0次
阅 读: 论文下载
 

内容摘要


传统的分类问题中,一个实例只和一个类标号相关联,但是多类标号分类问题中,一个实例可以和多个类标号相关联,所以,与单类标号分类问题的任务不同,多类标号分类的任务是为一个新实例预测一个合适的类标号集合。目前,如何充分利用类标号之间关联关系是多类标号分类问题成功的关键,但是,已有的多类标号分类方法往往认为类标号之间是相互独立的,忽略了类标号之间的关联关系,失去了大量的可利用信息,严重影响了分类器的性能。为了解决上面提到的问题,本文提出了一种新的多类标号分类方法(multi-label classification by exploiting relationship of labels,简称MCER)。该算法有效的利用了类标号之间的关联关系,MCER算法有两个关键步骤:(1)在原类标号集合中加入一个虚拟类标号,然后为每一对的类标号学习一个分类器。虚拟类标号主要用于预测过程中。(2)在为一对类标号学习分类器时,MCER算法以互信息为标准选择与待学习类标号对关联程度较大的类标号,并视它为一般的特征属性。在预测阶段,MCER算法得到对每一个类标号的投票数,并根据虚拟类标号的投票数(阈值)对未见样本进行预测。实验结果与分析表明,在大部分数据集上,MCER算法表现出显著优势。本文的研究内容可以应用在很多领域,如文本分类、基因功能的预测以及对图片和音频的语义标注等众多领域。对于加快各个领域的发展具有十分重要的意义。

全文目录


摘要  4-5
Abstract  5-8
1 绪论  8-12
  1.1 研究背景与现状  8-10
  1.2 本文工作概述  10-11
  1.3 本文内容与框架  11-12
2 背景知识  12-27
  2.1 符号约定  12
  2.2 分类的概念  12-13
  2.3 相关定义  13-14
  2.4 特征选择  14-15
  2.5 已有的多类标号分类算法  15-27
    2.5.1 问题转换  16-26
      2.5.1.1 (Binary relevance)BR方法  17-19
      2.5.1.2 CC(The Classifier Chain Model)方法  19-21
      2.5.1.3 Ranking by Pairwise Comparison(RPC)方法  21-23
      2.5.1.4 Calibrated Label Ranking(CLR)方法  23-26
    2.5.2 扩展单类标号分类算法  26-27
3 利用类标号关系的多类标号分类方法  27-35
  3.1 存在问题以及改进方向  27-29
    3.1.1 存在问题  27-28
    3.1.2 改进方向  28-29
  3.2 算法思想  29-33
  3.3 算法分析  33-35
4 实验设计与性能分析  35-45
  4.1 实验数据集  35-37
  4.2 衡量标准  37-38
  4.3 实验结果  38-43
    4.3.1 实验一结果  39-40
    4.3.2 实验二结果  40-41
    4.3.3 实验三结果  41
    4.3.4 实验四结果  41-42
    4.3.5 实验五结果  42-43
  4.4 实验结果与分析  43-45
5 总结及展望  45-47
参考文献  47-50
致谢  50-51
个人简历、在学期间发表的学术论文与研究成果  51

相似论文

  1. 词义消歧语料库自动获取方法研究,TP391.1
  2. 基于仿生模式识别的文本分类技术研究,TP391.1
  3. 唇读中的特征提取、选择与融合,TP391.41
  4. 流形学习的方差最小化准则,TP181
  5. 上位作用特征基因的选择与分类方法研究,Q78
  6. 语音情感识别的特征选择与特征产生,TP18
  7. 基于聚类分析的网络流量分类研究,TP393.06
  8. 英汉命名实体翻译方法研究,TP391.2
  9. 基于机器学习方法的网络流量分类研究,TP393.06
  10. 基于机器学习算法的P2P流量分类研究,TP393.02
  11. 基于贝叶斯理论的网络流量分类研究,TP393.06
  12. 弥散敏感度b值在脑梗塞多谱MR图像分割中的应用研究,TP391.41
  13. Web视频资源的智能发现关键技术研究,TP393.092
  14. 动态分布式网络入侵模式研究,TP393.08
  15. 基于内容挖掘的中文垃圾邮件过滤技术研究,TP393.098
  16. 基于最小风险的贝叶斯邮件过滤算法研究,TP393.098
  17. 支持向量机在入侵检测系统中的研究和应用,TP393.08
  18. 基于特征间合作度的非监督特征选择算法,TP18
  19. 支持向量机在入侵检测系统中的应用,TP18
  20. 集成学习算法研究,TP181
  21. 发动机机械故障诊断系统特征提取算法研究,TK407

中图分类: > 工业技术 > 自动化技术、计算机技术 > 自动化基础理论 > 人工智能理论 > 自动推理、机器学习
© 2012 www.xueweilunwen.com