学位论文 > 优秀研究生学位论文题录展示
一种利用类标号关系的多类标号分类算法
作 者: 张亚亚
导 师: 范明
学 校: 郑州大学
专 业: 计算机软件与理论
关键词: 多类标号分类 特征选择 数据挖 互信息 机器学习
分类号: TP181
类 型: 硕士论文
年 份: 2012年
下 载: 44次
引 用: 0次
阅 读: 论文下载
内容摘要
传统的分类问题中,一个实例只和一个类标号相关联,但是多类标号分类问题中,一个实例可以和多个类标号相关联,所以,与单类标号分类问题的任务不同,多类标号分类的任务是为一个新实例预测一个合适的类标号集合。目前,如何充分利用类标号之间关联关系是多类标号分类问题成功的关键,但是,已有的多类标号分类方法往往认为类标号之间是相互独立的,忽略了类标号之间的关联关系,失去了大量的可利用信息,严重影响了分类器的性能。为了解决上面提到的问题,本文提出了一种新的多类标号分类方法(multi-label classification by exploiting relationship of labels,简称MCER)。该算法有效的利用了类标号之间的关联关系,MCER算法有两个关键步骤:(1)在原类标号集合中加入一个虚拟类标号,然后为每一对的类标号学习一个分类器。虚拟类标号主要用于预测过程中。(2)在为一对类标号学习分类器时,MCER算法以互信息为标准选择与待学习类标号对关联程度较大的类标号,并视它为一般的特征属性。在预测阶段,MCER算法得到对每一个类标号的投票数,并根据虚拟类标号的投票数(阈值)对未见样本进行预测。实验结果与分析表明,在大部分数据集上,MCER算法表现出显著优势。本文的研究内容可以应用在很多领域,如文本分类、基因功能的预测以及对图片和音频的语义标注等众多领域。对于加快各个领域的发展具有十分重要的意义。
|
全文目录
摘要 4-5 Abstract 5-8 1 绪论 8-12 1.1 研究背景与现状 8-10 1.2 本文工作概述 10-11 1.3 本文内容与框架 11-12 2 背景知识 12-27 2.1 符号约定 12 2.2 分类的概念 12-13 2.3 相关定义 13-14 2.4 特征选择 14-15 2.5 已有的多类标号分类算法 15-27 2.5.1 问题转换 16-26 2.5.1.1 (Binary relevance)BR方法 17-19 2.5.1.2 CC(The Classifier Chain Model)方法 19-21 2.5.1.3 Ranking by Pairwise Comparison(RPC)方法 21-23 2.5.1.4 Calibrated Label Ranking(CLR)方法 23-26 2.5.2 扩展单类标号分类算法 26-27 3 利用类标号关系的多类标号分类方法 27-35 3.1 存在问题以及改进方向 27-29 3.1.1 存在问题 27-28 3.1.2 改进方向 28-29 3.2 算法思想 29-33 3.3 算法分析 33-35 4 实验设计与性能分析 35-45 4.1 实验数据集 35-37 4.2 衡量标准 37-38 4.3 实验结果 38-43 4.3.1 实验一结果 39-40 4.3.2 实验二结果 40-41 4.3.3 实验三结果 41 4.3.4 实验四结果 41-42 4.3.5 实验五结果 42-43 4.4 实验结果与分析 43-45 5 总结及展望 45-47 参考文献 47-50 致谢 50-51 个人简历、在学期间发表的学术论文与研究成果 51
|
相似论文
- 词义消歧语料库自动获取方法研究,TP391.1
- 基于仿生模式识别的文本分类技术研究,TP391.1
- 唇读中的特征提取、选择与融合,TP391.41
- 流形学习的方差最小化准则,TP181
- 上位作用特征基因的选择与分类方法研究,Q78
- 语音情感识别的特征选择与特征产生,TP18
- 基于聚类分析的网络流量分类研究,TP393.06
- 英汉命名实体翻译方法研究,TP391.2
- 基于机器学习方法的网络流量分类研究,TP393.06
- 基于机器学习算法的P2P流量分类研究,TP393.02
- 基于贝叶斯理论的网络流量分类研究,TP393.06
- 弥散敏感度b值在脑梗塞多谱MR图像分割中的应用研究,TP391.41
- Web视频资源的智能发现关键技术研究,TP393.092
- 动态分布式网络入侵模式研究,TP393.08
- 基于内容挖掘的中文垃圾邮件过滤技术研究,TP393.098
- 基于最小风险的贝叶斯邮件过滤算法研究,TP393.098
- 支持向量机在入侵检测系统中的研究和应用,TP393.08
- 基于特征间合作度的非监督特征选择算法,TP18
- 支持向量机在入侵检测系统中的应用,TP18
- 集成学习算法研究,TP181
- 发动机机械故障诊断系统特征提取算法研究,TK407
中图分类: > 工业技术 > 自动化技术、计算机技术 > 自动化基础理论 > 人工智能理论 > 自动推理、机器学习
© 2012 www.xueweilunwen.com
|