学位论文 > 优秀研究生学位论文题录展示
基于全方位优化算法的马田分类和排序评价方法研究及应用
作 者: 牛俊磊
导 师: 程龙生
学 校: 南京理工大学
专 业: 管理科学与工程
关键词: 分类 马田系统 多目标优化 全方位优化算法 不平衡数据 多类分类 特征变量筛选 排序评价
分类号: C934
类 型: 博士论文
年 份: 2012年
下 载: 60次
引 用: 0次
阅 读: 论文下载
内容摘要
数据挖掘是从数据中获取知识和信息,并进行决策的有效手段。分类是数据挖掘的重要任务,它根据样本的数据特征判定其所属类别。目前许多成熟有效且各具特点的分类方法得到了深入研究和广泛应用,但仍有各自的局限性和不足。在分类过程中,特征变量筛选通常能够起到简化问题、提高分类精度和效率的作用。马田系统(Mahalanobis-Taguchi System, MTS)是一种结合马氏距离、正交表和信噪比进行分类和诊断的新型模式识别方法。MTS具有的能够筛选重要特征变量、对数据分布不需要进行假设、分类速度快等优点使得它在工业生产、企业管理和模式识别等领域得到了广泛的应用。作为一种较新的分类方法,它在理论基础和方法使用上存在一些缺陷和严谨性问题,如:特征变量筛选方法有待改进、阈值确定主观性较强、局限于二类分类等。除了用于分类和诊断之外,MTS的特点使得它还可以用于排序(综合)评价。本文针对MTS的不足,以MTS改进为主线,以优化方法为主要手段,目标是发展MTS使其成为一种实用有效的分类和排序评价方法,并应用于现实问题。本文的研究工作有以下几个方面:(1)基于全方位优化算法的MTS二类分类方法研究针对传统MTS在分类过程中采用正交表和信噪比筛选特征变量以及采用损失函数法确定阈值存在的缺陷,使用多目标优化和全方位优化算法替代以进行改进。综合考虑分类精度、望大特性信噪比和降维程度等目标构建了多目标优化模型并用全方位优化算法求解以筛选特征变量和确定阈值;采用数据集实验和比较的方式对方法的有效性进行了验证和讨论;将方法用于产品质量检测的现实问题。研究结果表明,该方法不仅有很高的分类精度,还能有效的筛选特征变量,对传统MTS有了较大改进。(2)基于全方位优化算法和概率阈值模型的MTS不平衡数据分类方法研究类别不平衡是分类问题常常面临的挑战。MTS通过马氏距离构建一个连续测量尺度而非直接对训练样本进行学习的性质有望不受类别不平衡的影响,而阈值的合理确定对该问题更加重要。提出了一种概率阈值模型用于MTS不平衡数据分类阈值的确定;综合考虑不平衡数据分类性能评估指标的g/F值、望大型信噪比和降维程度等目标构建多目标优化模型并用全方位优化算法求解以筛选特征变量;采用数据集实验和比较的方式对方法的有效性进行检验和讨论。研究结果表明,该方法对不平衡数据有良好的分类能力,同时还能筛选重要特征变量。(3)MTS多类分类方法研究MTS是一种二类分类方法,不能直接用于多类分类。本文研究了两种MTS多类分类方法——二叉树MTS和多马氏空间特征变量筛选MTS。二叉树MTS通过二叉树与MTS的结合,将多类分类问题进行分解。研究了二叉树MTS的实施过程和步骤,以及二叉树的构建方案等。多马氏空间特征变量筛选MTS通过为每类构建马氏空间,运用距离判别思想构建分类器,同时优化特征空间。研究了多马氏空间特征变量筛选MTS的实施过程和步骤,综合考虑分类精度、改进的望大型信噪和降维程度等目标构建多目标优化模型并用全方位优化算法求解以筛选特征变量。采用数据集实验和比较的方式对两种方法的有效性进行了检验和讨论。最后将MTS多类分类方法应用于政府投融资平台企业的信用等级评价。研究结果表明,多马氏空间特征变量筛选MTS有着更高的分类精度和特征变量筛选效果,具有更高的应用价值。(4)MTS排序评价方法研究MTS目前主要用于分类问题。实际上,MTS可计算出样本相对于基准空间(马氏空间)的马氏距离,得出样本偏离的程度,从而对待测样本进行排序。本文研究MTS排序评价方法,具体包括:MTS排序评价方法的过程及步骤;基于全方位优化算法的评价指标筛选模型;采用算例和比较的方式对MTS排序评价的有效性进行分析和讨论。研究结果表明,MTS排序评价方法不需要确定指标权重,能够保持评价基准的一致,且能够筛选指标,是一种有效的评价方法,但基准空间的确定机制需要进一步研究和完善。综合以上研究工作,本文的主要贡献和创新点有:(1)识别不同的分类或排序评价目标,在MTS特征变量筛选这一核心问题中导入优化思想,创新性的提出和研究了特征变量筛选的多目标优化模型以替代传统MTS的正交表,并采用先进的全方位优化算法求解,是一种新的特征变量筛选方法。(2)根据不同的分类目的,采用优化或概率模型替代传统MTS的损失函数(或穷举法)来确定MTS进行分类时需要的阈值,这是MTS新的闽值确定办法。(3)通过概率闽值模型、二叉树和多马氏空间等手段,将MTS二类分类方法成功的扩展到了不平衡数据分类和多类分类,并验证了这些方法的有效性,是新的不平衡数据分类方法和多类分类方法。
|
全文目录
摘要 5-7 Abstract 7-13 1 绪论 13-24 1.1 研究背景及意义 13-15 1.2 MTS国内外研究现状及评述 15-18 1.2.1 国外研究现状 15-16 1.2.2 国内研究现状 16-18 1.2.3 已有贡献和研究不足 18 1.3 本文的主要工作、解决的科学问题和拟创新点 18-21 1.3.1 本文的主要工作 18-20 1.3.2 本文解决的关键科学问题 20-21 1.3.3 本文的拟创新点 21 1.4 本文的研究方法和技术路线 21-23 1.5 论文的章节结构安排 23-24 2 相关理论及方法概述 24-48 2.1 分类问题 24-30 2.1.1 分类问题描述 24-25 2.1.2 分类问题常用方法 25-30 2.2 MTS 30-40 2.2.1 马氏距离 31-33 2.2.2 正交表 33 2.2.3 信噪比 33-35 2.2.4 确定异常样本的方向 35 2.2.5 MTS阈值确定方法 35-37 2.2.6 MTS的实施步骤 37-38 2.2.7 MTS的其他相关问题 38-40 2.2.8 MTS的特点 40 2.3 多目标优化 40-43 2.4 基于全局准则法的全方位优化算法 43-47 2.4.1 全局准则法 43 2.4.2 全方位优化算法 43-44 2.4.3 全方位优化算法的步骤和伪代 44-46 2.4.4 若干算子介绍 46-47 2.5 本章小结 47-48 3 基于全方位优化算法的MTS二类分类方法研究 48-79 3.1 传统MTS分类方法 50-56 3.1.1 传统MTS分类方法的实施过程和步骤 50-52 3.1.2 传统MTS分类方法实验 52-56 3.2 MTSO分类方法的实施过程和步骤 56-58 3.3 MTSO特征变量筛选和阈值确定的多目标优化模型 58-64 3.3.1 优化目标 59-63 3.3.2 多目标优化模型及求解方法 63-64 3.4 MTSO性能评估的实验分析 64-74 3.4.1 分类方法性能的评估指标和数据集 64-66 3.4.2 分类精度的计算结果 66-69 3.4.3 比较研究 69-73 3.4.4 结果和讨论 73-74 3.5 应用研究 74-78 3.5.1 背景描述 74 3.5.2 实施 74-77 3.5.3 效益分析 77-78 3.6 本章小结 78-79 4 基于全方位优化算法和概率阈值模型的MTS不平衡数据分类方法研究 79-97 4.1 概率阈值模型 80-82 4.2 MTSOP不平衡数据分类方法的实施过程和步骤 82-84 4.3 MTSOP特征变量筛选的多目标优化模型 84-87 4.3.1 不平衡数据分类效果评价指标 84-85 4.3.2 优化目标 85-86 4.3.3 多目标优化模型及求解方法 86-87 4.4 MTSOP性能评估的实验分析 87-95 4.4.1 分类方法性能的评估指标和数据集 87-88 4.4.2 与常规方法比较 88-94 4.4.3 与改进的SVM比较 94 4.4.4 结果和讨论 94-95 4.5 本章小结 95-97 5 MTS多类分类方法研究 97-118 5.1 BT-MTS多类分类方法 99-103 5.1.1 BT-MTS 99-100 5.1.2 BT-MTS多类分类方法的实施过程和步骤 100-101 5.1.3 二叉树结构确定方案 101-103 5.2 MF-MTS多类分类方法 103-109 5.2.1 MF-MTS多类分类方法的实施过程和步骤 103-106 5.2.2 MF-MTS特征变量筛选的多目标优化模型 106-109 5.3 MTS多类分类方法性能评估的实验分析 109-113 5.3.1 分类方法性能的评估指标和数据集 109 5.3.2 比较研究 109-112 5.3.3 结果和讨论 112-113 5.4 应用研究 113-116 5.4.1 背景描述 113-114 5.4.2 实施 114-115 5.4.3 分析和讨论 115-116 5.5 本章小结 116-118 6 基于全方位优化算法的MTS排序评价方法研究 118-131 6.1 MTS排序评价方法的实施过程和步骤 121-124 6.2 MTS排序评价方法评价指标筛选的多目标优化模型 124-126 6.2.1 优化目标 124-126 6.2.2 优化模型 126 6.3 MTS排序评价方法有效性的算例研究 126-130 6.3.1 实施评价 126-127 6.3.2 分析与讨论 127-130 6.4 本章小节 130-131 7 结论与展望 131-135 7.1 工作总结 131-133 7.2 本文的创新点 133 7.3 研究展望 133-135 参考文献 135-147 致谢 147-148 附录 148-149
|
相似论文
- K公司计划及预测改进对于合理库存配置的研究,F224
- 基于蚁群算法的电梯群优化控制研究,TU857
- 空间目标ISAR成像仿真及基于ISAR像的目标识别,TN957.52
- 基于词义及语义分析的问答技术研究,TP391.1
- 基于三维重建的焊点质量分类方法研究,TP391.41
- 基于串核的蛋白质分类算法的研究与实现,TP301.6
- 统计与语言学相结合的词对齐及相关融合策略研究,TP391.2
- 上下文相关的词汇复述研究,TP391.1
- 基于仿生模式识别的文本分类技术研究,TP391.1
- 互联网上旅游评论的情感分析及其有用性研究,TP391.1
- 基于SVM的中医舌色苔色分类方法研究,TP391.41
- 基于图像的路面破损识别,TP391.41
- 多样性密度学习算法的研究与应用,TP181
- 运动特征及地形约束的感知网目标跟踪算法及系统研究,TP212.9
- 计算智能在数字化卷烟叶组配方中的应用研究,TS44
- 基于中国土壤系统分类的土壤类型和界线确定研究,S155
- 弯孢属种分子鉴定体系的建立及其在疑难种上的应用,Q949.32
- 基于视觉的番木瓜外观品质检测技术研究,S667.9
- 面向公众的教育视频共建共享平台的设计与实践研究,G434
- 基于土壤系统分类的土壤调查方法研究,S155
- 西藏生防芽孢杆菌鉴定及其脂肽化合物分析,S476.1
中图分类: > 社会科学总论 > 管理学 > 决策学
© 2012 www.xueweilunwen.com
|