学位论文 > 优秀研究生学位论文题录展示
分类建模方法在光谱水质分析中的应用研究
作 者: 明倩
导 师: 李艳君
学 校: 浙江大学
专 业: 模式识别与智能系统
关键词: 水质有机物综合指标 光谱定量分析 聚类 聚类集成 分类建模
分类号: TP274
类 型: 硕士论文
年 份: 2013年
下 载: 53次
引 用: 0次
阅 读: 论文下载
内容摘要
模型定量回归技术依赖于测量数据的特性,若测量的数据满足所用算法的假设或者分布等条件,则预测模型应用效果好,否则不理想。在水质有机物综合指标光谱法定量回归分析中,由于自然水样的复杂多变性,导致全样本单模型建模回归的精度无法保证。而根据相似的水样预测精度较高的规律,采用分类方法之一的聚类技术根据水样之间相似度分类,再进行多模型建模的方法,是解决上述问题并提高水质模型回归精度和泛化性的重要的方法之一。水质光谱定量分析技术相比较于传统基于湿化学原理的检测方法,是一种具有快速有效、灵敏度高、无二次污染、操作简单等优点的绿色检测技术。本文对水质有机物综合指标进行分类模型建模研究,建立了基于聚类算法的分类预测模型。其中,运用聚类、聚类集成,回归预测方法,对样本数据根据分类信息建立多组模型,其实验结果表明此方法相比于全数据单模型方法更能有效地利用样本信息,提供更高精度的回归模型,为水质分析提供更加可靠的检测方法。本文具体研究主要内容包括:1)首先,本文介绍了水质有机物综合指标光谱法快速检测技术的基本原理,并针对现实检测的100个水样,利用全样本单模型建立了水质总有机碳(TOC)指标的最小二乘支持向量机(LSSVM)预测模型,并通过均方误差,均方误差百分比,相关系数等指标评估模型性能。2)接着,本文创新性提出并建立了基于聚类算法的分类模型——AP-LSSVM模型,并仿真研究了该模型在光谱法水质分析中的应用效果。用该方法与全样本单模型的模型预测效果进行比较,结果表明该模型在预测精度方面有显著提高。但模型中AP聚类算法产生的聚类输出的类别较多,致使某些训练样本数目少,降低了这些模型的精度。为了进一步提高分类模型的精度和模型的泛化性,更有效地综合利用分类信息,在AP-LSSVM模型基础上,本文进一步提出了一种基于聚类集成(Cluster Ensemble,部分文献也译为聚类融合)的分类模型回归算法。算法首先对建模样本进行聚类,然后应用聚类集成得到各个子模型的训练样本并通过最小二乘支持向量机建立各个回归子模型,最后对子模型进行选择、组合得到最终的预测结果。聚类类集成过程中过量聚类成员匹配步骤利用蚁群算法进行匹配:将聚类算法产生的过量聚类成员看做是一个地点,两端加上起点和终点,模仿蚁群算法解决TSP问题中的寻找最优路径的方式,利用蚁群算法找到若干个代表着相似度最大的最优路径,即表示可以将这个路径上的点代表的子类合并成一个大类。仿真结果表明:采用蚁群算法聚类集成后建立的分类模型可以有效地利用训练样本信息,从而提高了模型的预测精度和泛化性能。3)最后,对课题进行总结与展望。
|
全文目录
致谢 5-6 摘要 6-8 Abstract 8-10 目录 10-12 第1章 绪论 12-24 摘要 12 1.1 课题研究背景及意义 12-14 1.2 水质光谱法定量分析技术简介 14-20 1.2.1 光谱水质分析技术 14-16 1.2.2 水质光谱的建模技术 16-20 1.3 课题总体框架介绍 20-22 1.4 本文的研究内容及创新点 22-24 第2章 相关算法的基本原理 24-40 摘要 24 2.1 引言 24-26 2.2 k-means算法 26-27 2.3 近邻传播算法(Affinity Propagation) 27-29 2.4 最小二乘支持向量机算法(LSSVM) 29-31 2.5 聚类集成(Cluster Ensemble)理论 31-36 2.6 蚁群算法(Ant Cycle Alogrithem) 36-38 2.7 本章小结 38-40 第3章 基于聚类算法的水质分类预测模型 40-60 摘要 40 3.1 引言 40-41 3.2 基于AP-LSSVM的分类多模型预测回归模型 41-44 3.2.1 相似度 41-42 3.2.2 子模型选择方法 42 3.2.3 算法的基本步骤 42-44 3.3 仿真研究 44-58 3.3.1 实验样本及建模数据 44-48 3.3.2 仿真结果及分析 48-57 3.3.3 结果与讨论 57-58 3.4 本章小结 58-60 第4章 基于蚁群算法的聚类集成水质分类预测模型 60-68 摘要 60 4.1 引言 60-61 4.2 基于蚁群优化聚类集成算法的水质分类预测回归模型 61-63 4.2.1 过量聚类成员的产生 62 4.2.2 基于蚁群算法的聚类集成 62-63 4.3 仿真比较 63-66 4.3.1 仿真结果及分析 63-66 4.3.2 结果与讨论 66 4.4 本章小结 66-68 第5章 总结与展望 68-72 摘要 68 5.1 研究工作总结 68-69 5.2 研究工作展望 69-72 参考文献 72-80 附录 80-81 作者简介 80 硕士期间取得的科研成果 80 硕士期间参与的科研项目 80-81
|
相似论文
- 隐式用户兴趣挖掘的研究与实现,TP311.13
- 高血压前期证候特征研究,R259
- 高忠英学术思想与经验总结及运用补肺汤加减治疗呼吸系统常见病用药规律研究,R249.2
- 大学生综合素质测评研究,G645.5
- 基于混合自适应遗传算法的动态网格调度问题研究,TP393.09
- 土壤环境功能区划研究,X321
- 基因表达谱数据聚类分析方法比较与大豆疫霉基因的网络构建,S435.651
- 基于变异粒子群的聚类算法研究,TP18
- 融合粒子群和蛙跳算法的模糊C-均值聚类算法研究,TP18
- 基于遗传算法和粗糙集的聚类算法研究,TP18
- 基于同化能力杂种优势早期评价的桃光合特性研究,S662.1
- 基于机器视觉的车辆检测和车距测量方法研究,TP274
- 基于运动目标轨迹分析的智能交通监控系统,TP277
- 一种基于领域本体的语义Web服务匹配和组合方法,TP393.09
- 模糊神经网络在扫雷犁系统中的应用研究,TJ518
- 基于论文关键词聚类的用户兴趣模型细化方法研究,TP391.3
- 基于最近邻相似度的孤立点检测及半监督聚类算法,TP311.13
- 多组分纤维复合与机织物服用性能和风格的研究,TS941.15
- 蚁群聚类算法研究与应用,TP18
- 尾矿库溃坝风险评价与分级技术研究,TV122.4
- 基于正则化方法的模糊C-均值聚类算法的研究,TP311.13
中图分类: > 工业技术 > 自动化技术、计算机技术 > 自动化技术及设备 > 自动化系统 > 数据处理、数据处理系统
© 2012 www.xueweilunwen.com
|