学位论文 > 优秀研究生学位论文题录展示

基于支持向量机的水电故障分类器的设计与实现

作 者: 韩叙东
导 师: 赵海
学 校: 东北大学
专 业: 计算机应用技术
关键词: 水电仿真系统 数据挖掘 向量空间模型 半监督学习 直推式支持向量机
分类号: TV738
类 型: 硕士论文
年 份: 2008年
下 载: 29次
引 用: 0次
阅 读: 论文下载
 

内容摘要


水电故障纷繁复杂,传统水电仿真系统中的推理机制已不能满足实际需要,使用数据挖掘进行故障分类来代替原有的推理机制是对本领域新的尝试。通过水电仿真系统的开发,人们意识到传统的故障仿真功能培训学员意义有限,而且人为的设计并用计算机程序实现水电故障很难保证其准确性,这些缺陷催生新技术的应用。应用数据挖掘技术的支持向量机方法来进行水电故障分类研究对水电仿真系统的优化以及实用性均具有重要的现实意义。本文首先将水电故障表示为最易理解的自然语言形式,利用向量空间模型以及中文分词技术并根据TF-IDF权值算法将故障描述为以词为单位的加权向量形式。然后,针对水电故障的向量形式描述,本文采用支持向量机技术进行故障分类。本文还介绍了支持向量机的相关技术如核函数的选择等,并详细分析了针对多故障分类的支持向量机算法。为了提高水电故障分类的准确性,本文引入了半监督学习方法,半监督学习能更好的利用大量的无标识样本数据,提高准确度的同时也兼顾效率。另外本文还提出了一种改进的直推式支持向量机学习算法CPTSVM,通过实验表明该算法能提高半监督学习准确率并减少算法的复杂度。最后本文设计并实现了一个基于CPTSVM的水电故障分类器,该分类器的查准率和查全率等评价指标均达到应用要求,可通过此分类器达到水电故障分类诊断的目的,而且可以预见其在通用型水电仿真系统中具有很好的应用前景。

全文目录


摘要  5-6
ABSTRACT  6-10
第一章 绪论  10-16
  1.1 水电仿真系统面临的问题  10-12
    1.1.1 水电仿真系统开发现状  10-11
    1.1.2 水电故障仿真的技术瓶颈  11
    1.1.3 传统水电故障仿真的缺陷  11-12
  1.2 数据挖掘和机器学习  12-14
    1.2.1 以挖掘代替推理的现实意义  12
    1.2.2 文本挖掘的研究现状  12-13
    1.2.3 支持向量机的发展  13-14
    1.2.4 故障文本的半监督学习  14
  1.3 本文研究内容与组织结构  14-16
第二章 水电故障文本分类  16-28
  2.1 文本分类概念  16-17
  2.2 文本表示  17-18
    2.2.1 文本特征  17
    2.2.2 向量空间模型  17-18
  2.3 文本特征提取  18-21
    2.3.1 特征选择  18-20
    2.3.2 特征项的权重  20-21
  2.4 文本分类方法  21-25
    2.4.1 朴素贝叶斯分类  22-23
    2.4.2 KNN(K最近邻居)算法  23
    2.4.3 支持向量机法  23-24
    2.4.4 决策树法  24-25
  2.5 文本分类评价体系  25-26
  2.6 本章小结  26-28
第三章 基于支持向量机的水电故障分类  28-42
  3.1 统计学习理论  28-31
    3.1.1 机器学习的基本问题  28-29
    3.1.2 VC维  29-30
    3.1.3 结构风险最小化原则  30-31
    3.1.4 学习过程一致性理论  31
  3.2 支持向量机  31-37
    3.2.1 最优超平面  32-33
    3.2.2 线性分类  33-35
    3.2.3 非线性分类  35-36
    3.2.4 核函数及其选择  36-37
  3.3 支持向量机分类算法  37-38
  3.4 支持向量机的多分类问题  38-40
  3.5 多分类支持向量机用于水电故障分类  40
  3.6 本章小结  40-42
第四章 水电故障分类中的半监督学习  42-50
  4.1 半监督学习概述  42
  4.2 半监督算法  42-45
    4.2.1 EM算法  42-43
    4.2.2 Co-Training  43-44
    4.2.3 直推式支持向量机  44-45
  4.3 半监督支持向量机  45-46
  4.4 改进的渐进直推式支持向量机算法  46-48
  4.5 本章小结  48-50
第五章 水电故障分类器的设计与实现  50-60
  5.1 设计思想  50
  5.2 总体结构设计  50-51
  5.3 系统实现  51-54
    5.3.1 实现环境  51-52
    5.3.2 故障文本数据  52
    5.3.3 中文分词与特征选择  52-54
    5.3.4 算法实现  54
  5.4 故障分类及性能测试  54-59
    5.4.1 故障分类结果及评价  54-55
    5.4.2 改进的直推式支持向量机算法性能测试  55-58
    5.4.3 水电故障分类器的实现  58-59
  5.5 本章小结  59-60
第六章 总结与展望  60-62
  6.1 工作总结  60
  6.2 下一步工作展望  60-62
参考文献  62-66
致谢  66-68
攻读硕士期间发表的论文  68

相似论文

  1. 直推式支持向量机研究及其在图像检索中的应用,TP391.41
  2. 基于停用词处理的汉语语音检索方法,TP391.1
  3. 基于数据挖掘技术的保健品营销研究,F426.72
  4. 高忠英学术思想与经验总结及运用补肺汤加减治疗呼吸系统常见病用药规律研究,R249.2
  5. 张炳厚学术思想与临床经验总结及应用地龟汤类方治疗慢性肾脏病的经验研究,R249.2
  6. 基于SVM分类算法的主题爬虫研究,TP391.3
  7. Bicluster数据分析软件设计与实现,TP311.52
  8. 基于变异粒子群的聚类算法研究,TP18
  9. 融合粒子群和蛙跳算法的模糊C-均值聚类算法研究,TP18
  10. 基于遗传算法和粗糙集的聚类算法研究,TP18
  11. 基于数据挖掘的税务稽查选案研究,F812.42
  12. 面向社区教育的个性化学习系统的研究与实现,TP391.6
  13. 基于关联规则挖掘的入侵检测系统的研究与实现,TP393.08
  14. 数据仓库技术在银行客户管理系统中的研究和实现,TP315
  15. 基于Moodle的高职网络教学系统设计与实现,TP311.52
  16. 教学质量评估数据挖掘系统设计与开发,TP311.13
  17. 关联规则算法在高职院校贫困生认定工作中的应用,G717
  18. 基于数据挖掘技术在城市供水的分析与决策,F299.24;F224
  19. 数据挖掘技术在电视用户满意度分析中的应用研究,TP311.13
  20. Web使用挖掘与网页个性化服务推荐研究,TP311.13
  21. 数据挖掘在学校管理和学生培养中的应用,TP311.13

中图分类: > 工业技术 > 水利工程 > 水能利用、水电站工程 > 水电站建筑与设备 > 养护、维修
© 2012 www.xueweilunwen.com