学位论文 > 优秀研究生学位论文题录展示

粗糙集中基于NBC聚类的连续属性离散化方法研究

作 者: 郝寒雪
导 师: 王熙照
学 校: 河北大学
专 业: 计算机软件与理论
关键词: 连续属性 离散化 属性重要度 信息熵 聚类
分类号: TP18
类 型: 硕士论文
年 份: 2009年
下 载: 20次
引 用: 0次
阅 读: 论文下载
 

内容摘要


连续属性离散化一般是做为机器学习、数据挖掘的一项重要的预处理步骤,针对离散化问题,研究者们提出了诸多方法,例如早期的等宽等频算法及后来的利用遗传算法进行离散化等。根据离散化过程中是否应用了类别信息,把离散化算法分为监督的离散化算法和非监督的离散化算法。本文首先介绍了连续属性离散化的评价标准、几种经典的离散化方法及粗糙集的相关知识;其次着重介绍了NBC聚类算法的算法思想及及基本概念,并结合粗糙集理论,提出了一种基于NBC的离散化算法ADBNBC(Algorithm for Discretization of Continuous Attributes Based on NBC Clustering)。最后本文对不同的离散化方法进行实验比较和分析,通过比较实验说明了该算法的有效性。

全文目录


摘要  5-6
Abstract  6-8
第1章 绪论  8-12
  1.1 研究背景  8-9
  1.2 离散化算法的发展与现状  9-10
  1.3 本文主要研究内容及结构  10-12
    1.3.1 研究内容  10
    1.3.2 结构安排  10-12
第2章 连续属性的离散化算法  12-21
  2.1 连续属性离散化问题描述  12
  2.2 离散化算法优劣的评价标准  12-13
  2.3 几种经典的离散化算法  13-18
  2.4 粗糙集理论中的基本概念  18-21
第3章 NBC聚类算法介绍  21-25
  3.1 NBC聚类算法的基本概念  21-23
  3.2 NBC聚类算法(Neighborhood-Based Clustering algorithm)的优点  23
  3.3 NBC聚类算法步骤  23-25
第4章 ADBNBC算法及离散化结果比较  25-32
  4.1 ADBNBC算法  25-27
  4.2 实验设计  27
  4.3 数据集的选择  27
  4.4 实验步骤  27-28
  4.5 实验比较与分析  28-32
第5章 总结  32-33
参考文献  33-35
致谢  35-36
攻读硕士学位期间科研工作情况  36

相似论文

  1. 谐波齿轮传动柔轮应力及轮齿磨损分析,TH132.43
  2. 基于信息熵的课堂观察量化评价模型研究,G632.4
  3. 隐式用户兴趣挖掘的研究与实现,TP311.13
  4. 图像分割中阴影去除算法的研究,TP391.41
  5. 基于图分割的文本提取方法研究,TP391.41
  6. 牡丹EST-SSR引物开发及其亲缘关系分析,S685.11
  7. 高血压前期证候特征研究,R259
  8. 高忠英学术思想与经验总结及运用补肺汤加减治疗呼吸系统常见病用药规律研究,R249.2
  9. K-均值聚类算法的研究与改进,TP311.13
  10. 大学生综合素质测评研究,G645.5
  11. 大豆品种对腐竹品质的影响及其品质评价体系的初步构建,TS214.2
  12. 21个荷花品种遗传多样性的ISSR分析,S682.32
  13. 基于聚类分析的P2P流量识别算法的研究,TP393.02
  14. 基于混合自适应遗传算法的动态网格调度问题研究,TP393.09
  15. 桃杂交后代(F1)幼苗光合效能评价,S662.1
  16. 一类孤子方程的可积离散化,O175.2
  17. 南通市农业面源污染负荷研究与综合评价,X592
  18. 土壤环境功能区划研究,X321
  19. 基因表达谱数据聚类分析方法比较与大豆疫霉基因的网络构建,S435.651
  20. 大豆杂种优势及其遗传基础研究,S565.1
  21. 象草自交后代无性系的饲用价值及生物质能特性初步评价,S543.9

中图分类: > 工业技术 > 自动化技术、计算机技术 > 自动化基础理论 > 人工智能理论
© 2012 www.xueweilunwen.com