学位论文 > 优秀研究生学位论文题录展示

一种基于联合熵的聚类边界检测技术研究

作 者: 曹鹤玲
导 师: 邱保志
学 校: 郑州大学
专 业: 计算机软件与理论
关键词: 边界点 联合熵 网格 梯度 二值化
分类号: TP311.13
类 型: 硕士论文
年 份: 2011年
下 载: 28次
引 用: 0次
阅 读: 论文下载
 

内容摘要


随着信息技术和数据库技术的不断发展,数据库中存储的数据种类和数量急剧增加,使得如何从海量数据中快速有效地提取有价值的信息变得至关重要。数据挖掘技术应运而生。适当的数据挖掘方法,使得生物学家可以发现大量的遗传信息,也使得地理学家可以发现对陆地气候有显著影响的极地和海洋大气压力模式。聚类技术是数据挖掘中的重要技术之一,人们对聚类技术已经有深入的研究,出现了许多种聚类算法,但对聚类边界的研究刚刚起步。聚类边界是一种模式,在实际应用中有着广泛的用途。在图像检测中,聚类的边界代表物体的轮廓,而在临床医学中,聚类的边界代表具有某种疾病特征的健康人群。所以,对聚类的边界的研究具有重要的价值。本文针对现有算法的不足,提出了基于联合熵的聚类边界检测算法(EDGE)和基于梯度二值化的聚类边界检测算法(BAGB)。EDGE算法采用网格技术和联合熵技术相结合的方法来提取聚类边界点。网格技术用于快速查找数据集中聚类边界所在的网格范围,这样就缩小了查找范围,提高了算法效率。联合熵技术用于在边界落入的网格范围内准确地识别聚类的边界点,这样提高了算法的精度。实验结果表明,该算法能够准确识别不同形状、大小和密度的数据集中聚类的边界,可以有效去除噪声,算法的时间复杂度是输入数据集点数的线性函数,在大型数据集上执行时间优势更明显。BAGB算法采用将网格技术和梯度算子相结合方法来提取聚类的边界点。网格技术用于用于提高数据处理的速度。prewitt梯度算子用于计算梯度,计算时采用的方法是在某网格周围3×3区域内从八个方向来计算梯度,取最大值为中心网格的梯度。梯度用于判断网格是否是边界网格,边界网格中的点即为边界点。此方法是把图像处理中处理图像边界的方法用于处理聚类的边界,为研究聚类边界提供了新思路。实验结果表明,该算法能够在含有噪声点/孤立点的数据集上,有效的检测出聚类的边界,运行效率高。本文的创新之处是:(1)提出了将网格技术和联合熵技术结合来检测聚类边界的思想,给出了EDGE算法;(2)将网格和梯度算子结合实现了聚类边界检测,提出了BAGB算法。

全文目录


摘要  4-5
ABSTRACT  5-9
第1章 课题研究背景与意义  9-12
  1.1 课题来源  9
  1.2 研究背景  9-10
  1.3 研究意义  10-11
  1.4 论文结构  11-12
第2章 聚类边界检测算法综述  12-20
  2.1 BORDER算法  14-16
  2.2 BRM算法  16-17
  2.3 DTBOUND算法  17-18
  2.4 其他算法  18
  2.5 本章小结  18-20
第3章 基于联合熵的聚类边界检测算法(EDGE)  20-36
  3.1 算法提出  20-21
  3.2 相关定义  21-23
  3.3 算法描述  23-24
  3.4 实验分析  24-35
    3.4.1 边界结果的对比  24-33
    3.4.2 算法参数的分析  33-34
    3.4.3 时间复杂度分析  34-35
  3.5 本章小结  35-36
第4章 基于梯度二值化的聚类边界检测算法(BAGB)  36-46
  4.1 算法提出  36
  4.2 相关定义  36-38
  4.3 算法描述  38-39
  4.4 实验分析  39-45
    4.4.1 边界结果的对比  39-44
    4.4.2 算法参数的分析  44
    4.4.3 时间复杂度分析  44-45
  4.5 本章小结  45-46
第5章 总结及进一步工作展望  46-49
  5.1 本文工作  46-47
  5.2 创新之处  47
  5.3 工作展望  47-49
参考文献  49-51
致谢  51-52
攻读硕士学位期间的研究成果  52

相似论文

  1. 带有多项式基的径向点插值无网格方法的研究及应用,O241
  2. 铁电薄膜与组分梯度铁电薄膜的性能研究,TM221
  3. 高频雷达信号电离层污染及时频分析方法研究,TN958.93
  4. 联合编码调制技术中TCM与BICM方案性能研究,TN911.22
  5. BioLab面向生物计算服务的网格系统,TP399-C8
  6. 图像分割中阴影去除算法的研究,TP391.41
  7. 二维波动方程测井约束反演的自适应同伦共轭梯度法,P631.81
  8. 转基因水稻对肉仔鸡饲用安全性研究,S831.5
  9. 基于混合自适应遗传算法的动态网格调度问题研究,TP393.09
  10. 土壤酶活测定及土壤微生物总蛋白的提取、纯化与鉴定,S154
  11. 转基因大豆玉米小麦信息平台建设及转基因大豆对土壤微生物的影响研究,S565.1
  12. 农业供应链系统网络平台的构建,S126
  13. 甘露寡糖对肉仔鸡肠道形态及微生物区系的影响,S831.5
  14. 劳动保障监察网格化管理研究,F249.27
  15. MR延迟增强扫描对正常膝关节软骨及其Ⅰ、Ⅱ期病变的应用研究,R445.2
  16. 腹腔压力梯度改变对肝脏的影响的相关性研究,R657.3
  17. 急性白血病儿童还原型叶酸载体基因多态性研究,R733.71
  18. 遥感数据处理网格平台的设计与初步实现,TP79
  19. 基于多尺度分析的图像融合算法研究,TP391.41
  20. 车牌识别系统中车牌定位算法的研究,TP391.41
  21. 具梯度项的半线性椭圆型方程解的渐近性态,O175.25

中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机软件 > 程序设计、软件工程 > 程序设计 > 数据库理论与系统
© 2012 www.xueweilunwen.com