学位论文 > 优秀研究生学位论文题录展示
K-均值聚类算法的研究与改进
作 者: 欧陈委
导 师: 陈曦
学 校: 长沙理工大学
专 业: 计算机应用技术
关键词: 聚类算法 K-均值算法 差分进化算法
分类号: TP311.13
类 型: 硕士论文
年 份: 2011年
下 载: 124次
引 用: 0次
阅 读: 论文下载
内容摘要
随着计算机技术的飞快发展,人们每天都会面临诸如文本、图像、音频、视频等各种形式的数据,这些数据的数量是极其庞大的,如何快速有效地从这些海量数据中提炼出其间所隐含的有价值的信息,成为人们十分关注且亟待解决的问题。数据挖掘(Data Mining,DM)由此而诞生。它为人们解决这个问题提供了许多卓有成效的方法和工具。聚类分析就是其中最为重要的方法之一,它是数据挖掘技术的重要组成部分。随着近年来对聚类分析技术的研究逐渐深入,其重要性已越来越得到人们的认可。近年来,无论在理论方面还是在实际应用方面,聚类分析技术的研究都取得了丰硕的成果。目前,聚类分析技术已在机器学习、模式识别、图像处理、文本分类、市场营销及统计科学等领域得到了广泛的应用。根据数据类型、聚类目的及应用的不同,目前已有的聚类算法大致可以分为以下几种:划分的算法、层次的算法、基于网格的算法、基于密度的算法以及基于模型的算法。其中,研究最为成熟最为经典的就是基于划分的K-均值聚类算法。本文深入研究和分析了K-均值聚类算法的优缺点,并针对其聚类结果易受初始中心影响的特点,对K-均值聚类算法进行了改进。本文所做的主要工作有:1.针对K-均值聚类算法对初始聚类中心存在依赖性的缺陷,本文提出一种新的选取K-均值聚类算法初始聚类中心的方法,实验表明,该方法可有效解决由于初始聚类中心选取的过于邻近而导致聚类结果不稳定的问题,提高了聚类结果的有效性和稳定性。2.针对K-均值聚类算法存在对初始中心的选择敏感且易陷入局部最优解的缺点,本文将全局寻优能力强的差分进化算法引入聚类中。本文提出了一种改进的差分进化算法,并将改进的差分进化算法和K-均值聚类算法相结合,较好地解决了K-均值聚类算法初始中心的优化问题,实验表明,该方法有效提高了聚类质量和收敛速度。
|
全文目录
摘要 5-6ABSTRACT 6-10第一章 绪论 10-15 1.1 研究的背景及意义 10-11 1.2 国内外研究现状 11-13 1.3 本文所做的主要工作 13-14 1.4 本文的组织结构 14-15第二章 聚类算法的分析与研究 15-28 2.1 聚类简介 15-16 2.1.1 聚类的定义 15 2.1.2 聚类的主要步骤 15-16 2.2 聚类算法的评价指标 16-18 2.3 聚类分析中涉及到的数据结构 18-19 2.4 聚类算法中常用的相似性度量方法 19-21 2.5 聚类算法中的聚类准则函数 21-23 2.6 常见聚类算法的分类 23-24 2.7 划分的聚类算法介绍 24-27 2.8 本章小结 27-28第三章 K-均值聚类算法的研究及一种改进算法 28-39 3.1 K-均值聚类算法介绍 28-30 3.1.1 K-均值聚类算法基本思想 28 3.1.2 K-均值聚类算法主要流程 28-30 3.2 K-均值聚类算法的主要缺陷及分析 30-31 3.3 一种改进K-均值聚类算法 31-38 3.3.1 问题的提出 31-32 3.3.2 改进算法的详细描述 32-33 3.3.3 改进算法的基本流程 33-34 3.3.4 算法的实验结果及分析 34-38 3.4 本章小结 38-39第四章 基于差分进化的 K-均值聚类算法的研究及改进 39-56 4.1 差分进化算法 39-44 4.1.1 差分进化算法的研究现状 39-41 4.1.2 差分进化算法的关键操作 41-43 4.1.3 差分进化算法的基本框架 43-44 4.2 基于差分进化的K-均值聚类算法 44-47 4.2.1 问题的提出 44-45 4.2.2 基于差分进化的K-均值聚类算法描述 45-46 4.2.3 基于差分进化的K-均值聚类算法流程 46-47 4.3 一种基于改进差分进化的K-均值聚类算法 47-55 4.3.1 问题的提出 47-48 4.3.2 改进方案 48-50 4.3.3 基于改进差分进化的K-均值聚类算法描述 50-51 4.3.4 基于改进差分进化的K-均值聚类算法流程 51-52 4.3.5 实验结果及分析 52-55 4.4 本章小结 55-56第五章 总结与展望 56-58 5.1 总结 56-57 5.2 展望 57-58参考文献 58-63致谢 63-64附录(攻读硕士学位期间发表录用论文) 64-65详细摘要 65-73
|
相似论文
- 基于差分进化算法的JSP环境下成套订单研究,F273
- 极端气象灾害下考虑不确定断线故障的电力系统随机优化调度,TM73
- 细菌聚类算法及其在图像分割问题中的研究与应用,TP391.41
- 基于变异粒子群的聚类算法研究,TP18
- K-means聚类优化算法的研究,TP311.13
- 融合粒子群和蛙跳算法的模糊C-均值聚类算法研究,TP18
- 基于遗传算法和粗糙集的聚类算法研究,TP18
- 演化聚类算法及其应用研究,TP311.13
- SAR干涉像对优化选取方法研究,P225.2
- 基于粒子群优化的Fuzzy c-mean聚类算法的基因芯片图像处理,TP391.41
- 参数协进化的改进和声搜索算法及其应用,TP391.3
- 一个基于聚类的神经网络样本自学习系统,TP391.6
- 基于显著图的交通标志检测方法研究,TP391.41
- 内源光学与微电极视觉实验平台设计,TP391.41
- 基于马尔科夫随机场D-S证据理论对人脑图像的分割研究,TP391.41
- 基于多角度热释电红外信息的人体身份认证研究,TP391.41
- 模糊C-均值算法改进研究,TP311.13
- 基于免疫遗传算法和粒子群算法的聚类研究,TP18
- 基于H.264的视频运动对象分割的研究,TP391.41
- 模糊环境下基于差分进化算法的备件(Q,r)库存模型研究,F273.4
中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机软件 > 程序设计、软件工程 > 程序设计 > 数据库理论与系统
© 2012 www.xueweilunwen.com
|