学位论文 > 优秀研究生学位论文题录展示
数据挖掘应用及优化研究
作 者: 彭凝多
导 师: 张凤荔
学 校: 电子科技大学
专 业: 软件工程
关键词: 数据挖掘 模糊聚类 自适应 网格 可视化
分类号: TP311.13
类 型: 硕士论文
年 份: 2009年
下 载: 332次
引 用: 0次
阅 读: 论文下载
内容摘要
数据挖掘是近些年来发展起来的新技术,通过数据挖掘,人们可以发现数据背后隐藏的有价值的、潜在的知识,为科学地进行各种商业决策提供强有力的支持。随着数据挖掘技术的迅速发展,作为其重要的组成部分,聚类分析一直以来都受到极大关注,而数据可视化问题也是非常活跃的一个研究课题。本文首先介绍了数据挖掘研究的相关背景及其理论知识,对数据挖掘中的聚类分析的相关工作做了一个简要的概述。本文对聚类算法进行了深入的研究,取得了如下创新性成果:(1)提出了带自适应参数ω的模糊聚类算法针对作为数据挖掘应用的基础——模糊等价关系的模糊聚类算法,本文优化了其使用的方便性,提出了带自适应参数ω的模糊聚类方法。通过自适应参数ω的引入,一方面避免了人工设置参数的复杂性,使计算更加自动化。另一方面使得能对异性质属性样本进行无预转换处理而直接计算,扩展了应用范围。(2)提出了多维网格聚类的细粒度逆向可视化方案数据挖掘过程的可视化指数据挖掘过程的各个环节用可视化的方式表现出来,然而多层计算和多次数据的转换与清理,对逆向的可视化分析的实现带来了较大的难题。本文利用网格计算的特殊性,在计算时建立正向、逆向映射关系表和映射公式,从而实现每一小格数据均可独立正向、逆向查看的效果。最终实现单点逆向可视化分析,使对数据的分析更加具有针对性。
|
全文目录
摘要 4-5 ABSTRACT 5-8 第一章 引言 8-13 1.1 选题依据及意义 8-9 1.2 国内外的相关研究进展 9-11 1.3 本文研究内容与改进成果 11-12 1.4 论文结构 12-13 第二章 数据挖掘及相关技术概述 13-34 2.1 数据挖掘概述 13-20 2.1.1 数据挖掘定义 13-14 2.1.2 数据挖掘的组成 14-16 2.1.3 数据挖掘的过程 16-18 2.1.4 数据挖掘的功能 18-20 2.2 聚类分析概述 20-30 2.2.1 聚类分析的定义 20-21 2.2.2 聚类分析方法分类 21-24 2.2.3 常用的聚类分析算法 24-27 2.2.4 聚类分析面临的主要挑战 27-30 2.3 数据可视化技术概述 30-33 2.3.1 数据可视化技术定义 30-31 2.3.2 数据可视化 31-32 2.3.3 过程与模型可视化 32-33 2.4 本章小结 33-34 第三章 带自适应参数ω的模糊聚类算法研究 34-47 3.1 概述 34 3.2 带自适应参数ω的模糊聚类算法 34-41 3.2.1 传统的模糊聚类算法 34-37 3.2.2 参数自动化 37-39 3.2.3 加权计算 39-40 3.2.4 统一的形式 40-41 3.2.5 带自适应参数ω的聚类过程 41 3.3 算法应用示例 41-46 3.4 本章小结 46-47 第四章 多维网格聚类的细粒度逆向可视化方案研究 47-72 4.1 概述 47-48 4.2 扩展的多维网格聚类算法 48-55 4.2.1 基本原理 48-50 4.2.2 构造网格空间 50-52 4.2.3 构造含从属映射关系的网格样本 52-54 4.2.4 扩展原始样本并分类至网格 54 4.2.5 采用聚类算法对网格聚类 54-55 4.3 实验结果分析 55-71 4.4 本章小结 71-72 第五章 结束语 72-75 5.1 全文总结 72-73 5.2 进一步的研究工作 73-75 致谢 75-76 参考文献 76-79
|
相似论文
- 带有多项式基的径向点插值无网格方法的研究及应用,O241
- 陀螺稳定吊舱控制系统稳定回路设计与研究,V241.5
- 航天器姿态动力学系统鲁棒自适应控制方法研究,V448.22
- 基于DSP的感应电动机四象限运行系统的研究,TM346
- 基于DSP的感应电机矢量控制系统研究,TM346
- 适应多总线通讯模式的感应电动机矢量控制系统研究,TM346
- 半导体激光器热电控制技术研究,TN248.4
- 基于视觉特性的视频编码技术研究,TN919.81
- 多重ANN/HMM混合模型在语音识别中的应用,TN912.34
- 基于滑动相关双门限的扩频码同步捕获技术的研究,TN914.42
- 跳频通信系统中同步及频率自适应算法研究,TN914.41
- 多载波CDMA的信道编码与信道估计技术的研究,TN929.533
- 联合编码调制技术中TCM与BICM方案性能研究,TN911.22
- 基于纹理特征的视频编码技术研究,TP391.41
- BioLab面向生物计算服务的网格系统,TP399-C8
- 图像分割中阴影去除算法的研究,TP391.41
- 医学超声图像的三维可视化研究,TP391.41
- 非线性变结构导引规律的研究,TJ765
- 一类欠驱动Lagrangian系统的最优同步控制,TP13
- 分导飞行器多模型自适应控制,TP273.2
- 自适应双重控制在垂直起降机中的应用研究,TP273
中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机软件 > 程序设计、软件工程 > 程序设计 > 数据库理论与系统
© 2012 www.xueweilunwen.com
|