学位论文 > 优秀研究生学位论文题录展示

基于GEP的函数关系挖掘及其在数据滤波中的应用

作 者: 黄晓冬
导 师: 唐常杰
学 校: 四川大学
专 业: 计算机应用
关键词: 数据挖掘 函数关系挖掘 GEP 数据滤波 面向对象
分类号: TP311.13
类 型: 硕士论文
年 份: 2004年
下 载: 178次
引 用: 2次
阅 读: 论文下载
 

内容摘要


数据挖掘是从大量的数据信息中提取出隐含的知识、规律和行为模式的处理过程。它对人们的决策和行为具有重要的指导作用。作为数据挖掘的一种形式,从实验数据中发现各个量之间的函数关系一直是各种科学研究中一项重要任务。 GEP是在遗传算法的基础上发展而来的一种较新的搜索算法,它在个体的表示、个体的处理和结果的形式等方面与传统遗传算法有着显著的区别,在符号和表达式的处理上有着明显的优势,因此我们选择其作为函数关系挖掘算法的基础。 由于噪声的影响,从一个系统得到的数据一般都存在误差。我们对利用挖掘到的函数关系进行采样数据的滤波估计进行了研究,旨在降低采样数据的均方误差。 本文主要工作如下: (1)分析了从样本数据中发现所蕴含的函数关系这一特殊知识发现形式的特点和难点。 (2)提出了一种高效,健壮的函数关系挖掘方法GEPFM(GEP based Function Mining)。GEPFM通过基于基因表达式编程(GEP)的UEM和MEM搜索算法确定所求函数的形态,并有效地处理函数的分域特性。(3)在Windows2000上用C料实现了交互式的GEP实验平台GEPxP(GEP ExPeriment Platform)。该系统能够在不同的参数设置情况下对各种样本数据进行函数关系表达式挖掘,并可对有误差样本数据进行滤波估计。论文涉及程序量3000余行代码。 (4)在GEPxP上进行了大量的实验。实验结果显杀厂GEPFM方法在采用较高变异概率时具有很好的性能,对于不同的目标函数,挖掘成功率可以达到20%一80%,且运行时间较短,平均成功挖掘耗时在10秒以内。对有误差样本数据进行滤波的实验也取得了很好的效果,数据均方误差在滤波后明显降低,甚至接近于0。 本文组织如下: 第0章,引言。阐述了进行函数关系挖掘研究的重要性。第1章,介绍了数据挖掘这一学科的基本概念、一般流程及其分类方法等。第2章,分析了函数关系表达式挖掘的特点和难点,将GEP和传统遗传算法进行了比较,提出并详细阐述了一致表达式和分域表达式的挖掘方法(UEM和MEM),对复杂度进行了论证。第3章,分析了适用于动态系统的。一日滤波方一法,提出并阐述了基于函数关系挖掘的数据滤波估计方法f-Filter。第4章,介绍了实验平台GEPxP的系统构架、界面和一些重要模块的实现过程等。第5章,在GEPxP上进行了各种实验,展示了实验结果,对不同参数设置情况下的系统性能进行了研究和分析。第6章,对全文工作进行总结,并对进一步的工作进行了展望。关键词:数据挖掘函数关系挖掘GEP数据滤波面向对象

全文目录


0 引言  8-10
1 数据挖掘综述  10-15
  1.1 数据挖掘及其任务  10
  1.2 数据挖掘的流程  10-12
  1.3 数据挖掘的分类  12-13
  1.4 数据挖掘与专家系统、OLAP的区别  13-15
2 基于GEP的函数关系挖掘方法  15-33
  2.1 函数关系表达式发现的特点  15
  2.2 遗传算法  15-18
    2.2.1 遗传算法的基本思想  15-16
    2.2.2 遗传算法的基本原理  16-18
  2.3 GEP与传统遗传算法的比较  18-19
  2.4 GEPFM一致表达式的发现  19-27
    2.4.1 GEPFM编码  19-21
    2.4.2 GEPFM适应度函数的设计  21-24
    2.4.3 GEPFM遗传操作  24-26
    2.4.4 UEM算法  26-27
  2.5 GEPFM分域表达式挖掘  27-31
    2.5.1 分域边界的确定  27-30
    2.5.2 分域的合并  30-31
  2.6 复杂度和性能的理论分析  31-33
3 基于函数关系挖掘的数据滤波  33-36
  3.1 α-β滤波  33-34
  3.2 预测函数和增益  34-36
4 GEPXP的系统实现  36-49
  4.1 系统结构  36-37
  4.2 用户界面和输入输出  37-40
  4.3 一些主要功能模块的实现  40-47
    4.3.1 CGene类  40-44
    4.3.2 FuncMiner  44-46
    4.3.3 DataFilter  46-47
  4.4 数据产生器  47-49
5 实验和性能分析  49-58
  5.1 实验环境  49-50
  5.2 函数关系挖掘实验  50-55
    5.2.1 适应度函数对挖掘的影响  50-51
    5.2.2 交叉和变异概率对挖掘的影响  51-54
    5.2.3 系统性能对比分析  54-55
  5.3 数据滤波估计实验  55-58
6 结束语  58-59
参考文献  59-60
本文作者在攻读硕士学位期间发表的文章  60
声明  60-61
致谢  61

相似论文

  1. 面向嵌入式超声检测系统的图形接口设计与应用,TP274.53
  2. 武器装备信息管理系统的设计与实现,TP311.52
  3. 基于数据挖掘技术的保健品营销研究,F426.72
  4. 高忠英学术思想与经验总结及运用补肺汤加减治疗呼吸系统常见病用药规律研究,R249.2
  5. 张炳厚学术思想与临床经验总结及应用地龟汤类方治疗慢性肾脏病的经验研究,R249.2
  6. 面向对象分层测试的方法研究,TP311.53
  7. 基于面向对象技术的植物根系模拟仿真基础类库研究,TP391.41
  8. Bicluster数据分析软件设计与实现,TP311.52
  9. 基于变异粒子群的聚类算法研究,TP18
  10. 融合粒子群和蛙跳算法的模糊C-均值聚类算法研究,TP18
  11. 基于遗传算法和粗糙集的聚类算法研究,TP18
  12. 军用车辆管理信息系统的设计与实现,TP311.52
  13. 基于Web技术军车驾驶员信息管理系统的设计与实现,TP311.52
  14. 基于数据挖掘的税务稽查选案研究,F812.42
  15. 面向社区教育的个性化学习系统的研究与实现,TP391.6
  16. 基于关联规则挖掘的入侵检测系统的研究与实现,TP393.08
  17. 数据仓库技术在银行客户管理系统中的研究和实现,TP315
  18. 基于高分辨率遥感数据的矿区房屋信息提取方法研究,TP751
  19. 基于Moodle的高职网络教学系统设计与实现,TP311.52
  20. 游戏公司计费系统的设计与实现,TP311.52
  21. 教学质量评估数据挖掘系统设计与开发,TP311.13

中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机软件 > 程序设计、软件工程 > 程序设计 > 数据库理论与系统
© 2012 www.xueweilunwen.com