学位论文 > 优秀研究生学位论文题录展示
基于贝叶斯的判别理论及其算法实现
作 者: 马达
导 师: 管建和
学 校: 中国地质大学(北京)
专 业: 计算机科学与技术
关键词: 数据挖掘 判别分析 贝叶斯理论 分类
分类号: TP311.13
类 型: 硕士论文
年 份: 2011年
下 载: 102次
引 用: 0次
阅 读: 论文下载
内容摘要
在全球信息化浪潮的推动下,数据挖掘技术的研究和应用迅速发展。如何从海量的数据里“挖掘”或“发现”隐含的、有用的信息和知识,成为各类数据库的应用研究中越来越重要的课题。其中,对研究对象进行分类的判别分析是数据挖掘的一类重要基础理论。所谓判别分析,是指在分类情况明确的条件下,依据目标对象具有的各类属性的特征值判定其所属类型的一类统计学分析方法。判别分析过程是根据一定的判别分析理论,建立判别分析模型,通过对历史数据元组的学习来确定判别分类规则,并利用规则对未知元组进行分类的过程。基于统计学和概率论的贝叶斯理论,是一类重要的判别分析理论,在广泛的应用中表现出了高准确率和高速度。中央地勘基金项目远程调度监管平台(以下简称“地勘基金监管平台”)是为中央地质勘查基金项目监督管理提供即时化、标准化和自动化服务的信息平台。其中,数据分析子系统能够为平台提供强大的数据分析和决策支持功能。贝叶斯判别分析模块能够对地勘基金监管平台的各类数据指标进行分类,便于决策者了解工程进度情况,制定相应的管理策略。本课题的工作内容和研究成果有如下几个方面:1)阐述贝叶斯判别理论体系和文献综述。简要介绍数据挖掘、判别分析和贝叶斯理论等概念,论述基于贝叶斯的判别分析过程的理论基础、基本原理和研究现状。2)介绍各类贝叶斯分类算法。说明朴素贝叶斯分类模型、贝叶斯网络分类模型和树扩展(TAN)贝叶斯模型的算法结构、应用设计和模型建立过程。3)设计判别分析模块程序结构。针对地勘基金项目监管数据和分类科目的特点,制定多种贝叶斯分类模型的应用方式,以及相应的数据预处理、属性约简、误判风险检测等辅助算法策略。4)完成地勘基金项目远程调度监管平台系统数据判别分类模块的设计和实现,并进行系统演示、测试和数据分析工作。
|
全文目录
摘要 5-6 ABSTRACT 6-10 第1章 绪论 10-17 1.1 研究背景和意义 10-12 1.1.1 研究背景 10-12 1.1.2 研究目的及意义 12 1.2 研究现状 12-14 1.3 课题的提出 14-15 1.4 课题的主要工作 15 1.5 论文组织结构 15-17 第2章 基于贝叶斯的判别理论 17-28 2.1 数据挖掘概述 17-22 2.1.1 数据仓库的相关概念 17-18 2.1.2 数据挖掘及知识发现的相关概念 18-20 2.1.3 数据挖掘与数据仓库的关系 20 2.1.4 数据挖掘基本算法 20-22 2.2 判别分析理论概述 22-24 2.2.1 判别分析基本原则 22-23 2.2.2 各类基本判别分析算法 23-24 2.2.3 判别分析与聚类分析的区别 24 2.3 贝叶斯判别分析理论概述 24-26 2.3.1 贝叶斯理论的发展历程 25 2.3.2 贝叶斯定理和贝叶斯公式 25-26 2.3.3 贝叶斯判别方法 26 2.4 本章小结 26-28 第3章 贝叶斯分类模型设计和算法研究 28-42 3.1 朴素贝叶斯分类模型 28-32 3.1.1 朴素贝叶斯模型的学习和分类过程 28-29 3.1.2 朴素贝叶斯分类模型的应用示例 29-32 3.2 贝叶斯信念网络模型 32-37 3.2.1 贝叶斯信念网络的相关概念 33 3.2.2 贝叶斯信念网络的学习过程 33-34 3.2.3 贝叶斯信念网络的应用示例 34-37 3.3 树扩展贝叶斯(TAN)分类模型 37-39 3.4 基于粗糙集理论的决策表属性约简 39-40 3.5 误判风险(ECM)最小准则 40-41 3.6 本章小结 41-42 第4章 贝叶斯判别分析模块详细设计 42-54 4.1 地勘基金监管平台的系统总体结构 42-45 4.1.1 地勘基金监管平台总体架构 42-44 4.1.2 地勘基金监管平台功能结构 44 4.1.3 地勘基金监管平台部署结构 44-45 4.2 地勘基金监管平台的数据库设计 45-47 4.3 判别分析模块的功能设计 47-52 4.3.1 判别分析训练集组织 50 4.3.2 训练集属性约简处理 50-51 4.3.3 判别规则学习过程 51 4.3.4 未知元组分类过程 51-52 4.4 判别分析模块的程序结构设计 52-53 4.5 本章小结 53-54 第5章 程序编码、测试及数据分析 54-62 5.1 编程及测试环境说明 54-55 5.2 程序功能演示及测试 55-59 5.2.1 地勘基金监管平台主界面及功能列表说明 55 5.2.2 判别分析科目选择及训练集组织 55-56 5.2.3 训练集属性约简操作 56-57 5.2.4 贝叶斯判别规则学习 57-58 5.2.5 未知元组分类及结果展示 58-59 5.3 数据分析及性能比较 59-61 5.4 本章小结 61-62 第6章 结论 62-64 致谢 64-65 参考文献 65-67 在攻读硕士研究生期间发表的论文 67-68 个人简历 68
|
相似论文
- K公司计划及预测改进对于合理库存配置的研究,F224
- 空间目标ISAR成像仿真及基于ISAR像的目标识别,TN957.52
- 基于词义及语义分析的问答技术研究,TP391.1
- 基于三维重建的焊点质量分类方法研究,TP391.41
- 基于串核的蛋白质分类算法的研究与实现,TP301.6
- 统计与语言学相结合的词对齐及相关融合策略研究,TP391.2
- 上下文相关的词汇复述研究,TP391.1
- 基于仿生模式识别的文本分类技术研究,TP391.1
- 互联网上旅游评论的情感分析及其有用性研究,TP391.1
- 基于SVM的中医舌色苔色分类方法研究,TP391.41
- 基于图像的路面破损识别,TP391.41
- 多样性密度学习算法的研究与应用,TP181
- 运动特征及地形约束的感知网目标跟踪算法及系统研究,TP212.9
- 基于数据挖掘技术的保健品营销研究,F426.72
- 高忠英学术思想与经验总结及运用补肺汤加减治疗呼吸系统常见病用药规律研究,R249.2
- 张炳厚学术思想与临床经验总结及应用地龟汤类方治疗慢性肾脏病的经验研究,R249.2
- 计算智能在数字化卷烟叶组配方中的应用研究,TS44
- 基于中国土壤系统分类的土壤类型和界线确定研究,S155
- 弯孢属种分子鉴定体系的建立及其在疑难种上的应用,Q949.32
- 烤烟不同香型烟叶质量特点及判别分析,S572
- 基于视觉的番木瓜外观品质检测技术研究,S667.9
中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机软件 > 程序设计、软件工程 > 程序设计 > 数据库理论与系统
© 2012 www.xueweilunwen.com
|