学位论文 > 优秀研究生学位论文题录展示

高等职业教育数据挖掘系统的研究与设计

作 者: 郭亚东
导 师: 吴国仕
学 校: 北京邮电大学
专 业: 软件工程
关键词: 高等职业教育 数据挖掘 遗传聚类 支持向量机 决策树
分类号: TP311.13
类 型: 硕士论文
年 份: 2010年
下 载: 165次
引 用: 0次
阅 读: 论文下载
 

内容摘要


近年来,高等职业教育迅速发展,从规模上,高等职业教育已.经占到了半壁江山;但从结构上,它还远没有形成;从质量和效益来看,50%以上的高职院校刚刚建立,高等职业教育还处在摸索阶段。因此高等职业教育体系还未完成。同时,随着高等职业学校扩招和学校的发展,一些学校积累了大量的数据,如学籍管理、成绩管理、就业管理等。但由于缺乏信息意识和技术,管理人员只能通过简单的统计或排序等功能获得表面的信息,而隐藏在这些数据中的信息一直没有得到应用。如何对这些数据进行重新利用,将现有的数据转化为可供使用的知识,提高学校的管理水平和办学质量,是很多高职院校正在考虑的问题。数据挖掘技术就是为解决这个问题而产生的,针对数据挖掘技术的研究,国内外已经取得了许多令人瞩目的成就,并成功地应用到了许多领域,但在教育领域中的应用并不广泛。本课题利用北京信息职业技术学院丰富的教育经验和大量的极有价值的数据资料,紧紧抓住职业教育和就业两个中心,利用数据挖掘技术探索信息类高职教育规律,并在研究的基础上建立一个高等职业教育数据挖掘系统。该系统包括四个功能模块:第一,学生特征分析模块,该模块利用本文提出的基于遗传的自适应模糊C均值聚类算法(GaFcm-Genetic Algorithms Fuzzy C-Means)对学生聚类并对聚类结果进行系统分析;第二,成才因素分析模块,该模块利用C4.5决策树算法建立就业影响因素模型,从而挖掘出哪些课程对学生成才因素就业有较大的影响;第三,学生就业预测模块,该模块建立了基于主成分分析的决策树就业预测模型,利用该算法能够根据学生成绩信息预测学生就业是否与专业相关的情况;第四,生源质量分析模块,该模块利用遗传聚类算法和支持向量机分类方法建立了基于学生信息的大学表现预测模型。

全文目录


摘要  4-5
Abstract  5-10
第一章 绪论  10-15
  1.1 课题背景及意义  10-11
  1.2 课题研究的现状  11-12
  1.3 课题研究的主要内容  12-13
  1.4 作者的工作和论文组织结构  13-15
第二章 数据挖掘概述  15-20
  2.1 数据挖掘的定义  15
  2.2 数据挖掘的任务和功能  15-17
  2.3 数据挖掘的主要方法  17-18
  2.4 数据挖掘的过程  18-19
  2.5 本章小结  19-20
第三章 系统需求分析及总体架构  20-37
  3.1 系统需求分析  20-30
    3.1.1 系统概述  20
    3.1.2 系统功能  20-21
    3.1.3 技术方案选择  21-22
    3.1.4 系统用例图和时序流图  22-30
  3.2 系统架构的设计  30-31
  3.3 系统主要界面的设计  31-35
  3.4 系统功能模块的设计  35-36
  3.5 本章小结  36-37
第四章 学生特征分析模块的研究与设计  37-58
  4.1 聚类算法简介  37-41
    4.1.1 聚类综述  37-38
    4.1.2 K-means聚类算法  38-39
    4.1.3 模糊C均值聚类  39-41
  4.2 遗传算法(GA-Genetic Algorithms)  41-46
    4.2.1 遗传算法的一般结构  41-42
    4.2.2 遗传算法的组成要素  42-43
    4.2.3 遗传算法的优缺点  43
    4.2.4 遗传聚类算法  43-46
  4.3 学生特征分析模块采用的基本算法及基本流程  46-48
  4.4 学生特征分析模块的应用  48-57
    4.4.1 收集数据及预处理  48-49
    4.4.2 算法参数的设定  49-52
    4.4.3 实验结果及结果分析  52-57
  4.5 本章小结  57-58
第五章 成才因素分析模块的研究与设计  58-70
  5.1 决策树  58-61
    5.1.1 决策树概述  58-59
    5.1.2 决策树的构造与分类  59-60
    5.1.3 决策树的优缺点  60-61
    5.1.4 决策树应用  61
  5.2 成才因素分析模块采用的决策树算法  61-64
    5.2.1 ID3和C4.5算法  61-62
    5.2.2 本模块采用的C4.5决策树算法及基本流程  62-64
  5.3 成才因素分析模块的应用  64-69
    5.3.1 收集数据及预处理  64-65
    5.3.2 建立决策树模型  65-67
    5.3.3 实验结果及结果分析  67-69
  5.4 本章小结  69-70
第六章 学生就业预测模块的研究与分析  70-75
  6.1 主成分分析  70-71
    6.1.1 主成分分析概述  70
    6.1.2 主成分分析的作用  70-71
    6.1.3 主成分分析在学生就业预测中的作用  71
  6.2 主成分分析的基本原理  71-72
  6.3 学生就业预测模块采用的基本算法及基本流程  72-73
  6.4 学生就业预测模块的应用  73-74
    6.4.1 收集数据及预处理  73
    6.4.2 建立决策树模型  73-74
    6.4.3 实验结果及结果分析  74
  6.5 本章小结  74-75
第七章 生源质量分析模块的研究与分析  75-89
  7.1 支持向量机  75-77
    7.1.1 支持向量机概述  75-76
    7.1.2 多类问题的SVM  76
    7.1.3 增量学习SVM  76-77
  7.2 生源质量分析模块采用的算法及基本流程  77-81
    7.2.1 支持向量机基本原理  77-79
    7.2.2 非线性支持向量机  79-80
    7.2.3 基本流程  80-81
  7.3 生源质量分析模块的应用  81-88
    7.3.1 数据收集及预处理  81-83
    7.3.2 建立模型  83-87
    7.3.3 实验结果及结果分析  87-88
  7.4 本章小结  88-89
第八章 结束语  89-91
  8.1 论文总结  89-90
  8.2 问题与展望  90-91
参考文献  91-93
致谢  93

相似论文

  1. 基于SVM的常压塔石脑油干点软测量建模研究,TE622.1
  2. 基于SVM的高速公路路面浅层病害的自动检测算法研究,U418.6
  3. 基于PCA-SVM的液体火箭发动机试验台故障诊断算法研究,V433.9
  4. 空间目标ISAR成像仿真及基于ISAR像的目标识别,TN957.52
  5. 音乐结构自动分析研究,TN912.3
  6. 基于三维重建的焊点质量分类方法研究,TP391.41
  7. 胆囊炎和肾病综合症脉象信号的特征提取与分类研究,TP391.41
  8. 直推式支持向量机研究及其在图像检索中的应用,TP391.41
  9. 基于SVM的中医舌色苔色分类方法研究,TP391.41
  10. 基于图像的路面破损识别,TP391.41
  11. 基于支持向量机的故障诊断方法研究,TP18
  12. 过程支持向量机及其在卫星热平衡温度预测中的应用研究,TP183
  13. 高职课程改革研究,G712.3
  14. 基于数据挖掘技术的保健品营销研究,F426.72
  15. 高忠英学术思想与经验总结及运用补肺汤加减治疗呼吸系统常见病用药规律研究,R249.2
  16. 张炳厚学术思想与临床经验总结及应用地龟汤类方治疗慢性肾脏病的经验研究,R249.2
  17. 基于监督流形学习算法的固有不规则蛋白质结构预测研究,Q51
  18. Bicluster数据分析软件设计与实现,TP311.52
  19. 基于变异粒子群的聚类算法研究,TP18
  20. 融合粒子群和蛙跳算法的模糊C-均值聚类算法研究,TP18
  21. 基于遗传算法和粗糙集的聚类算法研究,TP18

中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机软件 > 程序设计、软件工程 > 程序设计 > 数据库理论与系统
© 2012 www.xueweilunwen.com