学位论文 > 优秀研究生学位论文题录展示

数据挖掘技术在教务管理中的应用

作 者: 张荣富
导 师: 刘锋
学 校: 安徽大学
专 业: 计算机应用技术
关键词: 流失率 决策树 C4.5算法
分类号: TP311.13
类 型: 硕士论文
年 份: 2011年
下 载: 68次
引 用: 0次
阅 读: 论文下载
 

内容摘要


随着国家教育战略的推进和社会经济的迅猛发展,对各类应用型人才的需求量也愈来愈大,广播电视大学开展的现代远程开放教育的办学模式已愈来愈为社会各界广泛接受。近年来,各地电大主动适应社会需求,结合地方社会经济发展的需要开设专业,加大招生宣传的力度,取得了良好的招生业绩。然而在招生人数增长的同时,也存在着学员流失的问题。学员入学后是否留得住,能否不流失或者少流失,这不仅关系到电大的发展,也是国家实施远程教育战略中的一大问题。数据挖掘技术正是分析这个问题的可行而有效的方法。本文试图基于数据挖掘技术从数据角度分析学员流失的主要原因,并力图提供一个解决方案,在学员即将流失前采取措施预防学员流失。首先收集各种资料,包括已有的分析材料和统计数据,对这些资料进行分析,初步分析出学员流失的可能原因,从而确定问题的范围和研究主题。根据初步的确定的研究范围,对已有的各种数据源进行分析,结合研究主题对数据源进行筛选,从而既保证概括所有有价值的数据,也能保证数据源范围在合理范围内。经过分析比较,我们选择了教务数据和成绩数据作为分析对象。再对教务数据和成绩数据进行深入剖析,弄清事实与维度,从而构造出流失率分析数据仓库数据模型,再结合具体的数据库系统设计数据存储结构,构建出流失分析数据仓库。然后通过数据清理、转换等步骤对教务数据和成绩数据进行规范化处理,导入到数据仓库中。然后利用决策树分类方法进行分析。先将数据仓库中的数据分为两部分:训练样本和测试样本。再利用C4.5算法对训练样本进行处理,建立学员流失分析决策树模型,由决策树模型导出分类规则。然后用测试样本对所生成的分类规则进行测试,从测试的结果看,得到的分类规则准确率较高。最后根据生成的决策树模型和生成的学员流失规则编制了学员流失预警系统。有了学员流失预警系统后,导修主任或教务人员在预防学员流失不再“普遍撒网”,而变得“有的放矢”,有效地防止了学员流失,因此,基于决策树方法的学员流失分析模型达到了预期目的。

全文目录


摘要  3-4
Abstract  4-8
第一章 引言  8-11
  1.1 数据挖掘的背景  8
  1.2 选题背景  8-9
  1.3 研究意义  9
  1.4 内容安排  9-11
第二章 数据仓库和数据挖掘  11-19
  2.1 数据仓库  11-12
    2.1.1 数据仓库的概念  11
    2.1.2 数据仓库系统体系结构  11-12
    2.1.3 数据仓库的设计步骤  12
  2.2 数据挖掘  12-14
    2.2.1 数据挖掘的概念  12
    2.2.2 数据挖掘的步骤  12-13
    2.2.3 数据挖掘任务  13-14
  2.3 数据挖掘模型和算法  14-19
    2.3.1 决策树(Decision trees)  14-16
    2.3.2 ID3算法  16-17
    2.3.3 C4.5算法  17-18
    2.3.4 树剪枝  18-19
第三章 流失分析数据仓库建模  19-30
  3.1 问题分析  19-21
    3.1.1 初步分析学员流失的原因  19-20
    3.1.2 选择合适的数据  20-21
    3.1.3 有关概念  21
  3.2 构建数据仓库模型  21-24
    3.2.1 常用的建模方法  22
    3.2.2 学员流失率数据仓库模型  22-24
  3.3 数据存储设计  24-25
  3.4 数据预处理  25-30
    3.4.1 清理数据  25
    3.4.2 数据转换  25-29
    3.4.3 数据更新  29-30
第四章 数据挖掘在流失率分析中的应用  30-38
  4.1 抽取训练样本  30-31
  4.2 构建决策树模型  31-34
    4.2.1 计算信息增益率  31-34
    4.2.2 构建决策树模型  34
    4.2.3 树剪枝  34
  4.3 提取分类规则  34-38
第五章 流失预警系统的实现  38-43
  5.1 系统架构  38-39
  5.2 C/S模块  39-42
    5.2.1 数据源  39
    5.2.2 清理、转换数据  39-40
    5.2.3 生成决策树模型  40
    5.2.4 生成流失规则  40-41
    5.2.5 C/S终端设计  41-42
  5.3 B/S模块  42-43
第六章 总结与展望  43-45
  6.1 全文总结  43
  6.2 展望  43-45
参考文献  45-48
图索引  48-49
表索引  49-50
致谢  50-51
攻读学位期问发表的学术论文目录  51

相似论文

  1. 基于支持向量机的故障诊断方法研究,TP18
  2. 中国区可口可乐员工流失率研究,F426.82
  3. 基于数据流挖掘技术的流量识别,TP393.06
  4. 教学质量评估数据挖掘系统设计与开发,TP311.13
  5. 模糊聚类和决策树分类算法在高职学生就业方面的应用研究,TP399-C1
  6. 基于SOA构架的社区医疗管理系统研究与实现,TP311.52
  7. 基于数据挖掘技术的高校毕业生就业管理信息系统的设计与实现,TP311.52
  8. 数据挖掘技术在预防电信客户流失中的应用研究,TP311.13
  9. 数据挖掘技术在高职教师绩效考核中的应用研究,TP311.13
  10. 基于知识整合的数据流分类算法研究,TP311.13
  11. SAPs对蛋白质功能影响特征分析及性能评估,Q51
  12. 基于改进的ID3算法的蛋白质纯化方法研究,Q51
  13. 因子、关联及决策树分析在冠心病心绞痛证候分布规律研究中的应用,R259
  14. 基于决策树分类算法的Web文本分类研究,TP391.1
  15. 数据挖掘技术在学生成绩分析中的应用研究,TP311.13
  16. 决策树在高职院校毕业生就业工作中应用研究,TP311.13
  17. 基于决策树中文文本分类技术的研究与实现,TP391.1
  18. 数据挖掘在电子政务办公系统中的应用,TP311.13
  19. 保险代理人的流失及管理控制研究,F842
  20. 我国寿险个人代理人流失问题研究,F842

中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机软件 > 程序设计、软件工程 > 程序设计 > 数据库理论与系统
© 2012 www.xueweilunwen.com