学位论文 > 优秀研究生学位论文题录展示
基于数据挖掘技术的智能答疑系统的研究与设计
作 者: 闫冬冬
导 师: 闫宏印
学 校: 太原理工大学
专 业: 计算机应用技术
关键词: 数据仓库 数据挖掘 关联规则 相关性分析 文本聚类
分类号: TP311.52
类 型: 硕士论文
年 份: 2010年
下 载: 31次
引 用: 0次
阅 读: 论文下载
内容摘要
数据挖掘是从大型数据集中,挖掘隐含在其中的、人们事先不知道的、对决策有用的知识的过程。通过对数据的统计、分析、综合和推理,发现数据间的关联性、未来趋势以及一般性的概括知识等,这些知识性的信息可以用来指导高级商务活动。答疑、解惑不仅是课堂教学中的一个必不可少的环节,同时也是网络教学中的一个重要模块。智能答疑系统的研究主要是致力于改革现有的答疑模式,充分利用教育网中知识库的资源,通过机器处理,自动回答学生的问题,从而实现教育中答疑这一重要的教学环节,提高教学效率和教学质量。本文分析了现有的答疑系统,研究并实现了一个带有论坛功能的基于web的智能答疑系统。系统实现了用户的注册、登录、提问和获取答案,同时通过论坛完成用户对问题的的异步答疑,让用户拥有更广阔的探讨平台。另外,本文将数据挖掘技术应用于智能答疑系统后台中,提出了一种基于数据挖掘算法的自动答疑设计方案,目标是实现一个快速准确高效的智能答疑系统。该方案的基本思想是将基于关键词的关联规则应用于文档的相似度计算当中,从每个问题所对应的诸多答案中抽取出一个最佳的答案生成一一对应的问题答案对库,然后执行基于关联规则的文本聚类算法,实现问题的分类存储。将聚类后的每一类问题应用关联规则,可得到更加准确的关联表,与此同时也促使相似度的精确度得以提高。通过以上方案便可以得到一个分类存储、答案准确度高的数据仓库。最后利用基于关键词关联度的相似度计算方法进行系统答疑,从而完成了一个答疑准确的智能答疑系统。
|
全文目录
摘要 3-5 ABSTRACT 5-10 第一章 绪论 10-16 1.1 论文背景及意义 10-11 1.2 国内外发展现状 11-14 1.2.1 智能答疑系统发展现状 11-13 1.2.2 数据挖掘技术的发展现状 13-14 1.3 论文研究的意义和工作成果 14-15 1.4 本文结构 15-16 第二章 相关理论及关键知识 16-30 2.1 数据仓库技术简介 16-18 2.1.1 数据仓库的体系结构 17 2.1.2 数据仓库的建立过程 17-18 2.2 数据挖掘技术 18-22 2.2.1 数据挖掘技术的概述 18 2.2.2 常用的数据挖掘技术及方法 18-19 2.2.3 数据挖掘的过程 19-22 2.3 文本挖掘 22-24 2.3.1 文本挖掘的定义 22-23 2.3.2 文本挖掘的过程 23 2.3.3 文本聚类 23-24 2.4 系统采用的开发技术 24-28 2.4.1 web开发语言 24-25 2.4.2 Struts框架的技术分析 25-28 2.4.3 开发环境的安装和配置 28 2.5 本章小结 28-30 第三章 智能答疑系统的设计与实现 30-42 3.1 智能答疑系统的结构设计 30-34 3.1.1 系统的开发流程 30-31 3.1.2 系统结构图的设计 31-33 3.1.3 知识资源库 33-34 3.2 系统功能设计 34-36 3.2.1 用户注册 34-35 3.2.2 问题的提出 35 3.2.3 问题的回答 35 3.2.4 标准答案的设定 35 3.2.5 答案搜索功能设计 35-36 3.2.6 答疑论坛的功能设计 36 3.3 答疑系统的实现 36-41 3.3.1 用户注册的实现 36-37 3.3.2 问题的提出与回答 37-39 3.3.3 在线答疑的实现 39-40 3.3.4 论坛答疑的实现 40-41 3.4 本章小结 41-42 第四章 数据挖掘技术在答疑系统中的研究与设计 42-62 4.1 关联规则 42-46 4.1.1 关联规则的定义 42-44 4.1.2 关联规则挖掘步骤 44 4.1.3 关联规则的经典算法-Apriori算法 44-46 4.2 数据仓库的设计思想 46-61 4.2.1 分词的设计 48-50 4.2.2 关联规则的应用 50-51 4.2.3 文本特征向量和权重计算 51-53 4.2.4 关联度与相似度算法 53-57 4.2.5 k-means聚类的设计 57-59 4.2.6 系统主要页面的实现 59-61 4.3 本章小结 61-62 第五章 总结与展望 62-64 参考文献 64-66 致谢 66-67 在校期间发表论文 67
|
相似论文
- 光纤陀螺温度漂移建模与补偿,V241.5
- 隐式用户兴趣挖掘的研究与实现,TP311.13
- 基于数据挖掘技术的保健品营销研究,F426.72
- 高忠英学术思想与经验总结及运用补肺汤加减治疗呼吸系统常见病用药规律研究,R249.2
- 张炳厚学术思想与临床经验总结及应用地龟汤类方治疗慢性肾脏病的经验研究,R249.2
- 桃杂交后代(F1)幼苗光合效能评价,S662.1
- Bicluster数据分析软件设计与实现,TP311.52
- 基于变异粒子群的聚类算法研究,TP18
- 融合粒子群和蛙跳算法的模糊C-均值聚类算法研究,TP18
- 基于遗传算法和粗糙集的聚类算法研究,TP18
- 基于同化能力杂种优势早期评价的桃光合特性研究,S662.1
- 不结球白菜抽薹性状生化特性和分子标记及遗传模型分析,S634.3
- 兖州矿区植物波谱变异与重金属胁迫特征研究,X173
- 湖北软麦制作酥性饼干品质特性的改良研究,TS213.22
- 演化聚类算法及其应用研究,TP311.13
- 基于数据挖掘的税务稽查选案研究,F812.42
- 面向社区教育的个性化学习系统的研究与实现,TP391.6
- 基于关联规则挖掘的入侵检测系统的研究与实现,TP393.08
- 数据仓库技术在银行客户管理系统中的研究和实现,TP315
- 基于Moodle的高职网络教学系统设计与实现,TP311.52
- 教学质量评估数据挖掘系统设计与开发,TP311.13
中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机软件 > 程序设计、软件工程 > 软件工程 > 软件开发
© 2012 www.xueweilunwen.com
|