学位论文 > 优秀研究生学位论文题录展示
NERMS中智能答疑系统的研究与实现
作 者: 孙大伟
导 师: 刘大有
学 校: 吉林大学
专 业: 计算机应用技术
关键词: 语义空间 研究与实现 网络教学资源 相似度计算 自然语言理解 智能答疑 SVD方法 SVD分解 信息库 文档
分类号: TP311.52
类 型: 硕士论文
年 份: 2004年
下 载: 99次
引 用: 1次
阅 读: 论文下载
内容摘要
Network Educational Resource Management System(NERMS)项目是由吉林省科委立项、吉林大学计算机科学与技术学院知识工程实验室承建的省级重大大中型项目。NERMS的主要目标是对繁多的网络教学资源进行有效的组织和管理,以便于网络教学资源的高效共享和获取。由于NERMS项目要求为NERMS系统的用户提供智能答疑的服务,本文开展了关于智能答疑系统的研究。智能答疑系统能通过友好的交互接口和问题逻辑推理部件接受和理解用户的问题,并根据一定计算方法和推理搜索已有的知识库和信息库找到问题的可能答案或相应资源,找到的信息通过答案的解释部件呈现给用户尽可能简单、明了的可能的答案和答案信息;系统还支持多种问题求解途径包括提供具有自动特征的人际交互渠道;该系统的知识库和信息库有自动学习和更新的能力;系统同时提供与答疑行为相关的数据的计算和统计功能,从而优化系统知识库和信息库的结构以及提供有关数据输出。智能答疑系统是模拟知识领域的专家,对于用户提出的问题能够自动地给出准确的答案。智能答疑系统常用的技术主要有数据挖掘、人工智能、自然语言理解等,本文主要对基于自然语言理解的智能答疑系统同进行了详细的研究。具体是利用LSA(Latent Sematic Analysis深层次语义分析)来实现自然语言的理解。在自然语言理解过程中,需要一个有力的方法和理论来处理大量的词汇和文档信息,而LSA恰好是一个比较理想的方法。利用LSA可以很方便地精确地计算出词与词、词与文档、文档与文档间的相似度,根据相似度来揭示它们潜在的联系,从而实现自然语言的处理和理解。LSA是一个将文档内容描述为一个高维的基于很大文本集的语义空间的统计技术。在对用户进行智能答疑的过程中,我们在<WP=48>语义空间中分析问题,从而得到问题向量,计算问题向量与文档向量的相似度,在答案库中找到与问题匹配的答案。建立语义空间是进行向量相似度计算的基础,初始的空间是根据词和文档的关系建立起来的。对所有的文档进行分词,得到包含在文档中的全部的词及词的数量,按照词和文档的数量建立起来初始的语义空间。对原始语义空间进行SVD分解得到两个空间:一个表示词的语义空间,一个表示文档的语义空间。相似度计算过程中的所有计算都是基于这两个语义空间来进行的,其中用到了SVD方法和理论。SVD(Singular Value Decomposition奇异值分解)方法是一个矩阵线性分解的常用方法,是一个特征值与特征向量分析的形式。SVD是一个因子分析的形式,它构造一个n维的抽象语义空间,在这个语义空间中每一个原始的词和原始的文档或者任意一个新的文档都被表示为语义空间中的向量。SVD分解根据矩阵的运算计算出矩阵的奇异值,然后根据奇异值计算出矩阵的两个奇异矩阵,将矩阵分解为三个矩阵的乘积形式。SVD方法为LSA提供了计算的基础,使得LSA能更精确地计算出问题和答案的相似度,从而找到准确的答案。LSA是用于信息获取(IR)领域的主要空间向量方法中的一个,而且对LSA的理论研究和方法的实际应用仍然需要深入的进行。这些研究将用于完善智能答疑系统,使智能答疑系统能更好的用于NERMS系统中,为用户提供准确的答案。
|
全文目录
第一章 绪 论 6-9 1.1 网络教学资源管理系统NERMS 6-7 1.2 问题的提出 7 1.3 关于答疑 7-8 1.4 本文的工作 8-9 第二章 智能答疑系统的整体设计 9-15 2.1 答疑系统的模型 9-10 2.2 系统的工作流程 10-12 2.3 常用的基本技术和理论 12-15 2.3.1 自然语言理解 12-13 2.3.2 Latent Semantic Analysis(LSA) 13-14 2.3.3 相似度的计算 14-15 第三章 基于自然语言理解的答疑系统 15-40 3.1 LSA简介和LSA理论 15-22 3.1.1 LSA基本介绍 15-16 3.1.2 LSA思想与理论 16-17 3.1.3 LSA的信息获取 17-18 3.1.4 LSA语义空间的建立 18-19 3.1.5 LSA的模型与处理 19-20 3.1.6 LSA的附加细节 20-21 3.1.7 小结 21-22 3.2 SVD简介和SVD理论 22-27 3.2.1 SVD简介 22-23 3.2.2 SVD思想和理论 23-24 3.2.3 SVD分解的简化 24-26 3.2.4 SVD的相关理论 26-27 3.2.5 小结 27 3.3 系统的具体实现 27-39 3.3.1 LSA的实现 27-32 3.3.2 SVD算法的实现 32-36 3.3.3 数据库中的结构 36-38 3.3.4 Lanczos运算法则 38-39 3.4 小结 39-40 第四章 NERMS系统中的智能答疑 40-42 4.1 智能答疑系统结构图 40-41 4.2 系统的基本工作 41 4.3 下一步的工作 41-42 第五章 结论与展望 42-44 参 考 文 献 44-46 致 谢 46-47 中 文 摘 要 47-49 Abstract 49-51
|
相似论文
- 多邮件自动文摘的关键技术研究,TP391.1
- 面向动态文档集的大规模文本索引构建技术的研究,TP391.3
- 矢量CAD电子图纸保护系统研究,TP391.72
- 基于相似度计算的编程题自动评判方法研究,TP312.1
- 面向领域的数据库问答系统关键技术研究,TP311.13
- 面向主题的Web文档自动文摘生成方法研究,TP391.1
- 基于聚焦爬虫技术的教学资源搜集与自动整理方法研究,TP301.6
- 高中历史新课程网络教学资源的合理有效利用研究,G633.51
- Web环境下基于语义模式匹配的实体关系提取方法的研究,TP391.1
- 概率XML文档中Holistic Twig查询处理算法的研究与实现,TP311.13
- 智能答疑系统中句子相似度计算的研究与应用,TP391.1
- 题库管理系统中试卷管理模块的设计与实现,TP311.52
- 表格手写内容识别系统的设计与实现,TP391.41
- 主观题自动评分技术研究,TP391.1
- 基于SNMP的光纤通道交换机的网管系统的设计,TN915.07
- 云存储中大规模加密小文档存储管理研究与实现,TP333
- 外包数据库模式下中文文档密文检索研究,TP391.3
- 中文XML压缩技术研究,TP311.11
- 面向论坛信息文本的有效数据抽取研究,TP391.1
- 网络智能答疑系统的研究与实现,TP393.09
- 结直肠癌转化医学信息库构建与应用探索,R735.3
中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机软件 > 程序设计、软件工程 > 软件工程 > 软件开发
© 2012 www.xueweilunwen.com
|