学位论文 > 优秀研究生学位论文题录展示
智能答疑系统中句子相似度计算的研究与应用
作 者: 刘欣
导 师: 俸志刚;高岷
学 校: 电子科技大学
专 业: 软件工程
关键词: 智能答疑 句子相似度 遗传算法
分类号: TP391.1
类 型: 硕士论文
年 份: 2011年
下 载: 9次
引 用: 0次
阅 读: 论文下载
内容摘要
在智能答疑、机器翻译、智能检索等领域,句子相似度计算都是其中关键的技术。智能答疑系统可以通过句子相似度计算在常见问题库中找到与用户提出的疑问相匹配的答案,从而返回相对较准确的答案。本文在研究过程中,依次对义原、词语、句子三个层次的相似度计算进行了研究,其中重点分析了句子相似度计算。在此基础之上,本文提出了多元化的句子相似度计算方法,并通过实验分析,证明了该方法的有效性,最后设计了一个招生领域答疑系统并将多元化的句子相似度计算应用到其中。本文的工作主要体现在以下几个方面:1.针对目前词语相似度计算方法的优缺点进行了阐述,并对其进行了改进,为下文句子相似度的计算做铺垫。2.从多维视角量化句子的各类信息,构建了多元化的句子相似度计算模型。该模型综合利用句子长度、相同关键词的个数、句子语义、关键词等多种句子信息,运用加权求和的方法,确定句子间的相似度。3.本文采用了遗传算法确定多种句子特征之间的权重,确保了权值的准确性和可靠性。4.设计了一个招生领域答疑系统(EAQS,Enrollment Area Question- Answering System)模型,把多元化的句子相似度计算方法应用于其中的常见问题库(FAQ)的问句匹配,并给出了句子相似度计算在FAQ库中的实现过程。
|
全文目录
摘要 4-5 ABSTRACT 5-9 第一章 前言 9-13 1.1 课题研究背景及意义 9 1.2 课题研究内容 9-10 1.3 课题研究现状及分析 10-12 1.4 本文的组织结构 12-13 第二章 词语相似度计算 13-20 2.1 词语相似度的概念及其计算方法 13-15 2.1.1 基于大规模语料库的词语相似度计算 13-14 2.1.2 基于语义词典的词语相似度计算 14-15 2.2 基于语义词典的词语相似度计算 15-19 2.2.1 《知网(HowNet)》概述 15-17 2.2.2 基于《知网》词语相似度的计算 17-19 2.2.3 基于《知网》义原相似度的计算 19 2.3 本章小结 19-20 第三章 句子相似度计算 20-45 3.1 句子相似度的概念及其计算方法 20-24 3.1.1 基于向量空间模型的TF-IDF 方法 20-21 3.1.2 基于《知网》的句子相似度计算方法 21-22 3.1.3 基于依存分析的句子相似度计算方法 22-23 3.1.4 基于编辑距离的句子相似度计算方法 23-24 3.2 多元化的句子相似度计算 24-28 3.2.1 多元化的设计思想 24-25 3.2.2 多元化的句子相似度计算方法 25-28 3.3 遗传算法确定权重 28-44 3.3.1 确定权重的方法 28 3.3.2 遗传算法概述 28-30 3.3.3 确定权重的过程 30-31 3.3.4 遗传算法的实现 31-44 3.4 本章小结 44-45 第四章 实验与分析 45-54 4.1 评价方法 45-46 4.2 实验数据 46 4.3 实验结果及数据分析 46-53 4.4 本章小结 53-54 第五章 句子相似度计算在智能答疑中的应用 54-65 5.1 招生领域答疑系统(EAQS)的设计方案 54-55 5.2 招生领域答疑系统(EAQS)的总体结构 55-56 5.3 招生领域答疑系统(EAQS)的功能实现 56-60 5.3.1 问句处理模块 56-57 5.3.2 问句匹配模块 57-58 5.3.3 逻辑推理模块 58-59 5.3.4 信息检索模块 59 5.3.5 答案抽取模块 59-60 5.4 句子相似度计算在FAQ 库中的应用 60-64 5.4.1 FAQ 库的收集 60-61 5.4.2 FAQ 库的设计 61-63 5.4.3 句子相似度计算 63 5.4.4 FAQ 库的更新 63-64 5.5 本章小结 64-65 第六章 总结与展望 65-66 6.1 工作总结 65 6.2 研究展望 65-66 致谢 66-67 参考文献 67-70
|
相似论文
- 天然气脱酸性气体过程中物性研究及数据处理,TE644
- 压气机优化平台建立与跨音速压气机气动优化设计,TH45
- 基于遗传算法的模糊层次综合评判在高职教学评价中的应用,G712
- 部队人员网上训练与考核系统的开发,TP311.52
- 基于并行算法的模糊综合评价模型的设计与应用,TP18
- 基于神经网络的牡蛎呈味肽制备及呈味特性研究,TS254.4
- 基于遗传算法的中短波磁天线的设计及实现,TN820
- 基于遗传算法的柑橘图像分割,TP391.41
- 基于混合自适应遗传算法的动态网格调度问题研究,TP393.09
- 基于遗传—牛顿算法的公交优化调度,TP18
- 基于遗传算法优化的BP网络对生物柴油制备工艺的优化,TE667
- 基于云理论和蜜蜂进化型遗传算法的纹理合成研究,TP391.41
- 基于遗传算法和粗糙集的聚类算法研究,TP18
- 基于遗传算法的淠史杭灌区渠系配水优化编组模型的研究,S274
- 遗传算法在物流仓储优化中的应用研究,F259.2
- 基于遗传算法的矿山资源优化调度模型的研究,O224
- 磁流变阻尼器的力学特性及其在火炮反后坐中的应用研究,TB535.1
- 模糊预测函数控制改进算法的研究及应用,TP273
- 基于模拟的注塑模浇注系统及成型工艺参数优化研究,TQ320.662
- 基于重型机床大型零件铣削加工性能及参数优化的研究,TG54
- 基于神经网络的自适应噪声主动控制研究,TP183
中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机的应用 > 信息处理(信息加工) > 文字信息处理
© 2012 www.xueweilunwen.com
|