学位论文 > 优秀研究生学位论文题录展示
最大熵模型的语义句法分析在问答系统中的应用研究
作 者: 王慧
导 师: 黄明
学 校: 大连交通大学
专 业: 计算机应用技术
关键词: 问题理解 M-分词算法 C-K算法 最大熵模型
分类号: TP391.1
类 型: 硕士论文
年 份: 2010年
下 载: 42次
引 用: 0次
阅 读: 论文下载
内容摘要
问题理解是问答系统进行处理的前提。本文主要针对问题理解模块进行研究,将问题理解研究应用在敬老院陪护机器人智能问答系统中,更好的理解老人的问题,智能的搜索问题答案并将结果返回给老人。本文主要介绍问题理解模块中的各个步骤,包括对问题进行分词切分、语义标注、确定问题类型,提取关键词及关键词扩展,并分析各个阶段的研究现状、方法,介绍了最大熵模型算法思想、构建模型的方法、如何选取特征集合的算法。之后提出了改进的算法:M-分词算法和C-K问题分类算法,描述其思想、步骤及实例,并以实验的方式来验证这两个方法,最后将提出的优化算法应用在陪护机器人自动问答系统中,取得很好的效果。针对现有分词技术容易出现歧义和词语划分不全的问题,本文提出了改进的M-分词算法,本系统是中小型自动问答系统,用基于统计和推理的分词方法代价高,故对机械分词方法进行改进,M-分词算法不遗漏任何一个可能是词的机会,保证了分词的准确性,运用M-分词算法之后,为了更准确的确定问题的分类类型,从句子语义和结构上理解问句,提出了C-K分类算法,该方法能够确定句子的主干来分析问题分类类型,提取关键词并扩展,扩展后的结果作为构建最大熵模型的特征集合,以构建一个最优的最大熵模型。应用M-分词算法后,能够得到准确的分词序列,用C-K算法来分析问题分类、提取关键词,提高了问题的理解程度,在实际的项目中,能够较准确的理解老人的提问,提高搜索答案的准确率并节约搜索时间。
|
全文目录
摘要 5-6 Abstract 6-7 目录 7-9 绪论 9-11 第一章 问答系统及问题理解现状研究 11-18 1.1 问答系统研究概述 11-12 1.1.1 问答系统的研究现状 11-12 1.1.2 问答系统的核心问题 12 1.2 问题理解研究现状 12-17 1.2.1 词法分析的研究现状 13-15 1.2.2 问题分类的研究现状 15-16 1.2.3 句法分析的研究现状 16-17 本章小结 17-18 第二章 最大熵模型算法 18-23 2.1 最大熵模型 18-19 2.2 通用迭代算法 19-20 2.3 特征选择 20-22 2.3.1 特征选择的问题描述 20-21 2.3.2 增量式特征选择算法 21-22 本章小结 22-23 第三章 一种改进的分词算法 23-32 3.1 分词方法 23-25 3.2 M-分词算法 25-30 3.2.1 M-分词算法的思想 25-26 3.2.2 M-分词算法的优点 26 3.2.3 M-分词算法的流程和步骤 26-28 3.2.4 M-分词算法的实现 28-30 3.3 M-分词算法的实验证明 30-31 本章小结 31-32 第四章 一种改进的问题分类算法 32-42 4.1 算法相关知识 32-34 4.1.1 句中成分结构定义 32-33 4.1.2 句法研究 33 4.1.3 定义问题类型库 33-34 4.1.4 识别疑问词 34 4.2 C-K算法思想 34-40 4.2.1 C-K算法的流程和步骤 35-38 4.2.2 C-K算法的优点 38 4.2.3 C-K算法的实例研究 38-40 4.3 C-K算法的实验验证 40-41 本章小结 41-42 第五章 语义句法分析在机器人问答系统中的应用 42-54 5.1 引言 42-43 5.1.1 问题理解在系统中的实现 42-43 5.1.2 最大熵模型在系统中的应用 43 5.2 问题理解的流程及步骤 43-44 5.3 机器人问答系统问题理解的实现 44-52 5.3.1 问题理解模块在系统的实现 45 5.3.2 系统框架 45-46 5.3.3 系统界面实现 46-51 5.3.4 层级式问答对知识数据库 51-52 5.4 语义句法分析在应用中的实验验证 52-53 本章小结 53-54 结论与展望 54-56 参考文献 56-60 攻读硕士学位期间发表的学术论文 60-61 致谢 61
|
相似论文
- 基于差分进化算法的JSP环境下成套订单研究,F273
- 基于图的标志SNP位点选择算法研究,Q78
- 高灵敏度GNSS软件接收机的同步技术研究与实现,P228.4
- 天然气脱酸性气体过程中物性研究及数据处理,TE644
- 基于Thermo-Calc三元共晶合金凝固路径的耦合计算,TG111.4
- 压气机优化平台建立与跨音速压气机气动优化设计,TH45
- 多导弹协同作战突防效能评估及组合优化算法研究,TJ760.1
- 基于感性负载的车身网络控制系统,U463.6
- 基于蚁群算法的电梯群优化控制研究,TU857
- 高精度激光跟踪装置闭环控制若干关键问题研究,TN249
- 半导体激光器热电控制技术研究,TN248.4
- AES算法及其DSP实现,TN918.1
- 基于UWB脉冲信号的测距定位技术,TN929.5
- 基于TS101的DFT输出子集算法研究及软件实现,TN911.72
- 高光谱图像空—谱协同超分辨处理研究,TN911.73
- DBF接收机用于二维测向算法的研究,TN851
- 电视制导系统中视频图像压缩优化设计及实现研究,TN919.81
- IEEE802.16e信道编译码算法研究,TN911.22
- LDPC码译码算法的研究,TN911.22
- 频繁图结构并行挖掘算法的研究与实现,TP311.13
- 基于人眼检测的驾驶员疲劳状态识别技术,TP391.41
中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机的应用 > 信息处理(信息加工) > 文字信息处理
© 2012 www.xueweilunwen.com
|