学位论文 > 优秀研究生学位论文题录展示

最大熵模型的语义句法分析在问答系统中的应用研究

作 者: 王慧
导 师: 黄明
学 校: 大连交通大学
专 业: 计算机应用技术
关键词: 问题理解 M-分词算法 C-K算法 最大熵模型
分类号: TP391.1
类 型: 硕士论文
年 份: 2010年
下 载: 42次
引 用: 0次
阅 读: 论文下载
 

内容摘要


问题理解是问答系统进行处理的前提。本文主要针对问题理解模块进行研究,将问题理解研究应用在敬老院陪护机器人智能问答系统中,更好的理解老人的问题,智能的搜索问题答案并将结果返回给老人。本文主要介绍问题理解模块中的各个步骤,包括对问题进行分词切分、语义标注、确定问题类型,提取关键词及关键词扩展,并分析各个阶段的研究现状、方法,介绍了最大熵模型算法思想、构建模型的方法、如何选取特征集合的算法。之后提出了改进的算法:M-分词算法和C-K问题分类算法,描述其思想、步骤及实例,并以实验的方式来验证这两个方法,最后将提出的优化算法应用在陪护机器人自动问答系统中,取得很好的效果。针对现有分词技术容易出现歧义和词语划分不全的问题,本文提出了改进的M-分词算法,本系统是中小型自动问答系统,用基于统计和推理的分词方法代价高,故对机械分词方法进行改进,M-分词算法不遗漏任何一个可能是词的机会,保证了分词的准确性,运用M-分词算法之后,为了更准确的确定问题的分类类型,从句子语义和结构上理解问句,提出了C-K分类算法,该方法能够确定句子的主干来分析问题分类类型,提取关键词并扩展,扩展后的结果作为构建最大熵模型的特征集合,以构建一个最优的最大熵模型。应用M-分词算法后,能够得到准确的分词序列,用C-K算法来分析问题分类、提取关键词,提高了问题的理解程度,在实际的项目中,能够较准确的理解老人的提问,提高搜索答案的准确率并节约搜索时间。

全文目录


摘要  5-6
Abstract  6-7
目录  7-9
绪论  9-11
第一章 问答系统及问题理解现状研究  11-18
  1.1 问答系统研究概述  11-12
    1.1.1 问答系统的研究现状  11-12
    1.1.2 问答系统的核心问题  12
  1.2 问题理解研究现状  12-17
    1.2.1 词法分析的研究现状  13-15
    1.2.2 问题分类的研究现状  15-16
    1.2.3 句法分析的研究现状  16-17
  本章小结  17-18
第二章 最大熵模型算法  18-23
  2.1 最大熵模型  18-19
  2.2 通用迭代算法  19-20
  2.3 特征选择  20-22
    2.3.1 特征选择的问题描述  20-21
    2.3.2 增量式特征选择算法  21-22
  本章小结  22-23
第三章 一种改进的分词算法  23-32
  3.1 分词方法  23-25
  3.2 M-分词算法  25-30
    3.2.1 M-分词算法的思想  25-26
    3.2.2 M-分词算法的优点  26
    3.2.3 M-分词算法的流程和步骤  26-28
    3.2.4 M-分词算法的实现  28-30
  3.3 M-分词算法的实验证明  30-31
  本章小结  31-32
第四章 一种改进的问题分类算法  32-42
  4.1 算法相关知识  32-34
    4.1.1 句中成分结构定义  32-33
    4.1.2 句法研究  33
    4.1.3 定义问题类型库  33-34
    4.1.4 识别疑问词  34
  4.2 C-K算法思想  34-40
    4.2.1 C-K算法的流程和步骤  35-38
    4.2.2 C-K算法的优点  38
    4.2.3 C-K算法的实例研究  38-40
  4.3 C-K算法的实验验证  40-41
  本章小结  41-42
第五章 语义句法分析在机器人问答系统中的应用  42-54
  5.1 引言  42-43
    5.1.1 问题理解在系统中的实现  42-43
    5.1.2 最大熵模型在系统中的应用  43
  5.2 问题理解的流程及步骤  43-44
  5.3 机器人问答系统问题理解的实现  44-52
    5.3.1 问题理解模块在系统的实现  45
    5.3.2 系统框架  45-46
    5.3.3 系统界面实现  46-51
    5.3.4 层级式问答对知识数据库  51-52
  5.4 语义句法分析在应用中的实验验证  52-53
  本章小结  53-54
结论与展望  54-56
参考文献  56-60
攻读硕士学位期间发表的学术论文  60-61
致谢  61

相似论文

  1. 基于差分进化算法的JSP环境下成套订单研究,F273
  2. 基于图的标志SNP位点选择算法研究,Q78
  3. 高灵敏度GNSS软件接收机的同步技术研究与实现,P228.4
  4. 天然气脱酸性气体过程中物性研究及数据处理,TE644
  5. 基于Thermo-Calc三元共晶合金凝固路径的耦合计算,TG111.4
  6. 压气机优化平台建立与跨音速压气机气动优化设计,TH45
  7. 多导弹协同作战突防效能评估及组合优化算法研究,TJ760.1
  8. 基于感性负载的车身网络控制系统,U463.6
  9. 基于蚁群算法的电梯群优化控制研究,TU857
  10. 高精度激光跟踪装置闭环控制若干关键问题研究,TN249
  11. 半导体激光器热电控制技术研究,TN248.4
  12. AES算法及其DSP实现,TN918.1
  13. 基于UWB脉冲信号的测距定位技术,TN929.5
  14. 基于TS101的DFT输出子集算法研究及软件实现,TN911.72
  15. 高光谱图像空—谱协同超分辨处理研究,TN911.73
  16. DBF接收机用于二维测向算法的研究,TN851
  17. 电视制导系统中视频图像压缩优化设计及实现研究,TN919.81
  18. IEEE802.16e信道编译码算法研究,TN911.22
  19. LDPC码译码算法的研究,TN911.22
  20. 频繁图结构并行挖掘算法的研究与实现,TP311.13
  21. 基于人眼检测的驾驶员疲劳状态识别技术,TP391.41

中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机的应用 > 信息处理(信息加工) > 文字信息处理
© 2012 www.xueweilunwen.com