学位论文 > 优秀研究生学位论文题录展示

基于领域词典的汉语语块分析的研究

作 者: 石凯华
导 师: 郑彦
学 校: 南京邮电大学
专 业: 计算机软件与理论
关键词: 浅层句法分析 语块 领域词典 XML
分类号: TP391.1
类 型: 硕士论文
年 份: 2011年
下 载: 30次
引 用: 0次
阅 读: 论文下载
 

内容摘要


句法分析技术已经成为当前自然语言处理的一个瓶颈。但由于自然语言存在大量的复杂的结构歧义,使得句法分析举步维艰。可以采用分治的思想降低句法分析的难度,这就是近年来自然语言处理领域出现的一个新的语言处理策略——浅层句法分析(shallow parsing)。基于分治法的思想,可以将句法分析分解为三个子任务:1)语块识别,2)语块内部结构分析,3)语块间关系分析。浅层句法分析的主要任务是语块识别和语块内部结构分析。本文的目的是进行语块内部结构分析。语块的结构比较简单,大多是以简单短语的形式存在,可以转化为词语与词语之间的关系来进行分析。本文的主要工作概括如下:1)分析词语间的相互关系。本文总结词语间的关系主要为:上下位关系、整体部分关系、同义反义关系、蕴含关系、致使关系等。2)利用词语间的关系构建领域词典。为了分析语块内部结构,本文构建了一个领域词典,该领域词典是在词语与词语间的关系基础上建立的,以词语间的上下位关系为主要关系,把词典构建为一个树形的拓扑结构,并对单一词性的词语和兼类词分别构建词语关系树。领域词典中的每个词语都对应于该树形结构中的某个节点,每个节点都表示一个词语,每个词语都包含编码、词性等属性,其中词性蕴含在编码中,这些属性值用XML来存储。3)利用领域词典对语块内部的语法关系进行分析。构建领域词典的目的是为了进行语块内部结构分析。为了达到这个目的,本文认真研究了语块的内部结构,并找出了语块内部结构与词性的关系,这样就形成了语块类型判断策略。以领域词典为基础,运用语块类型判断策略,可以比较迅速的判断语块的结构。在文章最后阶段,通过程序的运行,验证了本文上述语块判断策略的可行性。

全文目录


摘要  4-5
Abstract  5-8
第一章 绪论  8-15
  1.1 课题的相关背景  8-10
  1.2 国内外浅层句法分析研究现状  10-12
    1.2.1 国外研究现状  10-11
    1.2.2 国内研究现状  11-12
  1.3 问题的提出以及本文的主要工作  12-14
    1.3.1 问题的提出  12-13
    1.3.2 本文的主要工作  13-14
  1.4 本文的组织结构  14-15
第二章 概念词典  15-23
  2.1 传统词典与概念词典  15-18
    2.1.1 传统词典与概念词典的异同  15-16
    2.1.2 几种概念词典介绍  16-17
    2.1.3 领域词典  17-18
  2.2 词语分类  18-20
    2.2.1 词类  18-19
    2.2.2 兼类词  19-20
  2.3 词语之间的相互关系  20-22
    2.3.1 名词词语间关系  20-21
    2.3.2 动词词语间关系  21-22
  2.4 基于词语关系的词典的构建  22
  2.5 本章小结  22-23
第三章 语块语法分析词典的构建  23-50
  3.1 语块相关知识  23-28
    3.1.1 语块的定义  23-24
    3.1.2 短语的分类  24-27
    3.1.3 构建本领域词典需要解决的问题  27-28
  3.2 基于XML 的词典结构  28-32
    3.2.1 XML 的定义  28-29
    3.2.2 用XML 定义的树形结构示例  29-30
    3.2.3 利用XML 定义领域词典节点的数据结构  30-32
  3.3 应用于语块语法分析的领域词典的构建  32-49
    3.3.1 领域词典的构建  32-37
    3.3.2 领域词典的编码、存储方式及索引  37-45
    3.3.3 领域词典的查询  45-47
    3.3.4 词语关系树的计算机自动生成  47-49
  3.4 本章小结  49-50
第四章 基于领域词典的语块内部语法分析的研究  50-58
  4.1 语块语法分类  50-52
    4.1.1 语块分类  50
    4.1.2 句子的语法分类  50-51
    4.1.3 语块的语法分类  51-52
  4.2 应用领域词典进行语块内部语法分析  52-55
    4.2.1 单一词性的短语类型判断策略  53-55
    4.2.2 兼类词的短语类型判断策略  55
  4.3 应用领域词典进行分析的过程  55-57
  4.4 本章小结  57-58
第五章 运行分析  58-64
  5.1 实验的运行环境  58
  5.2 语块类型判断策略  58-59
  5.3 程序的运行及其结果  59-64
第六章 总结与展望  64-66
  6.1 本文总结  64-65
  6.2 展望  65-66
致谢  66-67
参考文献  67-72
硕士研究生期间发表的论文  72

相似论文

  1. 基因调控网络模型描述语言研究,Q78
  2. 支持XML数据查询的F&B索引结构的研究,TP311.13
  3. LXI自动测试系统集成技术研究,TP274
  4. 基于网络的服装款式设计系统的研究与实现,TS941.2
  5. 基于MDA的界面自动生成方法的研究,TP311.5
  6. 语块与高中生英语写作能力,G633.41
  7. C++代码缺陷检测系统的研究与设计,TP311.53
  8. 基于Web的科学计算遗留应用共享技术研究,TP393.09
  9. 基于XML的异构数据交换系统的设计与实现,TP311.52
  10. “V+到+X”结构中“到”的偏误分析与教学对策,H195
  11. 电子公文传输管理系统在电大系统中的设计与实现,TP311.52
  12. 概率XML数据上关键字检索算法的研究与实现,TP391.3
  13. 行政审批电子监察系统数据交换的设计与实现,TP311.52
  14. 概率XML文档中Holistic Twig查询处理算法的研究与实现,TP311.13
  15. 保留语义约束的XML与关系数据库双向转换技术研究,TP311.13
  16. SOA架构在高校信息化系统中整合技术的应用,TP311.52
  17. 基于银行综合前置平台的金融服务支付系统的设计与实现,TP311.52
  18. 基于观察者模式的银行主动服务系统的设计与实现,TP311.52
  19. 江北区企业信用信息系统设计与实现,TP311.52
  20. 基于服务总线的模具企业信息集成系统,TP311.52
  21. 基于语言转换的嵌入式软PLC系统的研究与设计,TP273

中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机的应用 > 信息处理(信息加工) > 文字信息处理
© 2012 www.xueweilunwen.com