学位论文 > 优秀研究生学位论文题录展示

汉语联合短语结构分析与识别

作 者: 杨坡
导 师: 周经野
学 校: 湘潭大学
专 业: 语言学及应用语言学
关键词: 联合短语 自然语言处理 消歧 句法分析 识别规则
分类号: H146
类 型: 硕士论文
年 份: 2011年
下 载: 49次
引 用: 0次
阅 读: 论文下载
 

内容摘要


联合短语是汉语基本短语中的一种,其表现形式多种多样,内部构成成分非常复杂。汉语中不少相同词性的词语都可以无标记联合在一起构成联合式,不同词性的词也可以借助连接词构成联合短语,是汉语句法灵活性表现的一个重要方面。也正因为如此,联合短语结构的识别分析是中文信息处理过程中必须攻克的碉堡。在联合短语内部构成中,词语可以无标记组合形成联合短语,也可以有标记形成更复杂多变的联合式。本文对这两种类型的研究都有涉及,文章依次考虑了N+N,A+A,V+V这三种主要的联合短语。基于语料,本文充分利用现代汉语句法和语义相关知识,并且借助复杂特征集表示手法,提出了这三种联合式联合的条件和规则。全文共分四章来研究这个问题。第一章是文章的绪论,概括出自然语言发展的大概历程;第二章介绍了联合短语的定义和类型。然后介绍现今短语识别的几种主要方法和浅层句法分析的表示方法。第三章是本文的核心部分,作者依次描述了包括有标记和无标记的NN、AA、VV这三种主要的联合短语形式,提出了它们联合时规则和条件。结语部分是对本文的总结,也对未来问题的解决进行了展望和设想。为满足中文信息处理的需要,本文对联合短语的结构识别规则进行了归纳总结,我们先从语言学方面来研究其各种语法形态及其内部构成情况,然后综合句法语义信息给出它们的识别规则集,所以本文是在语言学本体和计算语言学两个领域进行研究的。一方面,希望能给汉语联合短语相关语言学本体知识做一些补充完善,另一方面也是最重要的,就是试图为计算语言学短语识别领域提供些知识材料。

全文目录


摘要  4-5
Abstract  5-7
第1章 引言  7-13
  1.1 课题的提出  8-9
  1.2 自然语言处理的发展  9-11
  1.3 本文工作及结构  11-13
    1.3.1 本文工作  11-12
    1.3.2 本文结构  12-13
第2章 相关语言学本体研究及短语识别方法  13-24
  2.1 联合短语的定义、类型及研究现状  13-18
    2.1.1 联合短语概念的界定  13
    2.1.2 联合短语的类型  13-18
  2.2 短语自动识别规则方法  18-22
    2.2.1 短语自动识别研究的理论基础  18-19
    2.2.2 短语自动识别消歧方法  19-22
  2.3 常见浅层句法分析的表示方法  22-24
第3章 联合短语结构识别分析研究  24-36
  3.1 “NP”构成的联合短语识别规则  25-28
    3.1.1 无标记NN 联合式的区别  25-27
    3.1.2 有标记NN 联合式的区别  27-28
  3.2 “ADJ”构成的联合短语识别规则  28-31
    3.2.1 无标记AA 联合式的区别  28-30
    3.2.2 有标记AA 联合式的区别  30-31
  3.3 “VP”构成的联合短语识别规则  31-36
    3.3.1 无标记 VV 联合式的区别  31-34
    3.3.2 有标记VV 联合式的区别  34-36
第4章 结语  36-38
  4.1 基本观点及创新之处  36-37
  4.2 不足和展望  37-38
参考文献  38-41
致谢  41-42
个人简历  42-43
在学期间发表的学术论文及研究成果  43

相似论文

  1. 基于句法特征的代词消解方法研究,TP391.1
  2. 词义消歧语料库自动获取方法研究,TP391.1
  3. 面向统计机器翻译的解码算法的研究,TP391.2
  4. 汉语框架自动识别中的歧义消解,TP391.1
  5. 基于博客搜索的博文情感倾向性分析技术的研究,TP391.1
  6. 学术主页信息抽取系统的研究,TP393.092
  7. 基于SCOT的语义标签推荐模型及算法研究,TP391.3
  8. 基于维基百科的命名实体消歧研究,TP391.1
  9. 语义网自动构建中句法分析的研究,TP391.1
  10. 基于自然语言打印机人机交互方法研究与实现,TP11
  11. 基于关联规则和图排序的句子情感倾向性研究,TP391.1
  12. 基于空间句法分析的城市地价与合理用地结构关系研究,F224;TU984.113
  13. 基于中文维基百科的语义相关度计算的研究与实现,TP391.1
  14. 面向专利领域的中文文本分类与检索方法研究,TP391.1
  15. 基于话题的多文档文摘技术研究,TP391.1
  16. 基于丰富特征和多核学习的蛋白质关系抽取,Q51
  17. 基于WEB的社区智能医疗服务系统的研究,TP311.52
  18. AraOntoLT:基于阿拉伯语文本的本体学习框架,TP391.1
  19. 自然语言理解中并列名词歧义消解及其在智能仪器设计领域的应用,TP391.1
  20. 面向自然语言处理的汉语句子语义知识库构建研究,H13
  21. 筛选规则智能化生成的研究与设计,TP393.08

中图分类: > 语言、文字 > 汉语 > 语法 > 近代、现代语法
© 2012 www.xueweilunwen.com