学位论文 > 优秀研究生学位论文题录展示
汉语联合短语结构分析与识别
作 者: 杨坡
导 师: 周经野
学 校: 湘潭大学
专 业: 语言学及应用语言学
关键词: 联合短语 自然语言处理 消歧 句法分析 识别规则
分类号: H146
类 型: 硕士论文
年 份: 2011年
下 载: 49次
引 用: 0次
阅 读: 论文下载
内容摘要
联合短语是汉语基本短语中的一种,其表现形式多种多样,内部构成成分非常复杂。汉语中不少相同词性的词语都可以无标记联合在一起构成联合式,不同词性的词也可以借助连接词构成联合短语,是汉语句法灵活性表现的一个重要方面。也正因为如此,联合短语结构的识别分析是中文信息处理过程中必须攻克的碉堡。在联合短语内部构成中,词语可以无标记组合形成联合短语,也可以有标记形成更复杂多变的联合式。本文对这两种类型的研究都有涉及,文章依次考虑了N+N,A+A,V+V这三种主要的联合短语。基于语料,本文充分利用现代汉语句法和语义相关知识,并且借助复杂特征集表示手法,提出了这三种联合式联合的条件和规则。全文共分四章来研究这个问题。第一章是文章的绪论,概括出自然语言发展的大概历程;第二章介绍了联合短语的定义和类型。然后介绍现今短语识别的几种主要方法和浅层句法分析的表示方法。第三章是本文的核心部分,作者依次描述了包括有标记和无标记的NN、AA、VV这三种主要的联合短语形式,提出了它们联合时规则和条件。结语部分是对本文的总结,也对未来问题的解决进行了展望和设想。为满足中文信息处理的需要,本文对联合短语的结构识别规则进行了归纳总结,我们先从语言学方面来研究其各种语法形态及其内部构成情况,然后综合句法语义信息给出它们的识别规则集,所以本文是在语言学本体和计算语言学两个领域进行研究的。一方面,希望能给汉语联合短语相关语言学本体知识做一些补充完善,另一方面也是最重要的,就是试图为计算语言学短语识别领域提供些知识材料。
|
全文目录
摘要 4-5 Abstract 5-7 第1章 引言 7-13 1.1 课题的提出 8-9 1.2 自然语言处理的发展 9-11 1.3 本文工作及结构 11-13 1.3.1 本文工作 11-12 1.3.2 本文结构 12-13 第2章 相关语言学本体研究及短语识别方法 13-24 2.1 联合短语的定义、类型及研究现状 13-18 2.1.1 联合短语概念的界定 13 2.1.2 联合短语的类型 13-18 2.2 短语自动识别规则方法 18-22 2.2.1 短语自动识别研究的理论基础 18-19 2.2.2 短语自动识别消歧方法 19-22 2.3 常见浅层句法分析的表示方法 22-24 第3章 联合短语结构识别分析研究 24-36 3.1 “NP”构成的联合短语识别规则 25-28 3.1.1 无标记NN 联合式的区别 25-27 3.1.2 有标记NN 联合式的区别 27-28 3.2 “ADJ”构成的联合短语识别规则 28-31 3.2.1 无标记AA 联合式的区别 28-30 3.2.2 有标记AA 联合式的区别 30-31 3.3 “VP”构成的联合短语识别规则 31-36 3.3.1 无标记 VV 联合式的区别 31-34 3.3.2 有标记VV 联合式的区别 34-36 第4章 结语 36-38 4.1 基本观点及创新之处 36-37 4.2 不足和展望 37-38 参考文献 38-41 致谢 41-42 个人简历 42-43 在学期间发表的学术论文及研究成果 43
|
相似论文
- 基于句法特征的代词消解方法研究,TP391.1
- 词义消歧语料库自动获取方法研究,TP391.1
- 面向统计机器翻译的解码算法的研究,TP391.2
- 汉语框架自动识别中的歧义消解,TP391.1
- 基于博客搜索的博文情感倾向性分析技术的研究,TP391.1
- 学术主页信息抽取系统的研究,TP393.092
- 基于SCOT的语义标签推荐模型及算法研究,TP391.3
- 基于维基百科的命名实体消歧研究,TP391.1
- 语义网自动构建中句法分析的研究,TP391.1
- 基于自然语言打印机人机交互方法研究与实现,TP11
- 基于关联规则和图排序的句子情感倾向性研究,TP391.1
- 基于空间句法分析的城市地价与合理用地结构关系研究,F224;TU984.113
- 基于中文维基百科的语义相关度计算的研究与实现,TP391.1
- 面向专利领域的中文文本分类与检索方法研究,TP391.1
- 基于话题的多文档文摘技术研究,TP391.1
- 基于丰富特征和多核学习的蛋白质关系抽取,Q51
- 基于WEB的社区智能医疗服务系统的研究,TP311.52
- AraOntoLT:基于阿拉伯语文本的本体学习框架,TP391.1
- 自然语言理解中并列名词歧义消解及其在智能仪器设计领域的应用,TP391.1
- 面向自然语言处理的汉语句子语义知识库构建研究,H13
- 筛选规则智能化生成的研究与设计,TP393.08
中图分类: > 语言、文字 > 汉语 > 语法 > 近代、现代语法
© 2012 www.xueweilunwen.com
|