学位论文 > 优秀研究生学位论文题录展示
中文口语中的指代消解及省略语句补全
作 者: 胡翔磊
导 师: 黄本雄
学 校: 华中科技大学
专 业: 通信与信息系统
关键词: 人工智能 自然语言处理 机器学习 指代消解
分类号: TP391.1
类 型: 硕士论文
年 份: 2009年
下 载: 5次
引 用: 0次
阅 读: 论文下载
内容摘要
自然语言处理是人工智能技术的一个范畴。指代消解是一个确定自然语言中两个成分是否指代同一个事物的过程。指代消解的对象包括但不限于各种名词,也包括各种名词性短语,如代词等。在过去十年中,指代消解领域发生一个重大转变,从基于规则、手工的系统转向机器学习系统。现有比较主流的指代消解算法大多是基于机器学习的方法,很多是二元分类的框架继承而来。基于二元分类的算法有一个问题,因为它在对每个候选先行词进行二元分类时,相互之间都是独立考虑的,没有整体的看问题,因此摈弃了一些全局信息。而口语中的文本往往不是完整的句子结构,因此全局信息格外重要。本系统提出了实体-表述模型,采用了归纳逻辑编程的算法,来展现目标待决表述、篇章实体以及篇章实体对应表述之间的关系。首先,制定一系列一阶谓词逻辑规则,用这些一阶谓词逻辑规则可以捕获篇章实体对应的每一个独立表述的信息,同时还能捕获篇章实体的整体全局信息来进行指代消解。因此,该模型比传统的表述对模型以及实体-表述模型更能捕获全局的信息。然后,本系统处理了表述之间的指代传递性,简而言之,当一个表述与另外两个表述都满足互指关系时,那么另外两个表述之间满足互指关系的可能性也非常高。利用这项技术,可以将一些没有发现的、潜在的同一个篇章实体不用表述之间互指关系找出来。
|
全文目录
摘要 4-5 Abstract 5-8 1 绪论 8-19 1.1 引言 8 1.2 指代消解以及语句补全的简介 8-10 1.3 国内外研究现状 10-18 1.4 本文主要内容及章节安排 18-19 2 指代消解技术的研究 19-35 2.1 单候选分类器. 19-20 2.2 双候选分类器. 20-21 2.3 指代消解的排列器 21-24 2.4 零代词消解 24-31 2.5 残缺语句的处理 31-33 2.6 篇章主题分割. 33-34 2.7 本章总结 34-35 3 实体-表述模型指代消解 35-44 3.1 实体-表述模型的引入 35-43 3.2 本章总结 43-44 4 指代消解的设计框架 44-55 4.1 系统框架设计方法及步骤 44 4.2 设计过程 44-52 4.3 测试结果比较 52-54 4.4 本章总结 54-55 5 全文总结及展望 55-56 5.1 全文总结 55 5.2 下一步工作展望 55-56 致谢 56-57 参考文献 57-59
|
相似论文
- 词义消歧语料库自动获取方法研究,TP391.1
- 人工智能的哲学思考,TP18
- 基于数据分布特征的文本分类研究,TP391.1
- 基于证据理论和云模型的多属性决策算法研究,C934
- 基于条件随机场的中文分词技术的研究与实现,TP391.1
- 领域知识指导的半监督学习和主动学习倾向性分类研究,TP181
- Android恶意软件静态检测方案的研究,TP309
- 监督主题模型的研究与应用,TP391.1
- 基于失真效应的图像质量评价与分类,TP391.41
- 基于学习的逆向运动学人体运动合成,TP391.41
- 基于内容的网页恶意代码检测的研究与实现,TP393.092
- 学术主页信息抽取系统的研究,TP393.092
- 社会化网络中的推荐算法及其应用,TP391.3
- 数据挖掘在邮件反垃圾系统中的应用,TP393.098
- 基于人工智能的本质安全参致评定设计与实现,X913.4
- 基于自学习的社会关系抽取的研究,TP391.1
- 基于统计与图模型的若干机器学习算法及其应用,TP181
- 基于人工智能优化算法的聚丙烯熔融指数预报建模优化研究,TQ325.14
- P2P流量识别方法研究,TP393.06
- 基于自然语言打印机人机交互方法研究与实现,TP11
- 基于粗糙集和SVM的国防生综合素质测评方法研究,E075
中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机的应用 > 信息处理(信息加工) > 文字信息处理
© 2012 www.xueweilunwen.com
|