学位论文 > 优秀研究生学位论文题录展示
基于朴素贝叶斯模型研究语言特征对情态动词MUST语义影响
作 者: 段建丽
导 师: 于建平
学 校: 燕山大学
专 业: 英语语言文学
关键词: 朴素贝叶斯 语义排歧 情态动词must 语言特征
分类号: H313
类 型: 硕士论文
年 份: 2010年
下 载: 38次
引 用: 0次
阅 读: 论文下载
内容摘要
语义排歧研究是自然语言处理领域的热门话题,而情态动词研究是语言学领域里具有相当历史性而且很重要的研究方向。因此,利用自然语言处理的方法研究情态动词的语义是一个跨学科的研究,而且具有重要的意义。本文采用语义排歧方法来探讨情态动词must的语义问题。本文采用语料库定性定量相结合的研究方法和朴素贝叶斯有导语义排歧方法,以Coates(1983)对情态动词的研究成果为基础进一步探讨了如下两个问题:第一,不同语言特征对情态动词must的语义影响如何;第二,哪些语言特征相组合能产生最佳排歧效果。本文的创新点可体现在如下几个方面:第一,实现了朴素贝叶斯方法对情态动词must的语义排歧,使得语义排歧研究突破了目前大多只排歧名词、动词、形容词等语义比较简单的词的局限,从而使语义排歧研究迈进到了情态动词层面;第二,通过间接性的使用互信息(MI)值,使得互信息(MI)值这个重要的语言特征能在朴素贝叶斯排歧方法中发挥作用;第三,语言特征选择过程中条件互信息的使用,使得本文结论更具有科学性。实验结果显示,不同语言特征对情态动词must的语义影响程度也不同,按影响程度由大到小的顺序排列为:情态动词后动词的完成体;情态动词后动词的静动性,施事性;情态动词和其后动词之间的互信息MI;主语人称;情态动词后动词的语态,情态动词的肯定否定,主语的有无生命性。其中,情态动词后动词的静动性和施事性对情态动词must的语义影响程度相当。情态动词后动词的语态,情态动词的肯定否定及主语的有无生命性对情态动词must的语义几乎没有影响。当互信息值MI,情态动词后动词的完成体,动词的静动性,动词的施事性和主语人称相组合用朴素贝叶斯方法排歧时,排歧效果最佳,100个测试语句的排歧正确率达到91%。此外,本文通过实验证实了Harry Zhang和Ludmila I. Kuncheva等人的观点,即条件独立性假设并不是朴素贝叶斯语义排歧方法达到最佳排歧效果的充分必要条件。
|
全文目录
摘要 5-7 Abstract 7-15 Chapter 1 Introduction 15-20 1.1 Background of this study 15-17 1.2 Significance and potential application of the present study 17-18 1.3 Objectives of the present study 18 1.4 Creative points of the present study 18 1.5 Outline of the present study 18-20 Chapter 2 Literature Review 20-33 2.1 Study of modality 20-23 2.2 Study of WSD 23-27 2.3 Study of NB in WSD 27-30 2.3.1 Application of NB in WSD 27-29 2.3.2 Explanation of the superb performance of NB 29-30 2.4 Brief discussion about the previous studies 30-32 2.5 Summary 32-33 Chapter 3 Research Method and Data Collection 33-37 3.1 Research method 33-35 3.2 Data collection 35-37 Chapter 4 WSD by Na?ve Bayesian Model 37-65 4.1 Theoretical foundations 37-50 4.1.1 Fundamental knowledge about WSD 37-42 4.1.2 Theories on modality 42-45 4.1.3 Coates’views about modal verb Must 45-47 4.1.4 Na?ve Bayes 47-50 4.2 Design of NB WSD model 50-54 4.2.1 Determination of the sense inventory 50 4.2.2 Determination of the training information source for WSD mode 50-51 4.2.3 Feature extraction from the context 51-52 4.2.4 Determination of the WSD method 52-53 4.2.5 Determination of the WSD algorithm 53-54 4.2.6 Evaluation 54 4.3 Experiments by NB WSD model 54-64 4.3.1 Training of the NB WSD model 54-60 4.3.2 Testing of the NB WSD model 60-64 4.4 Summary 64-65 Chapter 5 Result Analysis and Discussion 65-86 5.1 Result analysis 65-74 5.1.1 Result analysis of the solution to the first problem 65-72 5.1.2 Result analysis of the solution to the second problem 72-74 5.2 Discussion 74-85 5.2.1 Discussions about the conclusions of 5.1 74-80 5.2.2 Discussions about the corpuses in this study 80-81 5.2.3 Discussions about the soundness of the indirect use of MI in this study 81-82 5.2.4 Discussions about the feature of existential subject 82 5.2.5 Discussions about the experiments of ranking features and finding the best feature combination 82-83 5.2.6 Comparison with the results of previous related studies 83-85 5.3 Summary 85-86 Chapter 6 Conclusion 86-90 6.1 Main findings of the research 86-87 6.2 Implications of the present study 87-88 6.3 Limitations of the present study 88-89 6.4 Further research suggestions 89-90 References 90-98 Appendix Ⅰ 98-109 Acknowledgements 109-110 作者简介 110
|
相似论文
- 应用语言学英文期刊论文方法部分的体裁分析,H315
- 数据挖掘在邮件反垃圾系统中的应用,TP393.098
- 语法化理论下英汉情态动词CAN和能的对比研究,H146
- 中外环境科学类英文学术论文讨论部分的体裁对比分析,H315
- 现代汉语情态动词的极性特征分析,H146.2
- 贝叶斯分类算法的研究与应用,TP18
- 面向工程监理的多Agent信息智能检索机制研究,TP391.3
- 基于朴素贝叶斯分类技术的纳税评估模型研究,F812.42
- 新疆当代油画表现语言特征研究,J213
- 激变与突围的现代求索,J212
- 英文药品说明书中情态动词的认知研究,H314
- 基于模糊神经网络构建英语情态动词can的语义推理模型,H313
- 英语核心情态动词的历时语义演变研究,H313
- 基于朴素贝叶斯的中文文本情感倾向分类研究,TP391.1
- 语言学方向英文硕士论文摘要体裁对比分析,H315
- 英文劳动合同的批评性话语分析,H315
- 中国学生英语口语中情态动词语用研究,H313
- 基于支持向量机的英语情态动词Will语义排歧研究,H313
- 从语域理论视角探讨大学生流行语,H136
- 面向NSSA的异构数据规范化处理与集成,TP393.08
中图分类: > 语言、文字 > 常用外国语 > 英语 > 语义、词汇、词义
© 2012 www.xueweilunwen.com
|