学位论文 > 优秀研究生学位论文题录展示

基于朴素贝叶斯模型研究语言特征对情态动词MUST语义影响

作 者: 段建丽
导 师: 于建平
学 校: 燕山大学
专 业: 英语语言文学
关键词: 朴素贝叶斯 语义排歧 情态动词must 语言特征
分类号: H313
类 型: 硕士论文
年 份: 2010年
下 载: 38次
引 用: 0次
阅 读: 论文下载
 

内容摘要


语义排歧研究是自然语言处理领域的热门话题,而情态动词研究是语言学领域里具有相当历史性而且很重要的研究方向。因此,利用自然语言处理的方法研究情态动词的语义是一个跨学科的研究,而且具有重要的意义。本文采用语义排歧方法来探讨情态动词must的语义问题。本文采用语料库定性定量相结合的研究方法和朴素贝叶斯有导语义排歧方法,以Coates(1983)对情态动词的研究成果为基础进一步探讨了如下两个问题:第一,不同语言特征对情态动词must的语义影响如何;第二,哪些语言特征相组合能产生最佳排歧效果。本文的创新点可体现在如下几个方面:第一,实现了朴素贝叶斯方法对情态动词must的语义排歧,使得语义排歧研究突破了目前大多只排歧名词、动词、形容词等语义比较简单的词的局限,从而使语义排歧研究迈进到了情态动词层面;第二,通过间接性的使用互信息(MI)值,使得互信息(MI)值这个重要的语言特征能在朴素贝叶斯排歧方法中发挥作用;第三,语言特征选择过程中条件互信息的使用,使得本文结论更具有科学性。实验结果显示,不同语言特征对情态动词must的语义影响程度也不同,按影响程度由大到小的顺序排列为:情态动词后动词的完成体;情态动词后动词的静动性,施事性;情态动词和其后动词之间的互信息MI;主语人称;情态动词后动词的语态,情态动词的肯定否定,主语的有无生命性。其中,情态动词后动词的静动性和施事性对情态动词must的语义影响程度相当。情态动词后动词的语态,情态动词的肯定否定及主语的有无生命性对情态动词must的语义几乎没有影响。当互信息值MI,情态动词后动词的完成体,动词的静动性,动词的施事性和主语人称相组合用朴素贝叶斯方法排歧时,排歧效果最佳,100个测试语句的排歧正确率达到91%。此外,本文通过实验证实了Harry Zhang和Ludmila I. Kuncheva等人的观点,即条件独立性假设并不是朴素贝叶斯语义排歧方法达到最佳排歧效果的充分必要条件。

全文目录


摘要  5-7
Abstract  7-15
Chapter 1 Introduction  15-20
  1.1 Background of this study  15-17
  1.2 Significance and potential application of the present study  17-18
  1.3 Objectives of the present study  18
  1.4 Creative points of the present study  18
  1.5 Outline of the present study  18-20
Chapter 2 Literature Review  20-33
  2.1 Study of modality  20-23
  2.2 Study of WSD  23-27
  2.3 Study of NB in WSD  27-30
    2.3.1 Application of NB in WSD  27-29
    2.3.2 Explanation of the superb performance of NB  29-30
  2.4 Brief discussion about the previous studies  30-32
  2.5 Summary  32-33
Chapter 3 Research Method and Data Collection  33-37
  3.1 Research method  33-35
  3.2 Data collection  35-37
Chapter 4 WSD by Na?ve Bayesian Model  37-65
  4.1 Theoretical foundations  37-50
    4.1.1 Fundamental knowledge about WSD  37-42
    4.1.2 Theories on modality  42-45
    4.1.3 Coates’views about modal verb Must  45-47
    4.1.4 Na?ve Bayes  47-50
  4.2 Design of NB WSD model  50-54
    4.2.1 Determination of the sense inventory  50
    4.2.2 Determination of the training information source for WSD mode  50-51
    4.2.3 Feature extraction from the context  51-52
    4.2.4 Determination of the WSD method  52-53
    4.2.5 Determination of the WSD algorithm  53-54
    4.2.6 Evaluation  54
  4.3 Experiments by NB WSD model  54-64
    4.3.1 Training of the NB WSD model  54-60
    4.3.2 Testing of the NB WSD model  60-64
  4.4 Summary  64-65
Chapter 5 Result Analysis and Discussion  65-86
  5.1 Result analysis  65-74
    5.1.1 Result analysis of the solution to the first problem  65-72
    5.1.2 Result analysis of the solution to the second problem  72-74
  5.2 Discussion  74-85
    5.2.1 Discussions about the conclusions of 5.1  74-80
    5.2.2 Discussions about the corpuses in this study  80-81
    5.2.3 Discussions about the soundness of the indirect use of MI in this study  81-82
    5.2.4 Discussions about the feature of existential subject  82
    5.2.5 Discussions about the experiments of ranking features and finding the best feature combination  82-83
    5.2.6 Comparison with the results of previous related studies  83-85
  5.3 Summary  85-86
Chapter 6 Conclusion  86-90
  6.1 Main findings of the research  86-87
  6.2 Implications of the present study  87-88
  6.3 Limitations of the present study  88-89
  6.4 Further research suggestions  89-90
References  90-98
Appendix Ⅰ  98-109
Acknowledgements  109-110
作者简介  110

相似论文

  1. 应用语言学英文期刊论文方法部分的体裁分析,H315
  2. 数据挖掘在邮件反垃圾系统中的应用,TP393.098
  3. 语法化理论下英汉情态动词CAN和能的对比研究,H146
  4. 中外环境科学类英文学术论文讨论部分的体裁对比分析,H315
  5. 现代汉语情态动词的极性特征分析,H146.2
  6. 贝叶斯分类算法的研究与应用,TP18
  7. 面向工程监理的多Agent信息智能检索机制研究,TP391.3
  8. 基于朴素贝叶斯分类技术的纳税评估模型研究,F812.42
  9. 新疆当代油画表现语言特征研究,J213
  10. 激变与突围的现代求索,J212
  11. 英文药品说明书中情态动词的认知研究,H314
  12. 基于模糊神经网络构建英语情态动词can的语义推理模型,H313
  13. 英语核心情态动词的历时语义演变研究,H313
  14. 基于朴素贝叶斯的中文文本情感倾向分类研究,TP391.1
  15. 语言学方向英文硕士论文摘要体裁对比分析,H315
  16. 英文劳动合同的批评性话语分析,H315
  17. 中国学生英语口语中情态动词语用研究,H313
  18. 基于支持向量机的英语情态动词Will语义排歧研究,H313
  19. 从语域理论视角探讨大学生流行语,H136
  20. 面向NSSA的异构数据规范化处理与集成,TP393.08

中图分类: > 语言、文字 > 常用外国语 > 英语 > 语义、词汇、词义
© 2012 www.xueweilunwen.com