学位论文 > 优秀研究生学位论文题录展示

层次短语翻译模型的实现与分析

作 者: 马永亮
导 师: 赵铁军
学 校: 哈尔滨工业大学
专 业: 计算机科学与技术
关键词: 层次短语翻译模型 统计机器翻译 解码器 句法分析 句法
分类号: TP391.2
类 型: 硕士论文
年 份: 2009年
下 载: 79次
引 用: 0次
阅 读: 论文下载
 

内容摘要


统计机器翻译是当今机器翻译的主流方法,这可能由于很多原因,比如准确性,可扩展性,计算效率高,能够快速移植到新的语言对和领域等等。然而,现在的统计机器翻译方法产生的翻译结果经常不满足句法,而且不能很好的处理长距离的调序问题。最近,统计机器翻译研究工作者开始关注有更多语言学信息启发的翻译模型,主要包括同步上下文无关文法模型和树到串的树转录机模型。首先,本文对基于上下文无关文法的层次短语翻译模型进行了较为全面的研究,并实现了层次短语翻译模型的系统。考虑到层次短语翻译模型本身固有的复杂性,我们在实现层次短语翻译模型时使用了高效的算法和数据结构。同时,注意到层次短语翻译模型是基于句法的翻译模型的基础和原型,层次短语翻译系统的设计具有较高的可扩展性。其次,我们对层次短语翻译模型进行了实证分析。考虑了层次短语翻译模型的三个主要方面。第一,我们加入句法完整性对原有的参数估计方法进行扩展,提出了考虑句法信息的有指导的参数估计方法。第二,我们使用简单分类方法和基于模式的分类方法对层次短语规则进行了分类。第三,我们对层次短语抽取规则算法进行了一系列的限制。同时,我们对这些实验结果进行了比较细致的分析。最后,我们对层次短语翻译模型和短语翻译模型,层次短语翻译模型和基于句法的翻译模型进行了对比分析。我们先通过Moses系统和层次短语翻译系统的实验对比分析这两种模型的内在性质,然后比较了树到串的转录机规则和层次短语规则。通过这些比较得出结论,层次短语翻译模型并没有完全发挥同步上下文无关文法的优势,为了进一步提供统计机器翻译的性能可以尝试扩展层次短语翻译模型形式文法扩展为具有语言学意义的文法,同时以更系统的方式在模型中增加更多上下文。

全文目录


摘要  4-5
Abstract  5-10
第1章 绪论  10-20
  1.1 引言  10
  1.2 统计机器翻译  10-19
    1.2.1 形式化描述  11-12
    1.2.2 翻译对等性模型  12-16
      1.2.2.1 有限状态转录机模型  13-15
      1.2.2.2 同步上下文无关文法模型  15-16
    1.2.3 参数化  16-18
    1.2.4 参数估计  18-19
  1.3 论文的研究内容  19
  1.4 论文结构  19-20
第2章 层次短语翻译模型  20-37
  2.1 简介  20-22
  2.2 层次短语模型的同步上下文无关文法  22-23
  2.3 模型  23-25
    2.3.1 定义  23-24
    2.3.2 特征  24-25
  2.4 模型  25-28
    2.4.1 规则抽取  25-27
    2.4.2 其它规则  27-28
    2.4.3 参数估计  28
  2.5 解码器  28-36
    2.5.1 简介  28
    2.5.2 基本解码算法  28-30
    2.5.3 生成N-best 列表  30-32
    2.5.4 加入语言模型的解码算法  32-36
      2.5.4.1 使用语言模型重排序N-best 列表  32
      2.5.4.2 将语言模型集成到文法中  32-34
      2.5.4.3 立方体剪枝  34-36
  2.6 本章小结  36-37
第3章 高效、可扩展层次短语翻译系统解码器的设计与实现  37-53
  3.1 引言  37-38
  3.2 通过句法分析 的学位论文">句法分析进行统计机器翻译  38-43
    3.2.1 Syntax-directed transduction grammar  38-39
    3.2.2 Multitext grammars  39-41
    3.2.3 两种句法分析逻辑  41-43
      3.2.3.1 句法分析与逻辑推理  41
      3.2.3.2 句法分析与有向超图操作  41-43
  3.3 两个经典的句法分析算法  43-50
    3.3.1 CKY 算法  43-46
    3.3.2 Earley 算法  46-50
  3.4 层次短语翻译系统的具体实现  50-52
  3.5 本章小结  52-53
第4章 层次短语翻译模型的实证分析  53-66
  4.1 引言  53
  4.2 层次短语翻译模型中SCFG 文法的参数估计  53-56
    4.2.1 不考虑句法信息的SCFG 文法的参数估计  53-55
    4.2.2 考虑句法信息的SCFG 文法的参数估计  55-56
  4.3 层次短语翻译模型的SCFG 文法的规则分类  56-59
    4.3.1 简单的分类方法  56-57
    4.3.2 基于模式的分类方法  57-59
  4.4 层次短语翻译模型的SCFG 文法的抽取限制  59-61
  4.5 实验结果与分析  61-65
    4.5.1 层次短语规则句法完整性  62
    4.5.2 层次短语规则分类  62-64
    4.5.3 层次短语抽取限制  64-65
  4.6 本章小结  65-66
第5章 层次短语翻译模型的比较分析  66-77
  5.1 层次短语翻译模型与短语翻译模型的比较分析  66-69
    5.1.1 短语翻译模型概要  66-67
    5.1.2 Moses  67-69
  5.2 层次短语翻译模型与基于句法的翻译模型的比较分析  69-72
    5.2.1 基于句法的翻译模型概要  69-70
    5.2.2 Tree transducers  70-72
  5.3 实验结果与分析  72-75
  5.4 本章小结  75-77
结论  77-78
参考文献  78-84
攻读学位期间发表的学术论文  84-86
致谢  86-87

相似论文

  1. 红安方言语法研究,H146
  2. AVS视频解码器在PC平台上的优化及场解码的改善,TN919.81
  3. 基于句法特征的代词消解方法研究,TP391.1
  4. 面向统计机器翻译的解码算法的研究,TP391.2
  5. 中学生汉英句法意识在汉英双语语篇阅读中的作用,G633.41
  6. 英语语音意识,句法意识与工作记忆对英语阅读理解之预测力的动态变化,G633.41
  7. 语气副词研究综述,H146
  8. 汉英插入语对比研究,H314
  9. 基于博客搜索的博文情感倾向性分析技术的研究,TP391.1
  10. HSK《大纲》里的离合词,H146
  11. 嵌入式视频解码器运动补偿过程的数据布局优化,TN919.81
  12. 机器翻译中的高级对齐技术和开发集选择策略研究,TP391.2
  13. 泰国华文文学作品语言变异研究,H195
  14. 汉、韩语肢体词语意义泛化现象比较研究,H55
  15. 语义网自动构建中句法分析的研究,TP391.1
  16. 基于空间句法分析的城市地价与合理用地结构关系研究,F224;TU984.113
  17. 英语关系子句中空介词现象研究,H314.3
  18. 英语v-ing结构从范畴化到非范畴化转变的研究,H314.3
  19. 原型范畴理论下的英语反问句研究,H314.3
  20. 句法象似性及其修辞效果在英语读写中的应用,H319
  21. 中英报刊社论句法特征对比分析,H314.3

中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机的应用 > 信息处理(信息加工) > 翻译机
© 2012 www.xueweilunwen.com