学位论文 > 优秀研究生学位论文题录展示
英文译文质量自动评测技术的研究
作 者: 胡永华
导 师: 蔡东风;杨者青
学 校: 沈阳航空工业学院
专 业: 计算机应用技术
关键词: 机器翻译 计算机辅助翻译 主谓一致 动词格式 译文质量评测
分类号: TP391.2
类 型: 硕士论文
年 份: 2010年
下 载: 58次
引 用: 0次
阅 读: 论文下载
内容摘要
语言本身的灵活性和复杂性使得对机器翻译的译文进行质量评价变得非常困难。早期的译文质量评价方法主要采用人工评测,这种方法得到的评价结果通常具有较高的准确性,但同时却会造成巨大的经济消耗和时间消耗,评测结果也会随着评价人的变化和时间的推移而不同,这便使得评价结果缺乏客观性,而且不可复用。由此,对译文质量的自动评测技术应运而生。目前的机器翻译自动评测方法主要是通过计算候选译文和参考译文的相似度来实现不同系统性能之间的对比,但是对于参考译文的依赖性决定了这种方法在应用上的局限性,即不能够应用到商业中实现其价值转化。本文在基于无参考译文的译文质量自动评测方面做了相关的研究。本文研究内容主要涵盖以下三个方面:提出了一种基于依存分析的英文主谓一致性评测方法,该方法在依存分析的基础上,通过添加短语句法分析和句子简化操作对英文句子的主语和谓语进行识别,并根据主谓对应的词性信息对其进行一致性判断。描述了一种基于CRF和错误驱动相结合的动词格式错用检查方法,其中包括基于词干化的CRF二次词性标注方法,通过训练CRF词性标注器来对词干化后的动词进行词性标注;对于标注的结果,本文采用了基于错误驱动的方法对标注错误的动词词性进行了纠正。实现了一个基于无参考译文的英文译文质量自动评测系统,本系统是对实验室现有研究成果的改进,通过对SVM特征向量的修改和补充,使评测系统的性能有了显著提高。综上,本文研究成果可以投入到计算机辅助翻译和机器翻译译文质量的评测中,并能够有效发现译文中存在的错误。另外,由于是在无参考译文的条件下对译文质量进行评测,本文方法具有很好的应用前景。
|
全文目录
摘要 6-7 ABSTRACT 7-12 第1章 绪论 12-19 1.1 研究背景 12-13 1.2 研究意义 13-14 1.3 翻译评测的发展历程和研究现状 14-17 1.4 本文工作 17-19 第2章 译文质量评测及其方法介绍 19-27 2.1 翻译评测 19-20 2.2 评测方法简介 20-26 2.2.1 自动评测方法 20-25 2.2.2 人工评测方法 25-26 2.3 本章小结 26-27 第3章 基于依存分析的英文主谓一致性评测 27-39 3.1 问题的提出 27-28 3.2 相关研究工作 28 3.3 基于依存分析的英文主谓一致性判断 28-33 3.3.1 问题描述 28-31 3.3.2 依存分析 31-32 3.3.3 句子简化(Sentence Simplification) 32-33 3.4 实验方案 33-37 3.4.1 测试语料 33-34 3.4.2 评价方法 34-35 3.4.3 实验设置 35-37 3.5 实验结果和分析 37-38 3.6 本章小结 38-39 第4章 基于CRF 和错误驱动相结合的动词格式错用检查 39-51 4.1 问题的提出 39-40 4.2 机器学习模型相关介绍 40-42 4.3 基于CRF 和错误驱动相结合的动词格式错用检查 42-46 4.3.1 词性标注过程中动词词性与其上下文词性之间的关系分析 42 4.3.2 基于词干化的二次词性标注方法 42-43 4.3.3 CRF 特征选择 43-44 4.3.4 CRF 特征模板设置 44-45 4.3.5 基于错误驱动的词性标注后处理 45-46 4.4 BASELINE 系统 46 4.5 实验方案 46-50 4.5.1 实验语料 46 4.5.2 评价指标 46-47 4.5.3 实验设置 47-49 4.5.4 实验结果及分析 49-50 4.6 本章小节 50-51 第5章 英文译文质量自动评测系统 51-60 5.1 系统框架 51-52 5.2 系统方法描述 52-55 5.2.1 基于SVM 的无参考译文的英文译文质量自动评测 52 5.2.2 支持向量机 52-53 5.2.3 SVM 特征选择 53-55 5.3 系统评价 55-57 5.3.1 语料 55-56 5.3.2 评价方法 56 5.3.3 系统结果及分析 56-57 5.4 系统实现及使用 57-59 5.5 本章小节 59-60 结论 60-63 本文工作总结 60 本文下一步工作 60-61 对译文质量自动评测的展望和思考 61-63 参考文献 63-66 致谢 66-68 攻读硕士期间发表(含录用)的学术论文及科研成果 68
|
相似论文
- 统计机器翻译中结构转换技术的研究,TP391.2
- 面向统计机器翻译的解码算法的研究,TP391.2
- 标记理论在主谓一致研究中的应用,H319
- 基于条件随机场的汉语短语识别研究,TP391.1
- 英汉存在句的认知语言学对比研究,H146
- 基于混淆网络的机器翻译系统融合研究,TP391.2
- 基于英汉树库的机器翻译研究,H315.9
- 主谓一致习得的中介语实证研究,H09
- 基于翻译记忆的Web辅助翻译系统研究与设计,TP391.2
- 在线翻译系统设计及任务收发和译后处理的实现,TP391.2
- 计算机信息技术条件下的翻译教学,H319
- 汉英翻译中译文质量自动评测技术研究,TP391.2
- 不同强化方式在大学英语语言形式教学中的作用,H319
- 英汉机器翻译系统中术语自动翻译技术的研究,TP391.2
- 高中生英语主谓一致错误分析,G633.41
- 重铸对学习者二语产出的影响,H319
- A Study of Machine Translation and Translation Memory in Present-day Sci-tech Translation,H085
- 工艺语句汉英计算机辅助翻译系统关键技术研究,TP391.2
- 论翻译权,D923.41
- 《飘》的人机翻译对比分析,H315.9
中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机的应用 > 信息处理(信息加工) > 翻译机
© 2012 www.xueweilunwen.com
|