学位论文 > 优秀研究生学位论文题录展示
蒙古文同形异音词的读音识别研究
作 者: 张建梅
导 师: 华沙宝
学 校: 内蒙古大学
专 业: 中国少数民族语言文学
关键词: 蒙古文 同形异音词 读音识别
分类号: H212
类 型: 硕士论文
年 份: 2005年
下 载: 81次
引 用: 4次
阅 读: 论文下载
内容摘要
蒙古文同形词有同形同音和同形不同音之别。同形同音词方面,已经有《面向信息处理的蒙古语名—动兼类同形词词类自动识别规则》和《面向信息处理的蒙文同类同音同形词自动识别研究》等研究成果。到目前为止,还没发现面向信息处理的蒙古文同形不同音词的专门研究,在500万词级《现代蒙古语文数据库》中还有大量的未经处理的同形不同音词。所以本文将以同形不同音—即同形异音词作为研究对象。 在蒙古文编码国际标准产生之前,我国境内出现的各种蒙古文编码都没能处理好蒙古文同形字母的问题。内蒙古大学蒙古学学院在建立500万词级《现代蒙古语文数据库》时,曾经采取从方正蒙古文编码文本到ASCII文本的转写措施,为语料库增添了许多内容。当时运行的转写软件,对文本中的同形异音词用“+”号作了简单的标记,以待后续处理。本文针对这些带“+”号的同形异音词,选取其中出现频率较高的(在100词次以上)140个词,根据它们在100万词级《现代蒙古语文数据库》中与其他词语的搭配情况,给出读音识别条件。对122个文件进行计算机处理的结果,自动识别的正确率达到99.01%。 全文由导言、第一章、第二章、第三章和附录组成。 导言部分,概述了蒙古文同形异音词的读音识别研究的意义、方法和步骤、研究基础以及国内外相关领域的研究现状,说明所用语料以及标记等。 第一章,说明本文要处理的同形异音词的来源。论述处理方法、过程、技术难点和重点等。 第二章,对蒙古文同形异音词读音识别条件中的标记和语料做了说明,给出了具体的读音识别条件。 第三章是结语。这里给出了测试试验结果分析,对本题目的学术价值和实用价值做了总结,并提出了进一步改进的思路。 附录部分是有关本研究的一些样例及参考文献。
|
全文目录
导言 6-9 0.1 蒙古文同形异音词读音识别研究的意义 6 0.2 蒙古文同形异音词读音识别的研究方法 6-8 0.3 蒙古文同形异音词读音识别的研究基础 8-9 第1章 问题的来源及其处理方法 9-14 1.1 同形异音词的来源 9-10 1.2 未处理同形异音词在语料库中的分布情况以及处理方法 10-12 1.2.1 在100TUM里仅出现一种读音的同形异音词 10-11 1.2.2 在100TUM里出现两种以上读音的同形异音词 11-12 1.2.3 前面标有“+”号的非同形异音词 12 1.3 识别同形异音词的技术难点 12-14 1.3.1 观察窗口的大小问题 12-13 1.3.2 词类问题 13-14 第2章 蒙古文同形异音词的读音识别条件 14-66 2.1 语料和标记说明 14 2.1.1 M_G语料的基本情况 14 2.1.2 识别条件中用到的标记符号 14 2.2 识别条件的归纳方案 14-15 2.2.1 根据关键词本身的信息 14-15 2.2.2 根据与关键词同现的搭配词信息 15 2.2.3 根据关键词前后出现的标点符号信息 15 2.3 蒙古文同形异音词的读音识别条件 15-66 2.3.1 在100TUM里仅出现一种读音的同形异音词读音识别条件 15-38 2.3.2 在100TUM里出现两种以上读音的同形异音词读音识别条件 38-60 2.3.3 前面标有“+”号的非同形异音词读音识别条件 60-66 第3章 结语 66-68 3.1 人名、地名中的同形异音词 66-67 3.2 统计语料的局限性 67 3.3 语义信息的支持 67-68 参考文献 68-69 附录1:由MTOA转写产生的文本与原文的比较样例 69-71 附录2:同形异音词的读音自动识别结果样例 71-72 后记 72
|
相似论文
- 基于CELTS的蒙古文元数据与内容包编辑工具的设计与实现,TP311.52
- 《甘珠尔》作品题目的比较研究,B948
- 卜和克什克蒙古文转写的《元朝秘史》研究,K28
- 传统蒙古文到新蒙文转换中名词及其格附加成分转换的研究,TP391.1
- 莫日根葛根《金念珠》研究,K28
- 面向信息处理的蒙古语动词语义研究,H212
- 操作系统国际化基础的研究与实践,TP316
- 蒙古族历史题材长篇小说与蒙古人的历史意识,I207.42
- 面向信息处理的蒙古语名词语义研究,H212
- 蒙古文同形词知识库的构建,H212
- 乌兰巴托版蒙古文译本《今古奇观》研究,H212
- 新时期蒙古族作家性别心理研究,I207.42
- 《元史》满蒙翻译研究,H221
- 基于OpenType技术的蒙古文编辑器的设计与实现,TP391.1
- 茂明安旗历史诸问题研究,K247
- 回鹘式蒙古文文献中汉字的蒙文转写特点研究,H212
- 对生态的关怀,I207.9
- 关于新时期蒙古文小说翻译中的文化学问题,H212
- 新时期以来蒙古文报告文学的特征,I207.9
- 基于音节统计语言模型蒙古文词汇分析校正器的设计与实现,TP391.1
中图分类: > 语言、文字 > 中国少数民族语言 > 蒙古语
© 2012 www.xueweilunwen.com
|