学位论文 > 优秀研究生学位论文题录展示
基于电话语音的少数民族语种识别研究
作 者: 左利波
导 师: 杨鉴
学 校: 云南大学
专 业: 检测技术与自动化装置
关键词: 语种识别 少数民族语 语音检测 GMM-UBM 汉语借词
分类号: TN912.34
类 型: 硕士论文
年 份: 2011年
下 载: 41次
引 用: 0次
阅 读: 论文下载
内容摘要
据有关资料统计,当今世界上共有5651种语言。语种之间的信息互通越来越重要,如何让计算机识别出不同的语种已经成为人们的迫切需求。语种识别(Language Identification, LID),是计算机通过分析处理一段语音片断以判别其属于何种语言的过程,本质上也是属于语音识别的一个分支。它已经广泛的应用于信息检索和军事安全等领域。当前语种识别系统主要有三个方面:音位结构模型系统、声学模型系统以及联合系统。其中声学模型系统由于不需要人工标注语料,而且系统扩展性好,所以得到了广泛的应用。本文研究与文本无关的少数民族语种识别方法,采用高斯混合模型—通用背景模型(Gaussian Mixture Model-Universal Background Mode, GMM-UBM)建立语种识别系统,探索提高识别率的途径。论文的主要工作有:(1)少数民族电话语音数据库的录制,该数据库包含了9个少数民族语和汉语普通话共10个语种,每个语种有50个发音人,男女比例约为1:1,并进行语音数据的整理。(2)构建一个基于GMM-UBM的少数民族语种识别系统,设计并实现语种识别实验:用双门限的方法进行语音检测;提取MFCC和SDC特征参数;训练UBM模型和GMM模型。(3)用6个民族的不同时长的测试语音和汉语借词进行测试。按四种测试语料分别给出各个语种的识别率,对比两种特征的识别率,从语音学的角度分析各语种之间误识别的原因,还分析了汉语借词对少数民族语种识别率的影响。实验结果表明,论文设计的基于GMM-UBM的语种识别系统具有较好的扩展性;双门限的方法进行语音检测,能有效地去除噪音,提取到有用的语音帧;基于SDC特征参数的少数民族语种识别率明显高于基于MFCC特征参数的识别率;6个语种之间存在有规律的误识别;对汉语借词的识别,实验结果表明汉语借词会使少数民族语种识别率明显下降。
|
全文目录
摘要 3-4 Abstract 4-8 第一章 绪论 8-16 1.1 引言 8-9 1.2 语种识别概述 9-13 1.2.1 语种识别的原理 9-10 1.2.2 语种识别研究的历史 10-11 1.2.3 语种识别的主要方法 11-12 1.2.4 语种识别系统评估与数据库 12-13 1.3 论文的研究思路和作者的工作 13-15 1.3.1 研究思路 13-14 1.3.2 作者的工作 14-15 1.4 论文的组织 15-16 第二章 电话语音库的录制 16-23 2.1 引言 16-17 2.2 语音数据库的设计 17-19 2.2.1 发音人 17-18 2.2.2 录音内容 18-19 2.3 录音软件的开发 19-20 2.4 录音和数据整理 20-22 2.5 本章小结 22-23 第三章 基于GMM-UBM的语种识别 23-37 3.1 引言 23-24 3.2 语音信号预处理 24-25 3.3 MFCC特征参数 25-27 3.4 SDC特征参数 27-28 3.5 高斯混合模型 28-32 3.5.1 GMM模型的基本概念 28-30 3.5.2 GMM模型的训练 30-31 3.5.3 基于GMM模型的语种识别 31-32 3.6 GMM-UBM模型 32-36 3.6.1 MAP自适应算法 33-35 3.6.2 对数似然比的计算 35 3.6.3 后端得分处理 35-36 3.7 本章小结 36-37 第四章 实验结果与分析 37-42 4.1 引言 37 4.2 实验数据库 37-38 4.3 实验方案 38 4.4 实验结果与讨论 38-41 4.5 本章小结 41-42 第五章 总结与展望 42-44 5.1 总结 42 5.2 展望 42-44 参考文献 44-47 致谢 47-48 在读研究生期间参加项目和发表论文情况 48
|
相似论文
- 基于电话信道的声纹识别算法研究,TN912.34
- 《十三世纪以前突厥语词源词典》中17个汉语借词考,H211.3
- 基于支持向量机的民族语语种识别研究,TN912.34
- 泰语中的汉语借词研究,H412
- 蒙古国中的汉语借词研究,H212
- 自动语种识别系统设计与实现,TP391.4
- 基于GMM-UBM的快速说话人识别方法,TN912.34
- 语种识别中的隐含语义分析,TN912.34
- 泰语中的汉语借词研究,H412
- 汉语水语语音对比研究,H113
- 《徐霞客游记》云南地名研究,K928.6
- 基于GMM-UBM模型的语种识别,TN912.34
- 基于支持向量机的语种识别,TN912.34
- 基于音素层信息的语种识别,TN912.34
- 关于库伦口语中的汉语借词研究,H212
- 八思巴字蒙古语文献中的汉语借词转写特点研究,H212
- 语种识别中的若干问题研究,TN912.34
- 基于GMM-UBM/SVM的维吾尔语电话信道说话人识别系统的研究,TN912.34
- 哈萨克语中的汉语借词研究,H236
- 关于鄂尔多斯土语的汉语借词,H212
中图分类: > 工业技术 > 无线电电子学、电信技术 > 通信 > 电声技术和语音信号处理 > 语音信号处理 > 语音识别与设备
© 2012 www.xueweilunwen.com
|