学位论文 > 优秀研究生学位论文题录展示

基于电话语音的少数民族语种识别研究

作 者: 左利波
导 师: 杨鉴
学 校: 云南大学
专 业: 检测技术与自动化装置
关键词: 语种识别 少数民族语 语音检测 GMM-UBM 汉语借词
分类号: TN912.34
类 型: 硕士论文
年 份: 2011年
下 载: 41次
引 用: 0次
阅 读: 论文下载
 

内容摘要


据有关资料统计,当今世界上共有5651种语言。语种之间的信息互通越来越重要,如何让计算机识别出不同的语种已经成为人们的迫切需求。语种识别(Language Identification, LID),是计算机通过分析处理一段语音片断以判别其属于何种语言的过程,本质上也是属于语音识别的一个分支。它已经广泛的应用于信息检索和军事安全等领域。当前语种识别系统主要有三个方面:音位结构模型系统、声学模型系统以及联合系统。其中声学模型系统由于不需要人工标注语料,而且系统扩展性好,所以得到了广泛的应用。本文研究与文本无关的少数民族语种识别方法,采用高斯混合模型—通用背景模型(Gaussian Mixture Model-Universal Background Mode, GMM-UBM)建立语种识别系统,探索提高识别率的途径。论文的主要工作有:(1)少数民族电话语音数据库的录制,该数据库包含了9个少数民族语和汉语普通话共10个语种,每个语种有50个发音人,男女比例约为1:1,并进行语音数据的整理。(2)构建一个基于GMM-UBM的少数民族语种识别系统,设计并实现语种识别实验:用双门限的方法进行语音检测;提取MFCC和SDC特征参数;训练UBM模型和GMM模型。(3)用6个民族的不同时长的测试语音和汉语借词进行测试。按四种测试语料分别给出各个语种的识别率,对比两种特征的识别率,从语音学的角度分析各语种之间误识别的原因,还分析了汉语借词对少数民族语种识别率的影响。实验结果表明,论文设计的基于GMM-UBM的语种识别系统具有较好的扩展性;双门限的方法进行语音检测,能有效地去除噪音,提取到有用的语音帧;基于SDC特征参数的少数民族语种识别率明显高于基于MFCC特征参数的识别率;6个语种之间存在有规律的误识别;对汉语借词的识别,实验结果表明汉语借词会使少数民族语种识别率明显下降。

全文目录


摘要  3-4
Abstract  4-8
第一章 绪论  8-16
  1.1 引言  8-9
  1.2 语种识别概述  9-13
    1.2.1 语种识别的原理  9-10
    1.2.2 语种识别研究的历史  10-11
    1.2.3 语种识别的主要方法  11-12
    1.2.4 语种识别系统评估与数据库  12-13
  1.3 论文的研究思路和作者的工作  13-15
    1.3.1 研究思路  13-14
    1.3.2 作者的工作  14-15
  1.4 论文的组织  15-16
第二章 电话语音库的录制  16-23
  2.1 引言  16-17
  2.2 语音数据库的设计  17-19
    2.2.1 发音人  17-18
    2.2.2 录音内容  18-19
  2.3 录音软件的开发  19-20
  2.4 录音和数据整理  20-22
  2.5 本章小结  22-23
第三章 基于GMM-UBM的语种识别  23-37
  3.1 引言  23-24
  3.2 语音信号预处理  24-25
  3.3 MFCC特征参数  25-27
  3.4 SDC特征参数  27-28
  3.5 高斯混合模型  28-32
    3.5.1 GMM模型的基本概念  28-30
    3.5.2 GMM模型的训练  30-31
    3.5.3 基于GMM模型的语种识别  31-32
  3.6 GMM-UBM模型  32-36
    3.6.1 MAP自适应算法  33-35
    3.6.2 对数似然比的计算  35
    3.6.3 后端得分处理  35-36
  3.7 本章小结  36-37
第四章 实验结果与分析  37-42
  4.1 引言  37
  4.2 实验数据库  37-38
  4.3 实验方案  38
  4.4 实验结果与讨论  38-41
  4.5 本章小结  41-42
第五章 总结与展望  42-44
  5.1 总结  42
  5.2 展望  42-44
参考文献  44-47
致谢  47-48
在读研究生期间参加项目和发表论文情况  48

相似论文

  1. 基于电话信道的声纹识别算法研究,TN912.34
  2. 《十三世纪以前突厥语词源词典》中17个汉语借词考,H211.3
  3. 基于支持向量机的民族语语种识别研究,TN912.34
  4. 泰语中的汉语借词研究,H412
  5. 蒙古国中的汉语借词研究,H212
  6. 自动语种识别系统设计与实现,TP391.4
  7. 基于GMM-UBM的快速说话人识别方法,TN912.34
  8. 语种识别中的隐含语义分析,TN912.34
  9. 泰语中的汉语借词研究,H412
  10. 汉语水语语音对比研究,H113
  11. 《徐霞客游记》云南地名研究,K928.6
  12. 基于GMM-UBM模型的语种识别,TN912.34
  13. 基于支持向量机的语种识别,TN912.34
  14. 基于音素层信息的语种识别,TN912.34
  15. 关于库伦口语中的汉语借词研究,H212
  16. 八思巴字蒙古语文献中的汉语借词转写特点研究,H212
  17. 语种识别中的若干问题研究,TN912.34
  18. 基于GMM-UBM/SVM的维吾尔语电话信道说话人识别系统的研究,TN912.34
  19. 哈萨克语中的汉语借词研究,H236
  20. 关于鄂尔多斯土语的汉语借词,H212

中图分类: > 工业技术 > 无线电电子学、电信技术 > 通信 > 电声技术和语音信号处理 > 语音信号处理 > 语音识别与设备
© 2012 www.xueweilunwen.com