学位论文 > 优秀研究生学位论文题录展示

说话人识别中不同语音编码影响的补偿方法

作　者: 李雪林
导　师: 韩纪庆
学　校: 哈尔滨工业大学
专　业: 计算机科学与技术
关键词: 说话人辨认文本无关语音编码最大后验概率估计最大似然估计似然比得分补偿
分类号: TN912.34
类　型: 硕士论文
年　份: 2008年
下　载: 59次
引　用: 0次
阅　读: 论文下载

内容摘要

说话人识别技术因其自身独特的方便性、经济性、准确性和可扩展性等优点,在生物特征识别领域中具有广阔的应用前景。尽管在实验室环境下,说话人识别系统已经取得了比较令人满意的效果,但是现实中的各种外界因素使得系统性能明显下降。其中影响性能的主要原因之一是由于各种因素而导致的训练和测试时语音信号编码的不匹配问题。尤其是在进行网络下说话人识别时,所能获得的训练数据是采用某种语音(音频)编码方式下的信号,而在实际使用时,待测语音信号为其他编码方式的信号,这时的说话人识别就面临着训练和测试语音由于编码不同而产生的不匹配问题,这将影响说话人识别的性能。为了提高网络环境下的说话人识别性能,增强系统实用化程度,首先需要解决编码匹配问题,即消除训练语音和测试语音之间的编码不匹配对识别率的影响。本文主要研究有效克服不同语音编码影响的补偿方法,以提高网络环境下的说话人识别性能,主要是在特征域和得分域进行补偿。在编码特征补偿方面,将两种语音识别中的编码补偿方法,最大后验概率MAP(Maximum A Posterior)方法和最大似然估计ML(Maximum Likelihood)方法,应用到说话人识别系统当中。在得分补偿方面,引入信道补偿中的似然比得分补偿方法,进一步提高系统性能。在应用GMM(Gaussian Mixture Model)进行第一次识别的基础上,使用编码得分归一化,再进行二次判决,得到最终识别结果。所采用的基线系统为文本无关的说话人辨认系统。实验结果表明,首先应用MAP方法进行编码补偿,再利用似然比得分补偿进行二次判决,这样得到的开集测试的最好识别率为83.4%。

全文目录

摘要  4-5
Abstract  5-8
第1章绪论  8-14
  1.1 课题背景  8-9
  1.2 国内外研究现状  9-13
    1.2.1 补偿技术  9-11
    1.2.2 顽健特征的提取  11-13
  1.3 本文研究的内容  13-14
第2章基线系统和语料库建立  14-26
  2.1 引言  14-15
  2.2 说话人识别基线系统  15-22
    2.2.1 特征提取  15-16
    2.2.2 有效帧获取  16-18
    2.2.3 高斯混合模型  18-20
    2.2.4 通用背景模型  20-21
    2.2.5 说话人模板建立  21
    2.2.6 识别与判决策略  21-22
  2.3 语料库建立  22-25
  2.4 实验与讨论  25
  2.5 本章小结  25-26
第3章基于MAP 和ML 的编码补偿方法  26-38
  3.1 编码不匹配问题的影响  26-27
  3.2 语音编码检测器  27-28
  3.3 基于MAP 的编码补偿方法  28-31
    3.3.1 MAP 估计准则  28
    3.3.2 基于MAP 的编码补偿方法的原理  28-30
    3.3.3 算法实现  30-31
  3.4 基于ML 的编码补偿方法  31-33
    3.4.1 ML 估计准则  31
    3.4.2 基于ML 的编码补偿方法的原理  31-32
    3.4.3 算法实现  32-33
  3.5 实验与讨论  33-37
    3.5.1 编码检测器  33-34
    3.5.2 编码相关及编码无关模型  34
    3.5.3 比例因子的选取  34
    3.5.4 编码相关模型的实验  34-36
    3.5.5 编码无关模型的实验  36-37
  3.6 本章小结  37-38
第4章似然比得分补偿方法  38-47
  4.1 概述  38-40
    4.1.1 假设检验原理  38-39
    4.1.2 似然比归一化方法  39-40
  4.2 似然比得分补偿  40-43
    4.2.1 归一化参数估计准则  41
    4.2.2 得分补偿方法  41-42
    4.2.3 算法实现  42-43
    4.2.4 综合补偿  43
  4.3 实验与讨论  43-46
    4.3.1 集外说话人实验  43-44
    4.3.2 集外编码实验  44-45
    4.3.3 全开集实验  45-46
  4.4 本章小结  46-47
结论  47-48
参考文献  48-52
攻读学位期间发表的学术论文  52-55
致谢  55

说话人识别中不同语音编码影响的补偿方法

内容摘要

全文目录

相似论文