学位论文 > 优秀研究生学位论文题录展示

说话人识别中不同语音编码影响的补偿方法

作 者: 李雪林
导 师: 韩纪庆
学 校: 哈尔滨工业大学
专 业: 计算机科学与技术
关键词: 说话人辨认 文本无关 语音编码 最大后验概率估计 最大似然估计 似然比得分补偿
分类号: TN912.34
类 型: 硕士论文
年 份: 2008年
下 载: 59次
引 用: 0次
阅 读: 论文下载
 

内容摘要


说话人识别技术因其自身独特的方便性、经济性、准确性和可扩展性等优点,在生物特征识别领域中具有广阔的应用前景。尽管在实验室环境下,说话人识别系统已经取得了比较令人满意的效果,但是现实中的各种外界因素使得系统性能明显下降。其中影响性能的主要原因之一是由于各种因素而导致的训练和测试时语音信号编码的不匹配问题。尤其是在进行网络下说话人识别时,所能获得的训练数据是采用某种语音(音频)编码方式下的信号,而在实际使用时,待测语音信号为其他编码方式的信号,这时的说话人识别就面临着训练和测试语音由于编码不同而产生的不匹配问题,这将影响说话人识别的性能。为了提高网络环境下的说话人识别性能,增强系统实用化程度,首先需要解决编码匹配问题,即消除训练语音和测试语音之间的编码不匹配对识别率的影响。本文主要研究有效克服不同语音编码影响的补偿方法,以提高网络环境下的说话人识别性能,主要是在特征域和得分域进行补偿。在编码特征补偿方面,将两种语音识别中的编码补偿方法,最大后验概率MAP(Maximum A Posterior)方法和最大似然估计ML(Maximum Likelihood)方法,应用到说话人识别系统当中。在得分补偿方面,引入信道补偿中的似然比得分补偿方法,进一步提高系统性能。在应用GMM(Gaussian Mixture Model)进行第一次识别的基础上,使用编码得分归一化,再进行二次判决,得到最终识别结果。所采用的基线系统为文本无关说话人辨认系统。实验结果表明,首先应用MAP方法进行编码补偿,再利用似然比得分补偿进行二次判决,这样得到的开集测试的最好识别率为83.4%。

全文目录


摘要  4-5
Abstract  5-8
第1章 绪论  8-14
  1.1 课题背景  8-9
  1.2 国内外研究现状  9-13
    1.2.1 补偿技术  9-11
    1.2.2 顽健特征的提取  11-13
  1.3 本文研究的内容  13-14
第2章 基线系统和语料库建立  14-26
  2.1 引言  14-15
  2.2 说话人识别基线系统  15-22
    2.2.1 特征提取  15-16
    2.2.2 有效帧获取  16-18
    2.2.3 高斯混合模型  18-20
    2.2.4 通用背景模型  20-21
    2.2.5 说话人模板建立  21
    2.2.6 识别与判决策略  21-22
  2.3 语料库建立  22-25
  2.4 实验与讨论  25
  2.5 本章小结  25-26
第3章 基于MAP 和ML 的编码补偿方法  26-38
  3.1 编码不匹配问题的影响  26-27
  3.2 语音编码检测器  27-28
  3.3 基于MAP 的编码补偿方法  28-31
    3.3.1 MAP 估计准则  28
    3.3.2 基于MAP 的编码补偿方法的原理  28-30
    3.3.3 算法实现  30-31
  3.4 基于ML 的编码补偿方法  31-33
    3.4.1 ML 估计准则  31
    3.4.2 基于ML 的编码补偿方法的原理  31-32
    3.4.3 算法实现  32-33
  3.5 实验与讨论  33-37
    3.5.1 编码检测器  33-34
    3.5.2 编码相关及编码无关模型  34
    3.5.3 比例因子的选取  34
    3.5.4 编码相关模型的实验  34-36
    3.5.5 编码无关模型的实验  36-37
  3.6 本章小结  37-38
第4章 似然比得分补偿方法  38-47
  4.1 概述  38-40
    4.1.1 假设检验原理  38-39
    4.1.2 似然比归一化方法  39-40
  4.2 似然比得分补偿  40-43
    4.2.1 归一化参数估计准则  41
    4.2.2 得分补偿方法  41-42
    4.2.3 算法实现  42-43
    4.2.4 综合补偿  43
  4.3 实验与讨论  43-46
    4.3.1 集外说话人实验  43-44
    4.3.2 集外编码实验  44-45
    4.3.3 全开集实验  45-46
  4.4 本章小结  46-47
结论  47-48
参考文献  48-52
攻读学位期间发表的学术论文  52-55
致谢  55

相似论文

  1. iLBC语音编码技术的研究及DSP的设计与优化,TN912.3
  2. 医学超声图像斑点噪声去除的研究,TP391.41
  3. 甚低速率语音编码器算法研究,TN912.3
  4. 基于MELP的低速率语音编码算法研究,TN912.3
  5. MELPe语音编码关键技术研究,TN912.3
  6. 低信噪比下的语音增强方法研究,TN912.35
  7. 基于ML2724扩频通信系统的研究与应用,TN914.42
  8. 自适应低速率语音编解码研究与实现,TN912.3
  9. 低速率语音编码参数高效量化算法研究,TN912.3
  10. 无线传感器网络目标定位技术研究,TP212.9
  11. OFDM系统载波同步的研究,TN919.3
  12. 保序回归的算法及应用,O212.1
  13. 地震现场信息采集无线传输系统,TP274.2
  14. G.726语音编码的分析研究及在嵌入式AdHoc网络上的实现,TN929.5
  15. 基于DSP的语音编解码系统研究,TN912.3
  16. 基于数字对讲机的MELP声码器算法研究与实现,TN912.3
  17. 水下小型语音通信平台硬件设计及调试,TN912.3
  18. 基于韵律特征的SVM说话人识别,TN912.34
  19. 基于AMR标准的语音编码VLSI设计,TN912.3
  20. 无线传感器网络时间同步中数学方法应用的研究,TN929.5

中图分类: > 工业技术 > 无线电电子学、电信技术 > 通信 > 电声技术和语音信号处理 > 语音信号处理 > 语音识别与设备
© 2012 www.xueweilunwen.com