学位论文 > 优秀研究生学位论文题录展示

基于独立分量分析和遗传算法的说话人辨认

作 者: 王义元
导 师: 赵黎明
学 校: 吉林大学
专 业: 控制理论与控制工程
关键词: 说话人辨认 小波变换 Teager 能量算子 美尔倒谱 矢量量化 主分量分析 独立分量分析 遗传算法
分类号: TP391.42
类 型: 硕士论文
年 份: 2005年
下 载: 173次
引 用: 4次
阅 读: 论文下载
 

内容摘要


说话人识别是一项根据语音波形中反映说话人生理和行为特征的语音参数,自动识别说话人身份的技术,在金融、证券、社保、公安、军队及其他民用安全认证等行业和部门有着广泛的需求。本文研究的说话人辨认是说话人识别的一个研究方向。说话人辨认系统主要由预处理、特征提取与变换、分类器三部分组成,本文对这三个部分做了充分的研究和深入的探讨。浊音段提取是预处理中一个重要的步骤。本文提出了小波变换结合Teager能量算子的浊音段提取算法,该算法能够准确地提取出语音信号的浊音段,并且具有抗噪声能力。为了提高辨认正确率,以及降低特征空间维数以减小计算量和存储量,采用PCA 方法和ICA 方法进行特征变换,消除特征矢量分量间的相关性。仿真实验结果显示ICA 方法更有效。针对LBG 算法存在的不足,用遗传算法设计码书。实验结果表明,ICA特征变换结合基于遗传算法的码书设计算法,能够大幅度地提高系统的性能。

全文目录


第一章 绪论  8-17
  1.1 身份认证与生物特征识别  8
  1.2 说话人识别综述  8-16
    1.2.1 说话人识别的分类  8-9
    1.2.2 历史与现状  9-10
    1.2.3 应用前景  10-11
    1.2.4 技术原理  11-16
  1.3 论文组织结构  16-17
第二章 语音信号的预处理  17-26
  2.1 引言  17
  2.2 浊音段提取  17-24
    2.2.1 基于小波变换和TEAGER 能量算子的浊音段提取算法  18-21
    2.2.2 仿真实验  21-24
  2.3 预加重  24
  2.4 分帧处理  24-25
  2.5 小结  25-26
第三章 基于矢量量化说话人辨认  26-40
  3.1 引言  26-27
  3.2 矢量量化基本原理  27
  3.3 失真测度  27-30
    3.3.1 欧氏失真——均方误差  28-29
    3.3.2 线性预测失真测度  29-30
  3.4 矢量量化量化器和码书的设计  30-34
    3.4.1 矢量量化器最佳设计的两个条件  30-31
    3.4.2 LBG 算法  31-32
    3.4.3 初始码书的选择  32-34
  3.5 基于矢量量化的说话人辨认仿真实验  34-39
    3.5.1 语音库的建立  34
    3.5.2 特征提取  34-36
    3.5.3 仿真实验  36-39
  3.6 小结  39-40
第四章 特征变换  40-57
  4.1 引言  40
  4.2 主分量分析  40-44
    4.2.1 PCA  40-41
    4.2.2 基于PCA 的特征变换应用于说话人辨认  41-44
  4.3 独立分量分析  44-56
    4.3.1 统计独立  45
    4.3.2 线性独立分量分析的定义  45-46
    4.3.3 确定变换矩阵W 的目标函数  46-50
    4.3.4 ICA 算法  50-53
    4.3.5 基于ICA 的特征变换应用于说话人辨认  53-56
  4.4 小结  56-57
第五章 遗传算法应用于码书设计  57-74
  5.1 引言  57-58
  5.2 遗传算法  58-63
    5.2.1 遗传算法的生物遗传学基础  58-59
    5.2.2 遗传算法的一般结构  59
    5.2.3 遗传算法的特点  59-61
    5.2.4 遗传算法的基本操作  61-63
  5.3 基于遗传算法的码书设计算法  63-67
    5.3.1 编码  63-64
    5.3.2 适应度函数  64
    5.3.3 选择  64
    5.3.4 交叉  64-66
    5.3.5 变异  66
    5.3.6 LBG 调整  66-67
  5.4 基于遗传算法的码书设计算法应用于说话人辨认  67-73
    5.4.1 实验一:使用原特征矢量两种码书设计算法的比较  67-70
    5.4.2 实验二:ICA 特征变换后两种码书设计算法的比较  70-73
  5.5 小结  73-74
第六章 总结与展望  74-76
  6.1 工作总结  74-75
  6.2 讨论与展望  75-76
参考文献  76-80
摘要  80-82
ABSTRACT  82-85
致谢  85-86

相似论文

  1. 天然气脱酸性气体过程中物性研究及数据处理,TE644
  2. 压气机优化平台建立与跨音速压气机气动优化设计,TH45
  3. 基于重叠变换与矢量量化的图像压缩算法及应用研究,TN919.81
  4. 说话人识别中不同语音编码影响的补偿方法,TN912.34
  5. 基于TMS320C6713的SPIHT图像压缩算法研究及实现,TP391.41
  6. 图像的稀疏表示及编码模型研究,TP391.41
  7. 唇读中的特征提取、选择与融合,TP391.41
  8. 基于遗传算法的模糊层次综合评判在高职教学评价中的应用,G712
  9. 部队人员网上训练与考核系统的开发,TP311.52
  10. 基于并行算法的模糊综合评价模型的设计与应用,TP18
  11. 基于神经网络的牡蛎呈味肽制备及呈味特性研究,TS254.4
  12. 基于遗传算法的中短波磁天线的设计及实现,TN820
  13. 基于遗传算法的柑橘图像分割,TP391.41
  14. 基于混合自适应遗传算法的动态网格调度问题研究,TP393.09
  15. 基于遗传—牛顿算法的公交优化调度,TP18
  16. 基于遗传算法优化的BP网络对生物柴油制备工艺的优化,TE667
  17. 羊绒与羊毛纤维鉴别系统的研究,TS101.921
  18. 基于云理论和蜜蜂进化型遗传算法的纹理合成研究,TP391.41
  19. 基于遗传算法和粗糙集的聚类算法研究,TP18
  20. 感觉刺激诱发脑电特征研究,R318.0
  21. 网络传输中的ROI图像编码算法研究,TN919.81

中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机的应用 > 信息处理(信息加工) > 模式识别与装置 > 声音识别及其装置
© 2012 www.xueweilunwen.com