学位论文 > 优秀研究生学位论文题录展示
基于文本无关的说话人识别研究
作 者: 刘俊波
导 师: 徐文尚
学 校: 山东科技大学
专 业: 控制理论与控制工程
关键词: 特征提取 说话人识别 矢量量化 LPC倒谱系数
分类号: TN912.34
类 型: 硕士论文
年 份: 2008年
下 载: 11次
引 用: 1次
阅 读: 论文下载
内容摘要
随着社会信息化程度的发展,越来越多的场合需要对人的身份进行可靠地识别,传统的以密码方式进行身份认证的技术日益暴露出很多弊端。为确保信息安全,用人特有的生物特征作为认证手段的技术逐渐发展起来。说话人识别属于生物认证技术的一种,是一项根据语音波形中反映的说话人生理和行为特征的语音参数,自动鉴别说话人身份的技术。说话人识别技术以其独特的方便性、经济性等优势受到世人瞩目,并日益成为人们日常生活和工作中重要且普及的安全验证方式。本文的研究对象是与文本无关的说话人识别系统。首先,详细讨论了说话人识别系统的基本原理,接着介绍了语音信号产生的数学模型、语音信号的数字化及预处理,内容涉及语音信号的加窗、分帧、预加重滤波、端点检测;重点讨论了传统的双门限端点检测算法,并给出了传统双门限端点检测算法的程序。针对传统双门限端点检测算法适应性不强的特点,提出了一种改进的端点检测方法:能频值端点检测算法;重点分析了当前最常用的三种语音特征参数:线形预测系数、线形预测倒谱系数和基于听觉特性Mel频率倒谱系数。并提取了这三种系数。其次,着重讨论了说话人识别常用的方法:基于矢量量化的说话人识别方法。详细讨论了VQ的基本原理、失真测度、最佳码本设计以及介绍了基于FVQ的说话人识别方法,实验结果表明基于FVQ的识别率较基于VQ的识别率要好。再次,编写了以△MFCC+MFCC为参数、基于矢量量化的说话人识别系统的训练和测试程序。对于VQ模型,码本数的选取对识别率有很大的影响,实验证明选取128时最合适。最后对本文的工作进行了总结,同时对未来的研究工作进行了展望。
|
全文目录
摘要 5-6 ABSTRACT 6-12 1 绪论 12-17 1.1 说话人识别的研究历史及现状 12-13 1.2 主要的应用领域 13-15 1.3 说话人识别技术的难点和热点 15-16 1.4 本文论文组织结构 16-17 2 说话人识别技术 17-25 2.1 说话人识别的基本原理 17-18 2.2 说话人识别的分类 18-19 2.3 说话人识别的特征参数 19-20 2.4 说话人识别主要的分类方法 20-23 2.5 特征参数的评价方法 23-25 3 语音信号的分析与初步处理 25-37 3.1 语音信号的产生模型 25-27 3.2 语音信号的预处理 27-37 4 语音特征参数提取 37-45 4.1 线性预测系数 37-41 4.2 LPC倒谱系数 41-43 4.3 基于听觉特性的Mel频率倒谱系数 43-45 5 矢量量化识别方法及其优化 45-58 5.1 概述 45 5.2 矢量量化的工作原理 45-48 5.3 矢量量化的失真测度 48-50 5.4 矢量量化的最佳码本设计 50-53 5.5 矢量量化识别方法的优化 53-58 6 系统实现与实验结果 58-64 6.1 实验软硬件条件 58 6.2 实验语音库 58-59 6.3 应用矢量量化的说话人识别 59-64 7 结论 64-65 参考文献 65-67 致谢 67
|
相似论文
- 基于SVM的高速公路路面浅层病害的自动检测算法研究,U418.6
- 基于重叠变换与矢量量化的图像压缩算法及应用研究,TN919.81
- 空间目标ISAR成像仿真及基于ISAR像的目标识别,TN957.52
- 胆囊炎和肾病综合症脉象信号的特征提取与分类研究,TP391.41
- Q学习在基于内容图像检索技术中的应用,TP391.41
- 直推式支持向量机研究及其在图像检索中的应用,TP391.41
- 中医舌诊中舌形与齿痕的特征提取及分类研究,TP391.41
- 空间交会接近视觉测量方法研究,TP391.41
- 图像实时采集、存储与处理方法研究,TP391.41
- 唇读中的特征提取、选择与融合,TP391.41
- 多币种纸币处理技术的研究与实现,TP391.41
- 基于类Harr特征和最小包含球的纸币识别方法的研究,TP391.41
- 基于图像的路面破损识别,TP391.41
- 移动机器人视觉检测和跟踪研究,TP242.62
- 高光谱与高空间分辨率遥感图像融合算法研究,TP751
- 基于随机森林的植物抗性基因识别方法研究,Q943
- 基于图像处理技术的烟叶病害自动识别研究,S435.72
- 基于视觉的番木瓜外观品质检测技术研究,S667.9
- 羊绒与羊毛纤维鉴别系统的研究,TS101.921
- 红外图像目标识别及跟踪技术研究,TP391.41
- 水下目标特征的压缩与融合技术研究,TN911.7
中图分类: > 工业技术 > 无线电电子学、电信技术 > 通信 > 电声技术和语音信号处理 > 语音信号处理 > 语音识别与设备
© 2012 www.xueweilunwen.com
|