学位论文 > 优秀研究生学位论文题录展示
说话人识别中的模式匹配方法研究
作 者: 何金瑞
导 师: 潘世永
学 校: 西华大学
专 业: 计算机软件与理论
关键词: 说话人识别 矢量量化 高斯混合模型 人工神经网络
分类号: TN912.34
类 型: 硕士论文
年 份: 2009年
下 载: 168次
引 用: 3次
阅 读: 论文下载
内容摘要
说话人识别是一项根据语音中反映说话人生理和行为特征的语音参数,自动识别说话人身份的技术,属于生物特征识别技术的一种。近年来,说话人识别技术日趋成熟,由于语音这一媒介自身特殊的优势,正在迅速走向实用化,能广泛的应用于各行各业。本文以LPCC和MFCC特征参数作为识别的主要特征,还实验性地使用了基于小波变换的特征提取参数。运用矢量量化(VQ)、高斯混合模型(GMM)和人工神经网络(ANN)技术实现与文本无关的说话人识别,分别在15人、25人、41人大小的语音库上进行了识别实验。本文的主要工作有:(1)在特征提取部分,详细阐述了特征提取阶段的时域特征和LPCC、MFCC等倒谱特征的提取过程,并用不同于传统的短时傅里叶变换的小波变换进行了特征提取;(2)对各个系统的性能进行了研究。在VQ模型中,研究了码本尺度对系统性能的影响和具体选取问题;在GMM模型中,研究了高斯混合模型的阶数和训练语音的长度对系统性能的影响,并在大量实验的基础了,提出了对不同的训练语音长度给出了推荐的模型阶数;在神经网络中进行了尝试性的实验研究;分析了各系统的优缺点,为以后建立混合识别系统奠定了基础。最后介绍了各个系统的实现和实验,对结果进行了分析和比较,对各种参数的设置均给出了实验验证,对未来的研究工作进行了展望。
|
全文目录
相似论文
- 压气机优化平台建立与跨音速压气机气动优化设计,TH45
- 基于重叠变换与矢量量化的图像压缩算法及应用研究,TN919.81
- 基于遗传算法优化的BP网络对生物柴油制备工艺的优化,TE667
- 兖州矿区植物波谱变异与重金属胁迫特征研究,X173
- 企业安全效益评价及发展对策研究,F272;F224.5
- 酮类化合物的3D-QSPR研究,O641
- 基于特征选择及其融合方法的说话人识别,TN912.34
- 人类抗原肽载体结合力预测,R392.1
- 基于智能计算的网络学习评价模型研究与系统设计,TP18
- 基于小波神经网络模型的短期汇率预测,F224
- 基于改进BP网络的软件项目风险评价研究,TP183
- 基于保局部核多元RVM的说话人识别方法研究,TN912.34
- 基于纹理特征的煤炭发热量研究,TP391.41
- 基于粒子群优化神经网络的电力短期负荷预测研究,TM715
- 面向智能交通的视频车辆检测、跟踪和识别算法研究,TP391.41
- 基于SOPC的说话人识别控制器,TN912.34
- 高质量语音转换系统中关键技术的研究,TN912.3
- 烟煤掺烧印尼煤的动力配煤模型研究,TK227.1
- 考虑光伏发电的短期负荷预测,TM715
- 基于DM642的红外运动目标检测与跟踪技术实现,TP391.41
- 风电场发电功率短期预测模型研究,TM715
中图分类: > 工业技术 > 无线电电子学、电信技术 > 通信 > 电声技术和语音信号处理 > 语音信号处理 > 语音识别与设备
© 2012 www.xueweilunwen.com
|