学位论文 > 优秀研究生学位论文题录展示
语种识别中的隐含语义分析
作 者: 金恬
导 师: 戴礼荣;宋彦
学 校: 中国科学技术大学
专 业: 信号与信息处理
关键词: 语种识别 词图 N元文法 支持向量机 关键词选择 隐含语义分析 概率隐含语义分析
分类号: TN912.34
类 型: 硕士论文
年 份: 2010年
下 载: 119次
引 用: 0次
阅 读: 论文下载
内容摘要
语种识别是利用计算机对一定长度的语音材料进行处理,判别其所属语言种类的过程,是语音识别的一个重要研究方向。随着经济全球化的不断深入,语种识别在日常生活、国防军事和公共安全等领域都有着极为广泛的应用前景。一般来说,每一种语言都具有各自相对独立的音素集、韵律、词汇和句法、语法,这些差异为语种识别的实现提供了可能。根据建模思路的不同,主流的语种识别方法可以分为两大类:基于声学模型的方法和基于语言模型的方法。其中,基于语言模型的方法首先使用语音识别技术将语音信号符号化为音素序列,然后利用不同语种中音素的搭配呈现不同的规律进行语种的识别。这种方法的优点是性能稳定,扩展性好,颇受国内外研究人员的推崇。本文即围绕语言模型方法,在基于音素搭配关系的框架下,对语种识别方法进行了较为系统的研究,首先搭建了从音素识别器到语言统计模型的完整系统,然后着眼于降低算法复杂度、提高系统识别性能等方面,挖掘不同语种统计语言模型中的隐含语义结构,并取得了一定的进展。具体的研究工作包括以下几个方面:第一,比较了在音素识别前端相同条件下用不同解码方式对语种识别系统的影响,证明了用词图的输出结构比最优序列能够得到更为丰富的音素识别信息,同时构造了新的核函数,可以极大地提高语种识别的准确率。第二,在音素识别结合支持向量机的语种识别系统中,针对特征矢量高维、稀疏的特点对表征每个语音段的特征矢量采用关键词选择的方法筛选特征,降低计算复杂度,减少特征的冗余度,进一步改善语种识别系统的性能。第三,借鉴信息检索中词袋的思想,分别引入两种隐含语义分析的方法——隐含语义分析方法和概率隐含语义分析方法,选取更加鲁棒和具有代表性的隐含语义特征,缓解了高维和稀疏的问题,降低算法复杂度,提高基于音素识别结合支持向量机方法的语种识别准确率。
|
全文目录
摘要 4-5 ABSTRACT 5-8 第1章 绪论 8-15 1.1 语种识别的定义和研究意义 8 1.2 背景综述 8-10 1.2.1 声学模型方法 9-10 1.2.2 语言模型方法 10 1.3 语料描述 10-14 1.3.1 数据介绍 10-12 1.3.2 评测指标 12-14 1.4 论文结构 14-15 第2章 系统描述 15-22 2.1 基于音素识别的语种识别系统 15-16 2.2 PRLM 语种识别系统 16-18 2.3 PRSVM 语种识别系统 18-20 2.4 实验 20-21 2.5 小结 21-22 第3章 语种识别中的特征选择 22-32 3.1 音素识别的改进 22-25 3.2 基于 SVM 的区分性语言模型 25-26 3.3 关键词选择 26-29 3.3.1 词条区分性法 27-28 3.3.2 交互过滤融合法 28-29 3.4 实验 29-31 3.5 小结 31-32 第4章 语种识别中的隐含语义分析 32-43 4.1 隐含语义分析 33-36 4.1.1 基本概念 33-35 4.1.2 基于隐含语义分析的语种识别方法 35-36 4.2 概率隐含语义分析 36-40 4.2.1 基本概念 36-40 4.2.2 基于概率隐含语义分析的语种识别方法 40 4.3 实验 40-42 4.4 小结 42-43 第5章 总结与展望 43-45 参考文献 45-47 致谢 47-48 在读期间发表的学术论文与取得的研究成果 48
|
相似论文
- 基于SVM的常压塔石脑油干点软测量建模研究,TE622.1
- 基于SVM的高速公路路面浅层病害的自动检测算法研究,U418.6
- 基于PCA-SVM的液体火箭发动机试验台故障诊断算法研究,V433.9
- 空间目标ISAR成像仿真及基于ISAR像的目标识别,TN957.52
- 音乐结构自动分析研究,TN912.3
- 基于三维重建的焊点质量分类方法研究,TP391.41
- 胆囊炎和肾病综合症脉象信号的特征提取与分类研究,TP391.41
- 直推式支持向量机研究及其在图像检索中的应用,TP391.41
- 基于SVM的中医舌色苔色分类方法研究,TP391.41
- 基于图像的路面破损识别,TP391.41
- 基于支持向量机的故障诊断方法研究,TP18
- 过程支持向量机及其在卫星热平衡温度预测中的应用研究,TP183
- 基于监督流形学习算法的固有不规则蛋白质结构预测研究,Q51
- 基于车载3D加速传感器的路况监测研究,TP274
- 高光谱图像技术诊断黄瓜病害方法的研究,S436.421
- 基于机器学习的入侵检测系统研究,TP393.08
- 支持向量机回归在短期电力负荷预测中的应用研究,TM715;F224
- 面向文本分类的改进K近邻的支持向量机算法研究,TP391.1
- 基于AdaBoost算法的人脸识别研究,TP391.41
- 面向肺部CAD的特征提取、选择及分类方法研究,TP391.41
- 城市污水处理厂中A~2O工艺过程的建模研究,X703
中图分类: > 工业技术 > 无线电电子学、电信技术 > 通信 > 电声技术和语音信号处理 > 语音信号处理 > 语音识别与设备
© 2012 www.xueweilunwen.com
|