学位论文 > 优秀研究生学位论文题录展示
基于词片网格的语音文档主题分类
作 者: 陈晶
导 师: 张磊
学 校: 哈尔滨工程大学
专 业: 信号与信息处理
关键词: 语音识别 主题分类 网格 混淆网络
分类号: TN912.3
类 型: 硕士论文
年 份: 2010年
下 载: 20次
引 用: 1次
阅 读: 论文下载
内容摘要
语音文档主题分类是指根据语音文档的属性或内容,将大量的文档映射到多个预先定义好的主题中,语音分类是语音识别的一个重要研究方向,具有广泛的应用前景,得到人们越来越多的关注。伴随着多媒体时代的到来,汉语言文档分类技术的研究变得必不可少。针对这一现状,本文从构建汉语音文档分类系统出发,利用HTK平台将语音文档识别成one-best单候选和lattice多候选两种结构,并结合传统文本分类思想,将4个类别8700多个语音片段合并为748个语音文档的训练测试集,实现了语音文档的主题分类。该分类系统以单候选one-best分类系统为基线系统,与多候选lattice分类系统相对比。在基线系统中,以传统的文本分类系统为框架。而在多候选分类系统中,用混淆网络对lattice进行结构优化,并且在混淆网络的结构上基于词片进行词汇的提取。该方法采用混淆网络为分类的中间结构,突出了多候选之间的竞争关系,避免了传统方法因寻找识别结果中的最优路径而带来的误差,以保证分类的正确。并且后验概率的引入能够有效地减小了识别误差对分类效果的影响。分类器设计部分采用当前经典的奇异值分解方法,构建了类中心分类器。实验表明,与单侯选分类系统相比,引入混淆网络的多候选分类系统能提供更多的竞争候选,在特征项向量稀疏的情况下,具有更好的分类性能。
|
全文目录
摘要 5-6 ABSTRACT 6-10 第1章 绪论 10-15 1.1 论文研究目的和意义 10-12 1.2 国内外研究和发展现状 12 1.3 本文的研究内容及章节安排 12-15 1.3.1 完成的主要工作 12-13 1.3.2 章节安排 13-15 第2章 语音文档主题分类系统框架 15-28 2.1 主题分类简介 15-17 2.2 本文系统框架 17 2.3 前端处理 17-27 2.3.1 声学模型 19-21 2.3.2 语言学模型 21-23 2.3.3 HTK工具包 23-27 2.4 本章小结 27-28 第3章 单候选分类系统 28-38 3.1 分词 28-29 3.2 向量空间模型 29-34 3.2.1 向量空间模型定义 30-31 3.2.2 特征项权重的选择 31-33 3.2.3 向量相似度 33-34 3.3 分类器 34-37 3.3.1 奇异值分解 34-36 3.3.2 分类器 36-37 3.4 本章小结 37-38 第4章 多候选分类系统 38-51 4.1 多候选结构lattice介绍 38-40 4.2 混淆网络介绍 40-41 4.3 聚类算法 41-44 4.4 抽取词汇信息 44-48 4.4.1 词信息抽取算法描述 45-46 4.4.2 提取词汇信息程序实现 46-48 4.5 多候选VSM及分类器 48-50 4.6 本章小结 50-51 第5章 实验结果与分析 51-57 5.1 实验的软硬件环境 51 5.2 性能评价方法 51-52 5.3 实验结果与分析 52-56 5.3.1 单候选分类系统实验结果及分析 53 5.3.2 多候选分类系统实验结果及分析 53-54 5.3.3 两分类系统对比 54-56 5.4 本章小结 56-57 结论 57-59 参考文献 59-64 攻读硕士学位期间发表的论文和取得的科研成果 64-65 致谢 65
|
相似论文
- 带有多项式基的径向点插值无网格方法的研究及应用,O241
- 多重ANN/HMM混合模型在语音识别中的应用,TN912.34
- 基于DSP的机器人语音命令识别系统研制,TN912.34
- 联合编码调制技术中TCM与BICM方案性能研究,TN911.22
- BioLab面向生物计算服务的网格系统,TP399-C8
- 在智能手机环境下健康管理功能设计与研究,TN929.53
- 基于混合自适应遗传算法的动态网格调度问题研究,TP393.09
- 农业供应链系统网络平台的构建,S126
- 劳动保障监察网格化管理研究,F249.27
- 遥感数据处理网格平台的设计与初步实现,TP79
- 基于AutoCAD的有限元前处理技术研究,O241.82
- 基于FDTD的目标与粗糙面的散射计算研究,TN011
- 基于域信任的自适应网格工作流调度算法,TP311.52
- 矢量有限元素法在随钻电阻率测井模拟中的应用,P631.83
- 光子网格中网络资源描述技术研究,TN929.1
- 无线通信中物理层网络编码技术的研究,TN92
- 制造网格环境下企业群体协同机制研究,F272
- 基于CFD方法的起重船水动力系数计算,U674.35
- 基于多分辨率聚类的安全定位算法研究,TN929.5
- 移动音视频交互业务执行平台的研究,TN915.09
- 基于协同学和数字指纹的版权保护与追踪技术研究,TP309
中图分类: > 工业技术 > 无线电电子学、电信技术 > 通信 > 电声技术和语音信号处理 > 语音信号处理
© 2012 www.xueweilunwen.com
|