学位论文 > 优秀研究生学位论文题录展示

基于词片网格的语音文档主题分类

作 者: 陈晶
导 师: 张磊
学 校: 哈尔滨工程大学
专 业: 信号与信息处理
关键词: 语音识别 主题分类 网格 混淆网络
分类号: TN912.3
类 型: 硕士论文
年 份: 2010年
下 载: 20次
引 用: 1次
阅 读: 论文下载
 

内容摘要


语音文档主题分类是指根据语音文档的属性或内容,将大量的文档映射到多个预先定义好的主题中,语音分类是语音识别的一个重要研究方向,具有广泛的应用前景,得到人们越来越多的关注。伴随着多媒体时代的到来,汉语言文档分类技术的研究变得必不可少。针对这一现状,本文从构建汉语音文档分类系统出发,利用HTK平台将语音文档识别成one-best单候选和lattice多候选两种结构,并结合传统文本分类思想,将4个类别8700多个语音片段合并为748个语音文档的训练测试集,实现了语音文档的主题分类。该分类系统以单候选one-best分类系统为基线系统,与多候选lattice分类系统相对比。在基线系统中,以传统的文本分类系统为框架。而在多候选分类系统中,用混淆网络对lattice进行结构优化,并且在混淆网络的结构上基于词片进行词汇的提取。该方法采用混淆网络为分类的中间结构,突出了多候选之间的竞争关系,避免了传统方法因寻找识别结果中的最优路径而带来的误差,以保证分类的正确。并且后验概率的引入能够有效地减小了识别误差对分类效果的影响。分类器设计部分采用当前经典的奇异值分解方法,构建了类中心分类器。实验表明,与单侯选分类系统相比,引入混淆网络的多候选分类系统能提供更多的竞争候选,在特征项向量稀疏的情况下,具有更好的分类性能。

全文目录


摘要  5-6
ABSTRACT  6-10
第1章 绪论  10-15
  1.1 论文研究目的和意义  10-12
  1.2 国内外研究和发展现状  12
  1.3 本文的研究内容及章节安排  12-15
    1.3.1 完成的主要工作  12-13
    1.3.2 章节安排  13-15
第2章 语音文档主题分类系统框架  15-28
  2.1 主题分类简介  15-17
  2.2 本文系统框架  17
  2.3 前端处理  17-27
    2.3.1 声学模型  19-21
    2.3.2 语言学模型  21-23
    2.3.3 HTK工具包  23-27
  2.4 本章小结  27-28
第3章 单候选分类系统  28-38
  3.1 分词  28-29
  3.2 向量空间模型  29-34
    3.2.1 向量空间模型定义  30-31
    3.2.2 特征项权重的选择  31-33
    3.2.3 向量相似度  33-34
  3.3 分类器  34-37
    3.3.1 奇异值分解  34-36
    3.3.2 分类器  36-37
  3.4 本章小结  37-38
第4章 多候选分类系统  38-51
  4.1 多候选结构lattice介绍  38-40
  4.2 混淆网络介绍  40-41
  4.3 聚类算法  41-44
  4.4 抽取词汇信息  44-48
    4.4.1 词信息抽取算法描述  45-46
    4.4.2 提取词汇信息程序实现  46-48
  4.5 多候选VSM及分类器  48-50
  4.6 本章小结  50-51
第5章 实验结果与分析  51-57
  5.1 实验的软硬件环境  51
  5.2 性能评价方法  51-52
  5.3 实验结果与分析  52-56
    5.3.1 单候选分类系统实验结果及分析  53
    5.3.2 多候选分类系统实验结果及分析  53-54
    5.3.3 两分类系统对比  54-56
  5.4 本章小结  56-57
结论  57-59
参考文献  59-64
攻读硕士学位期间发表的论文和取得的科研成果  64-65
致谢  65

相似论文

  1. 带有多项式基的径向点插值无网格方法的研究及应用,O241
  2. 多重ANN/HMM混合模型在语音识别中的应用,TN912.34
  3. 基于DSP的机器人语音命令识别系统研制,TN912.34
  4. 联合编码调制技术中TCM与BICM方案性能研究,TN911.22
  5. BioLab面向生物计算服务的网格系统,TP399-C8
  6. 在智能手机环境下健康管理功能设计与研究,TN929.53
  7. 基于混合自适应遗传算法的动态网格调度问题研究,TP393.09
  8. 农业供应链系统网络平台的构建,S126
  9. 劳动保障监察网格化管理研究,F249.27
  10. 遥感数据处理网格平台的设计与初步实现,TP79
  11. 基于AutoCAD的有限元前处理技术研究,O241.82
  12. 基于FDTD的目标与粗糙面的散射计算研究,TN011
  13. 基于域信任的自适应网格工作流调度算法,TP311.52
  14. 矢量有限元素法在随钻电阻率测井模拟中的应用,P631.83
  15. 光子网格中网络资源描述技术研究,TN929.1
  16. 无线通信中物理层网络编码技术的研究,TN92
  17. 制造网格环境下企业群体协同机制研究,F272
  18. 基于CFD方法的起重船水动力系数计算,U674.35
  19. 基于多分辨率聚类的安全定位算法研究,TN929.5
  20. 移动音视频交互业务执行平台的研究,TN915.09
  21. 基于协同学和数字指纹的版权保护与追踪技术研究,TP309

中图分类: > 工业技术 > 无线电电子学、电信技术 > 通信 > 电声技术和语音信号处理 > 语音信号处理
© 2012 www.xueweilunwen.com