学位论文 > 优秀研究生学位论文题录展示

英语语音重音的自动探测

作 者: 李琳琳
导 师: 张巍
学 校: 中国海洋大学
专 业: 计算机软件与理论
关键词: 一般性语料 最大熵 Praat J48 有监督学习 半监督学习 Co-training
分类号: TN912.33
类 型: 硕士论文
年 份: 2013年
下 载: 15次
引 用: 0次
阅 读: 论文下载
 

内容摘要


语音韵律的生成在参数合成的语音合成中占有很重要的地位,高质量的合成语音往往需要依赖大量的已标注语料为基础。因此,语料库能否进行快速、精准的韵律标注对语音合成具有重要意义。大型语料的标注需要耗费大量的人力物力,而长时间、高强度的人工标注一致性较差,容易出错,也会带来极高的成本,这就对快速构建语料库提出了更高的要求。对语音合成的多样化需求,要求语音库能够适应各种软硬件环境,并且构建在不同口音、不同语气、不同说话风格的语音来源上。若能实现韵律的极小化标注,以极少的标注语料实现韵律的自动标注,就可以大大降低语料库构建的成本,进而降低语音合成的成本。对此,我们在一般性语料的基础上对语音进行文本处理、极小化标注,并利用监督学习和无监督学习进行模型训练,实现韵律的自动标注,本论文的主要研究工作和内容如下:1)根据一般性语料的特点,利用基于GMM的音频分类方法和语者分类软件对原始音频进行分类和切分,去除音乐和杂音得到纯正的语音。在词的级别上对语音进行声学参数的选择和提取,结合预处理过的文本得到大量的未标注特征文件。为了实现有监督和半监督学习的训练,利用韵律标注体系ToBI进行了一定量的手工标注。2)为了获取与韵律特征最相关的声学韵律特征,利用praat软件抽取声学参数,生成韵律相关的声学韵律参数,然后利用机器学习中的几种模型训练学习方法对已标注样本进行模型训练,分别将已标注样本在最大熵、实例学习、adaboost和J48算法环境下进行模型训练,并对几种韵律标注结果进行结果比较和分析。3)半监督学习利用极少量的有标注实例对大量未标注实例进行自动学习,因此,我们利用基于co-training的半监督学习方法构建基音重音的韵律自动标注体系,详细阐述了训练模型的设计和简化;并在此基础上与有监督学习方法的训练结果进行了性能比较。Co-training算法的协同训练方法不需要大量的已标注文件,与有监督学习相比,提高了效率和大量未标注文件的利用率。本文选择的语料库为一般性语料库,没有经过专门的录制和处理,因此对原始语料库的选择进行一定的扩展,并且对语料库的声学处理和文本处理都是最基础的处理,不需要耗费大量的时间和精力。自动标注体系的重点之一在于韵律特征和声学参数选择和提取上,通过完善韵律与声学参数的对应规则来提高重音的自动标注。而Co-training算法的引入,大大降低了人工标注量,以极小化标注实现韵律的自动标注。

全文目录


摘要  7-9
Abstract  9-13
1 引言  13-17
  1.1 课题提出  13
  1.2 研究背景及意义  13-14
  1.3 国内外研究现状  14-15
  1.4 本文研究目的与研究内容  15-16
  1.5 本文的章节安排  16-17
2 基础语料库的构建  17-36
  2.1 语料库  17
  2.2 语料库处理  17-23
    2.2.1 音频分类  18-19
    2.2.2 语者分类  19-21
    2.2.3 软件性能比较  21
    2.2.4 VOA 语料切分  21-23
  2.3 语料库分析  23-29
    2.3.1 ToBI 标注体系  23-25
    2.3.2 HTS 韵律结构体系  25-27
    2.3.3 训练文件的生成  27-29
  2.4 特征分析  29-35
    2.4.1 声学特征选择  29-31
    2.4.2 文本特征分析  31-32
    2.4.3 声学韵律特征  32-35
  2.5 本章小结  35-36
3 基于基音重音自动标注系统的实现  36-48
  3.1 模型训练算法  36-44
    3.1.1 基于最大熵的韵律自动标注  36-38
    3.1.2 基于实例的韵律特征的自动标注学习  38-40
    3.1.3 基于 Adaboost 的韵律特征的分类标注  40-42
    3.1.4 基于 J48 的韵律特征的分类标注  42-44
  3.2 Weka 及其文件处理  44-45
  3.3 基音重音自动分类结果分析  45-47
  3.4 本章小结  47-48
4 基于 co-training 的韵律自动标注  48-58
  4.1 半监督学习  48-52
    4.1.1 半监督学习的概述  48-49
    4.1.2 Co-training 算法的基本设定  49-51
    4.1.3 Co-training 算法的应用  51-52
  4.2 基于 co-training 的训练模型  52-57
    4.2.1 基于 co-training 的训练流程设计  52-53
    4.2.2 基于 co-training 的功能模块设计  53-55
    4.2.3 Co-training 在极小化标注方面的性能分析  55-57
  4.3 本章小结  57-58
5 全文总结与今后工作  58-60
参考文献  60-64
致谢  64-65
个人简历  65
发表论文  65
研究项目  65-66

相似论文

  1. 领域实体属性及事件抽取技术研究,TP391.1
  2. 人物言论抽取与跟踪技术研究,TP391.1
  3. 应用层协议识别和还原方法的研究与实现,TP393.08
  4. 城市轨道交通运营管理系统测试与评价方法研究,TP311.52
  5. 汉语框架自动识别中的歧义消解,TP391.1
  6. 基于半监督模糊聚类的入侵防御技术研究,TP393.08
  7. 李群深层结构学习算法研究,TP181
  8. 基于标记样本和相似度调整的k均值算法在文本聚类中的应用,TP181
  9. 指纹图像分割方法评价与半监督学习在指纹图像分割中的应用研究,TP391.41
  10. 汉语嵌套命名实体识别方法研究,TP391.1
  11. 近海人工凸体保滩促淤的试验研究,P753
  12. 领域知识指导的半监督学习和主动学习倾向性分类研究,TP181
  13. GSM-R网络干扰分析和优化策略研究,TN929.532
  14. 特征选择算法及其在网络流量识别中的应用研究,TP393.06
  15. 基于深度图像学习的人体部位识别,TP391.41
  16. 基于聚类分析的鲁棒自适应切换回归算法研究,TP311.13
  17. 监督主题模型的研究与应用,TP391.1
  18. 长文本辅助短文本的知识迁移聚类方法,TP391.1
  19. 基于半监督哈希算法的图像检索方法研究,TP391.41
  20. 基于半监督学习的时间序列分类研究与实现,TP181
  21. 蛋白质关系网络中的络合物发现算法的研究,Q51-3

中图分类: > 工业技术 > 无线电电子学、电信技术 > 通信 > 电声技术和语音信号处理 > 语音信号处理 > 语音合成
© 2012 www.xueweilunwen.com