学位论文 > 优秀研究生学位论文题录展示

英语语音重音的自动探测

作　者: 李琳琳
导　师: 张巍
学　校: 中国海洋大学
专　业: 计算机软件与理论
关键词: 一般性语料最大熵 Praat J48 有监督学习半监督学习 Co-training
分类号: TN912.33
类　型: 硕士论文
年　份: 2013年
下　载: 15次
引　用: 0次
阅　读: 论文下载

内容摘要

语音韵律的生成在参数合成的语音合成中占有很重要的地位，高质量的合成语音往往需要依赖大量的已标注语料为基础。因此，语料库能否进行快速、精准的韵律标注对语音合成具有重要意义。大型语料的标注需要耗费大量的人力物力，而长时间、高强度的人工标注一致性较差，容易出错，也会带来极高的成本，这就对快速构建语料库提出了更高的要求。对语音合成的多样化需求，要求语音库能够适应各种软硬件环境，并且构建在不同口音、不同语气、不同说话风格的语音来源上。若能实现韵律的极小化标注，以极少的标注语料实现韵律的自动标注，就可以大大降低语料库构建的成本，进而降低语音合成的成本。对此，我们在一般性语料的基础上对语音进行文本处理、极小化标注，并利用监督学习和无监督学习进行模型训练，实现韵律的自动标注，本论文的主要研究工作和内容如下：1）根据一般性语料的特点，利用基于GMM的音频分类方法和语者分类软件对原始音频进行分类和切分，去除音乐和杂音得到纯正的语音。在词的级别上对语音进行声学参数的选择和提取，结合预处理过的文本得到大量的未标注特征文件。为了实现有监督和半监督学习的训练，利用韵律标注体系ToBI进行了一定量的手工标注。2）为了获取与韵律特征最相关的声学韵律特征，利用praat软件抽取声学参数，生成韵律相关的声学韵律参数，然后利用机器学习中的几种模型训练学习方法对已标注样本进行模型训练，分别将已标注样本在最大熵、实例学习、adaboost和J48算法环境下进行模型训练，并对几种韵律标注结果进行结果比较和分析。3）半监督学习利用极少量的有标注实例对大量未标注实例进行自动学习，因此，我们利用基于co-training的半监督学习方法构建基音重音的韵律自动标注体系，详细阐述了训练模型的设计和简化；并在此基础上与有监督学习方法的训练结果进行了性能比较。Co-training算法的协同训练方法不需要大量的已标注文件，与有监督学习相比，提高了效率和大量未标注文件的利用率。本文选择的语料库为一般性语料库，没有经过专门的录制和处理，因此对原始语料库的选择进行一定的扩展，并且对语料库的声学处理和文本处理都是最基础的处理，不需要耗费大量的时间和精力。自动标注体系的重点之一在于韵律特征和声学参数选择和提取上，通过完善韵律与声学参数的对应规则来提高重音的自动标注。而Co-training算法的引入，大大降低了人工标注量，以极小化标注实现韵律的自动标注。

全文目录

摘要  7-9
Abstract  9-13
1 引言  13-17
  1.1 课题提出  13
  1.2 研究背景及意义  13-14
  1.3 国内外研究现状  14-15
  1.4 本文研究目的与研究内容  15-16
  1.5 本文的章节安排  16-17
2 基础语料库的构建  17-36
  2.1 语料库  17
  2.2 语料库处理  17-23
    2.2.1 音频分类  18-19
    2.2.2 语者分类  19-21
    2.2.3 软件性能比较  21
    2.2.4 VOA 语料切分  21-23
  2.3 语料库分析  23-29
    2.3.1 ToBI 标注体系  23-25
    2.3.2 HTS 韵律结构体系  25-27
    2.3.3 训练文件的生成  27-29
  2.4 特征分析  29-35
    2.4.1 声学特征选择  29-31
    2.4.2 文本特征分析  31-32
    2.4.3 声学韵律特征  32-35
  2.5 本章小结  35-36
3 基于基音重音自动标注系统的实现  36-48
  3.1 模型训练算法  36-44
    3.1.1 基于最大熵的韵律自动标注  36-38
    3.1.2 基于实例的韵律特征的自动标注学习  38-40
    3.1.3 基于 Adaboost 的韵律特征的分类标注  40-42
    3.1.4 基于 J48 的韵律特征的分类标注  42-44
  3.2 Weka 及其文件处理  44-45
  3.3 基音重音自动分类结果分析  45-47
  3.4 本章小结  47-48
4 基于 co-training 的韵律自动标注  48-58
  4.1 半监督学习  48-52
    4.1.1 半监督学习的概述  48-49
    4.1.2 Co-training 算法的基本设定  49-51
    4.1.3 Co-training 算法的应用  51-52
  4.2 基于 co-training 的训练模型  52-57
    4.2.1 基于 co-training 的训练流程设计  52-53
    4.2.2 基于 co-training 的功能模块设计  53-55
    4.2.3 Co-training 在极小化标注方面的性能分析  55-57
  4.3 本章小结  57-58
5 全文总结与今后工作  58-60
参考文献  60-64
致谢  64-65
个人简历  65
发表论文  65
研究项目  65-66

英语语音重音的自动探测

内容摘要

全文目录

相似论文