学位论文 > 优秀研究生学位论文题录展示

基于VoiceXML的语音web架构研究

作 者: 胡俊楠
导 师: 张忠能
学 校: 上海交通大学
专 业: 计算机系统结构
关键词: VoiceXML X+V 多通道交互 语音Web
分类号: TP393.09
类 型: 硕士论文
年 份: 2010年
下 载: 45次
引 用: 0次
阅 读: 论文下载
 

内容摘要


随着互联网和技术的发展,越来越多的信息、服务可以以多种模式提供给用户,互联网资源需要在传统的视觉接口的基础上加入其它模式的接口。东航英语培训系统就是在这一背景下为东方航空公司设计的英语培训系统。它要求通过丰富的客户体验,提高用户学习英语热情和英语对话能力。其主要包括两个培训模块:自学模块和带教模块。本文给出了东航英语培训系统的总体架构,并对其主要技术进行了分析与研究。通过对自学模块和带教模块的讨论与实现,展示了集成了语音功能的页面在网络教学中巨大的应用潜力。自学模块使用X+V架构来实现多通道交互。该模块将语音、视觉交互相结合,引入到英语教学中,设计出新颖而丰富的交互方式——在页面上学员既可以使用键盘鼠标发出指令,也可使用语音指令来与系统进行交互。为了合理应用多通道交互这一新的交互手段,本文基于用户的体验总结了三条针对东航英语培训系统的设计原则,并将其应用到自学模块功能模块的设计中。本文还对自学模块中的多通道交互界面与传统界面的兼容性问题、多种通道的指令输入后的融合问题、语音指令的模糊性问题进行了讨论,在此基础上实现了自学模块,并通过该模块的应用实例显示了多通道交互在自学模块中丰富多彩的交互形式和引人入胜的用户体验。带教模块使用集成了语音通信能力的页面来为用户提供基于场景的英语教学。该模块使用文字、图片以及视频等视觉媒体为用户展示场景,通过使用net meeting的script接口为用户提供对话交流、语音教学的能力。该模块通过向传统web架构中引入COMET服务器和COMET技术来实现无延时的场景同步,并讨论了带教环境中的用户匹配算法和web语音对话,在此基础上实现了带教模块。

全文目录


摘要  5-7
ABSTRACT  7-11
第一章 绪论  11-15
  1.1 研究背景及其意义  11
  1.2 多通道交互研究现状概述  11-12
  1.3 问题的提出及本文研究方向  12-13
    1.3.1 问题提出  12-13
    1.3.2 主要研究内容  13
  1.4 论文组织  13-15
第二章 VOICEXML 及多通道技术  15-23
  2.1 VOICEXML 的产生与发展及其技术背景  15-20
    2.1.1 World-Wide Web 的广泛分布和强大的功能  16
    2.1.2 基于计算机的语音识别技术和文本到语音合成技术的成熟  16-19
    2.1.3 Voice XML 的优点  19-20
  2.2 VOICEXML 与多通道交互  20-21
  2.3 X+V 的其它相关标准  21-22
  2.4 本章小结  22-23
第三章 东航英语培训系统需求分析与技术难点  23-27
  3.1 东航英语培训系统功能分析  23-24
  3.2 技术难点  24-25
    3.2.1 带教模块中的技术难点  24
    3.2.2 自学模块的技术难点  24-25
  3.3 东航英语培训系统架构  25-26
  3.4 本章小结  26-27
第四章 自学模块  27-50
  4.1 自学模块架构  27-29
  4.2 自学模块技术难题  29-33
    4.2.1 多通道交互界面与传统界面的兼容性问题  29-31
    4.2.2 多种输入的融合问题  31-32
    4.2.3 语音指令的模糊性问题  32-33
  4.3 自学模块多通道交互设计原则  33-38
    4.3.1 帮助、提示信息的设计原则  33-35
    4.3.2 直接到达目标的原则  35-36
    4.3.3 训练元素按场景聚集原则  36-38
  4.4 自学模块实现及展示  38-48
    4.4.1 猜词游戏  39-44
    4.4.2 场景对话训练  44-46
    4.4.3 标准用语语音跟读  46-48
  4.5 本章小结  48-50
第五章 带教模块实现  50-63
  5.1 带教模块架构及实现  50-60
    5.1.1 场景同步  50-54
    5.1.2 教员、学员匹配算法  54-58
    5.1.3 匹配算法中的查询优化  58-59
    5.1.4 web 语音对话  59-60
  5.2 实例展示  60-62
  5.3 本章小结  62-63
第六章 总结与展望  63-65
  6.1 本文总结  63-64
  6.2 本文不足之处及改进建议  64-65
参考文献  65-67
攻读硕士学位期间已发表或录用的论文  67-68
致谢  68-70

相似论文

  1. VoiceXML 的应用研究,TP312.2
  2. 基于VoiceXML的语音智能交互平台的研究与实现,TP311.52
  3. 基于VoiceXML技术的可视化IVR系统设计和实现,TN912.3
  4. 基于SIP协议的语音浏览器的设计与实现,TN916.2
  5. 基于VoiceXML的语音门户设计和实现,TP311.52
  6. 基于武汉用户的汽车多通道交互界面研究,U462.2
  7. 学校声讯服务系统的研究与实现,TN929.53
  8. VoiceXML语音浏览器的研究及其程序实现,TP393.092
  9. 用VoiceXML实现语音浏览,TN912.3
  10. 呼叫中心在电子政务公共服务系统中的应用研究,TP319
  11. 基于语音交互的空间信息移动服务技术研究,TN929.5
  12. 基于VoiceXML的Web语音信息服务技术的研究,TP391.42
  13. 面向呼叫中心的IVR流程表达和解释器的设计与实现,TN912.3
  14. 基于VoiceXML的语音增值业务平台及其算法的研究,TP311.52
  15. 基于本体的电话内容文本分类研究,TP391.1
  16. 多通道交互设计方法研究,TP311.52
  17. VoiceXML解析器的研究与实现,TP312.2
  18. 支持多客户端网站系统的研究与实现,TP393.092
  19. 可视化呼叫中心的设计,TN99
  20. 基于Internet的网站语音自动导航系统设计,TP311.52

中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机的应用 > 计算机网络 > 一般性问题 > 计算机网络应用程序
© 2012 www.xueweilunwen.com