学位论文 > 优秀研究生学位论文题录展示

基于VoiceXML的Web语音信息服务技术的研究

作 者: 冯根
导 师: 杨青
学 校: 武汉理工大学
专 业: 计算机软件与理论
关键词: Web语音服务 语音技术 语音浏览技术 VoiceXML
分类号: TP391.42
类 型: 硕士论文
年 份: 2007年
下 载: 69次
引 用: 1次
阅 读: 论文下载
 

内容摘要


计算机作为互联网的一种重要信息终端,是目前人们获取网络信息的主要工具。然而,由于传统的上网方式限制了上网人数,互联网的访问模式逐渐从单一访问方式向多种用户终端发展。近年来,由于语音技术的快速发展和语音浏览技术的突破,电话等通信设备已成为互联网的另一种信息终端。VoiceXML(语音扩展标记语言)是一种基于XML(扩展标记语言)的互联网标记语言,它可以用来开发语音应用系统。通过语音应用系统,用户就能通过电话来访问互联网上的信息服务。VoiceXML语言从较高的层次来描述语音应用,有效回避了语音交互中复杂的并发与同步控制问题,将开发者从底层平台相关细节中解放出来。使用VoiceXML,可以像建立基于HTML的Web应用一样轻松建立Web语音应用系统。本文在学习VoiceXML相关技术的基础上,对其语音应用系统框架、应用范围、功能及特性进行了介绍,讨论了Web语音信息服务的关键技术以及基于VoiceXML的语音浏览器的结构和设计原理。以语音为驱动界面,以电子邮件和RSS新闻为导向,完成了语音邮件客户端和语音RSS新闻阅读器的设计方案,并实现语音邮件客户端的原型系统。具体包括:基于VoiceXML的语音应用系统开发模式的研究;基于J2EE框架的分布式多层Web应用系统开发技术和模式的研究;常见邮件协议的分析(SMTP、POP3和IMAP4)、RSS规范的研究和针对RSS的扩展规范VRSS(Voice-RSS,下文将详细描述)进行可行性分析;利用语音应用系统开发模式,在CaféBevocal语音平台上进行语音电子邮件的收发原理实验,最终实现基于VoiceXML语音电子邮件的系统原型;在充分理解RSS新闻阅读器原理的基础上,将RSS技术与语音浏览技术相结合,提出基于VoiceXML的语音RSS新闻阅读器的设计方案。

全文目录


摘要  3-4
Abstract  4-7
第1章 引言  7-11
  1.1 问题的提出、现实意义  7-8
  1.2 与本课题相关的国内外现状分析  8
  1.3 研究目标、内容、途径  8-9
  1.4 主要贡献  9
  1.5 本文结构  9-11
第2章 WEB语音信息服务技术综述  11-26
  2.1 语音技术及应用领域  11-17
    2.1.1 语音技术  11-12
    2.1.2 语音合成技术  12-15
    2.1.3 语音识别技术  15-16
    2.1.4 语音技术的应用领域  16-17
  2.2 WEB语音服务的关键技术  17-20
    2.2.1 CCXML  18-19
    2.2.2 SIP  19
    2.2.3 VOIP  19-20
  2.3 VOICEXML  20-25
    2.3.1 VoiceXML规范的设计目标、优势  20-21
    2.3.2 VoiceXML的发展现状  21-22
    2.3.3 VoiceXML的技术原理  22-25
  2.4 本章小结  25-26
第3章 基于VOICEXML的语音浏览器的基本构造和设计原理  26-35
  3.1 WEB语音应用系统的业务模型  26-27
  3.2 语音网关  27-30
    3.2.1 语音网关结构  27-28
    3.2.2 语音网关规范  28-30
  3.3 语音浏览器的结构  30-31
  3.4 语音浏览器的功能  31-33
  3.5 基于语音浏览技术的语音界面  33-34
  3.6 本章小结  34-35
第4章 基于VOICEXML的语音邮件客户端的设计与实现  35-61
  4.1 电子邮件及相关技术  35-39
    4.1.1 电子邮件和邮件服务器  35-36
    4.1.2 重要的邮件协议  36
    4.1.3 电子邮件的收发原理  36-38
    4.1.4 JavaMail  38-39
  4.2 可行性分析  39-49
    4.2.1 传统邮件客户端的工作原理  39-42
    4.2.2 语音邮件客户端的工作原理  42-43
    4.2.3 语音邮件客户端的开发、部署平台  43-44
    4.2.4 需要解决的关键问题  44-49
  4.3 语音电子邮件客户端的设计与实现  49-60
    4.3.1 总体框架及部署  49-52
    4.3.2 模块设计  52-57
    4.3.3 代码结构设计  57-59
    4.3.4 一个执行过程实例  59-60
  4.4 本章小结  60-61
第5章 基于VOICEXML的语音RSS新闻阅读器的设计  61-77
  5.1 RSS技术  61-65
    5.1.1 RSS的相关概念  62-63
    5.1.2 RSS的技术特点和主要应用  63-64
    5.1.3 RSS技术目前的发展现状  64-65
  5.2 可行性分析  65-69
  5.3 总体框架  69-72
    5.3.1 语音RSS新闻阅读器的物理部署结构  69-70
    5.3.2 语音RSS新闻阅读器的逻辑部署结构  70-72
    5.3.3 "收听"RSS新闻的流程设计  72
  5.4 关于构造VRSS规范的可行性分析  72-76
    5.4.1 语音RSS新闻阅读器的可行性分析  72-73
    5.4.2 VRSS规范的设计目标和意义  73-74
    5.4.3 VRSS和RSS实例  74-76
  5.5 本章小结  76-77
第6章 总结与未来工作  77-79
  6.1 工作总结  77-78
  6.2 下一步工作计划  78-79
参考文献  79-81
致谢  81-82
攻读硕士学位期间发表论文及参加科研情况  82-83
附录 基于VOICEXML的语音邮件客户端的测试说明  83-90

相似论文

  1. VoiceXML 的应用研究,TP312.2
  2. 基于VoiceXML的语音智能交互平台的研究与实现,TP311.52
  3. 基于VoiceXML技术的可视化IVR系统设计和实现,TN912.3
  4. 基于SIP协议的语音浏览器的设计与实现,TN916.2
  5. 基于VoiceXML的语音门户设计和实现,TP311.52
  6. 基于AVR单片机的数字会议系统设计与实现,TP368.12
  7. 海上搜救模拟系统中的语音技术研究,TP391.9
  8. 基于VoiceXML的图书馆语音服务研究,G252
  9. 基于VoiceXML的语音web架构研究,TP393.09
  10. 基于网络终端产品的QoS系统设计,TP393.02
  11. VoiceXML语音浏览器的研究及其程序实现,TP393.092
  12. VoiceXML语音浏览器的实现与整合,TP391.42
  13. 一个动态IP呼叫中心系统部署与开发,TP311.52
  14. 基于Internet的网站语音自动导航系统设计,TP311.52
  15. IP网络语音技术及其应用研究,TP393.01
  16. 用VoiceXML实现语音浏览,TN912.3
  17. UMS中的TTS/ASR技术研究,TP311.52
  18. 嵌入式Wi-Fi技术研究及其在语音通信中的应用,TN925
  19. IP电话分组语音技术分析,TN916.2
  20. 呼叫中心在电子政务公共服务系统中的应用研究,TP319
  21. 可视化呼叫中心的设计,TN99

中图分类: > 工业技术 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机的应用 > 信息处理(信息加工) > 模式识别与装置 > 声音识别及其装置
© 2012 www.xueweilunwen.com