`
yangzb
  • 浏览: 3507153 次
  • 性别: Icon_minigender_1
  • 来自: 北京
社区版块
存档分类
最新评论

VoiceXML语音上网

阅读更多

VoiceXML语音上网

朱茜、朱新亚

  有许多交互式语音应用程序可以让用户通过按键式电话与计算机交流。但是,通常呼叫者需要浏览的菜单很长,而且很花时间。同时,让呼叫者一边听电话,一边在蜂窝电话的小型键盘上搜索并且按钮要按得正确,是很困难的事情。因此用户需要IVR用户界面来与计算机交流。

  VoiceXML 2.0是一种标记语言,用来构建语音界面——有语音的 HTML。语音浏览器类似 Web 浏览器,它通过解释VoiceXML 2.0脚本来向用户提供语音信息并接受用户的语音请求。

  万维网联盟(W3C,World Wide Web Consortium)全力推荐使用VoiceXML 2.0,它通常被理解为一种Web标准。该标准添加了语音识别语法格式,用来识别用户可能就提示回答的字词,上一版本没有这一功能。

  为了更好地理解VoiceXML 2.0,可以将VoiceXML和HTML进行类比。采用HTML的Web应用可以分为两部分:浏览器和Web服务器。相应地,VoiceXML涉及的组件也可分为语音浏览器和相当于Web服务器功能的应用服务器。

  由于电话(包括很多蜂窝电话)没有计算功能,无法管理语音浏览器,所以语音浏览器驻留在网络上的语音服务器中。语音服务器可以位于企业数据中心,或者 位于主管供应商处。用户拨叫一台语音服务器,该服务器从一台应用服务器上下载VoiceXML 2.0脚本、语法格式和声音文件。语音浏览器以一种语音信息的形式将VoiceXML 2.0脚本翻译给用户听,语音信息可以是预先录制的语音,或经由一个文本语音合成器产生的文本。然后语音浏览器调用一个自动语音识别(ASR)软件,使用 语法格式来识别出用户响应的语音词汇。

  下面我们来看一个具体的例子:

  系统:“欢迎致电小李。请问您想接通销售部门、会计部门还是维护部门?”

  用户:“维护部门。”

  ASR 将识别用户的语音回复。在上面这个例子中,语法格式只包括三个词:“销售部门”、“会计部门”和“维护部门”。由于ASR的语法格式仅由有限数量的单词组 成,这种语法驱动的ASR比起听写式ASR执行更为精确。听写式ASR则是试图识别用户说出的大多数英语或其他语言的单词。

  开发人员使用VoiceXML 2.0来为多种应用程序和信息(包括有时效性的数据、业务数据和个人信息)提供电话用户界面。有了这些应用程序,用户只需要从任意电话拨入,表明身份并请 求所需的信息,就可以随时随地访问企业数据。客户还可以使用这些系统来访问订单状态;以及目录、交付和账户信息。

  有许多交互式语音应用程序可以让用户通过按键式电话与计算机交流。但是,通常呼叫者需要浏览的菜单很长,而且很花时间。同时,让呼叫者一边听电话,一边在蜂窝电话的小型键盘上搜索并且按钮要按得正确,是很困难的事情。因此用户需要IVR用户界面来与计算机交流。

  VoiceXML 2.0是一种标记语言,用来构建语音界面——有语音的 HTML。语音浏览器类似 Web 浏览器,它通过解释VoiceXML 2.0脚本来向用户提供语音信息并接受用户的语音请求。

  万维网联盟(W3C,World Wide Web Consortium)全力推荐使用VoiceXML 2.0,它通常被理解为一种Web标准。该标准添加了语音识别语法格式,用来识别用户可能就提示回答的字词,上一版本没有这一功能。

  为了更好地理解VoiceXML 2.0,可以将VoiceXML和HTML进行类比。采用HTML的Web应用可以分为两部分:浏览器和Web服务器。相应地,VoiceXML涉及的组件也可分为语音浏览器和相当于Web服务器功能的应用服务器。

  由于电话(包括很多蜂窝电话)没有计算功能,无法管理语音浏览器,所以语音浏览器驻留在网络上的语音服务器中。语音服务器可以位于企业数据中心,或者 位于主管供应商处。用户拨叫一台语音服务器,该服务器从一台应用服务器上下载VoiceXML 2.0脚本、语法格式和声音文件。语音浏览器以一种语音信息的形式将VoiceXML 2.0脚本翻译给用户听,语音信息可以是预先录制的语音,或经由一个文本语音合成器产生的文本。然后语音浏览器调用一个自动语音识别(ASR)软件,使用 语法格式来识别出用户响应的语音词汇。

  下面我们来看一个具体的例子:

  系统:“欢迎致电小李。请问您想接通销售部门、会计部门还是维护部门?”

  用户:“维护部门。”

  ASR 将识别用户的语音回复。在上面这个例子中,语法格式只包括三个词:“销售部门”、“会计部门”和“维护部门”。由于ASR的语法格式仅由有限数量的单词组 成,这种语法驱动的ASR比起听写式ASR执行更为精确。听写式ASR则是试图识别用户说出的大多数英语或其他语言的单词。

  开发人员使用VoiceXML 2.0来为多种应用程序和信息(包括有时效性的数据、业务数据和个人信息)提供电话用户界面。有了这些应用程序,用户只需要从任意电话拨入,表明身份并请 求所需的信息,就可以随时随地访问企业数据。客户还可以使用这些系统来访问订单状态;以及目录、交付和账户信息。


  VoiceXML组件

分享到:
评论

相关推荐

    一个VoiceXML语音浏览器的设计和实现.pdf

    VoiceXML语音浏览器的设计和实现 VoiceXML是一种基于XML的标记语言,用于构建语音交互应用程序,特别是在电话网络和因特网之间的集成。以下是基于VoiceXML的语音平台的设计和实现的知识点: 1. VoiceXML体 系结构...

    语音扩展标记语言VoiceXML接口规范

    《语音扩展标记语言VoiceXML接口规范》 VoiceXML是一种用于构建交互式语音应答系统(IVR)的标记语言,它使得语音应用可以与Web服务相结合,为用户提供语音交互的体验。规范主要涵盖VoiceXML的基本原理、设计目标、...

    计算机-后端-基于VoiceXML的语音web架构研究.pdf

    计算机-后端-基于VoiceXML的语音web架构研究 本文主要研究基于VoiceXML的语音web架构,旨在探讨基于VoiceXML的语音web架构在英语电子学习系统中的应用。下面是本文中涉及的关键知识点: 一、语音Web架构的概念和...

    基于VoiceXML的语音浏览器的研究与实现.pdf

    ### 基于VoiceXML的语音浏览器研究与实现 #### 引言 随着互联网技术的飞速发展,网络用户数量的急剧增长,如何使用户更加便捷地获取互联网上的信息成为了研究的重要方向。为了满足不同用户的需求,特别是对于那些...

    什么是voiceXml以及与WEB应用

    本文简要描述了VoiceXML规范及主要术语,给出了一个基于VoiceXML的语音与数据集成模型。该模型通过VoiceXML解释器和浏览器访问Internet上的VoiceXML文档及数据库,从而实现语音和数据的集成,达到了语音浏览的目标。...

    VoiceXML 教程【最新】

    VoiceXML(语音可扩展标记语言)是一种用于创建交互式语音应答(IVR)系统的标准标记语言,它允许开发者设计电话用户界面,使用户能够通过语音和数字输入与应用程序进行交互。VoiceXML 提供了一个标准化的方法,将...

    VoiceXML语音平台中的语音资源预取算法 (2007年)

    在分析目前主要预取算法优劣的基础上,根据VoiceXML语音平台与基于HTML的www之间的区别,提出了在VoiceXML语音平台中应该预取其引用的语音资源。在采用基于热点预取技术的同时,提出了一种自适应的多用户共享的...

    VoiceXML的开发及其应用

    ### VoiceXML的开发及其应用 #### 一、VoiceXML简介 VoiceXML是一种基于XML的语言,专为构建语音应用程序而设计。...随着语音技术的不断进步和发展,VoiceXML将在未来的语音应用领域发挥更加重要的作用。

    VoiceXML 语言解释器的设计与实现

    VoiceXML(Voice eXtensible Markup Language)是一种基于XML(Extensible Markup Language)的标准化对话标记语言,主要应用于语音交互系统中,使用户能够通过语音命令访问Web服务。VoiceXML标准由IBM、Motorola、...

    Voice Xml规范的XML语音交互(含jdom解析)

    VoiceXML(Voice Extensible Markup Language)是一种用于构建交互式语音响应(IVR)系统的标准标记语言,它允许电话用户通过语音和DTMF(双音多频)输入与计算机系统进行交互。VoiceXML将Web开发的概念引入到语音...

    在 Java Web 开发框架中创建 VoiceXML 页面

    VoiceXML、CCXML、CallXML 是三个常用的语音应用程序标准。VoiceXML 是最常用的标准,CCXML 是 Call Control XML 的缩写,是电话标记方面符合 W3C 规范的最新一员。CallXML 是特定于 Voxeo 的一种平台。 在创建 ...

    VoiceXML开发指南

    VoiceXML(Voice eXtensible Markup Language)是一种用于构建交互式语音应答(IVR)系统的标记语言,它使得电话用户能够通过语音和DTMF(Dual-Tone Multi-Frequency)输入与应用程序进行交互。VoiceXML将Web技术与...

    人工智人-家居设计-基于VoiceXML的语音智能交互平台的研究与实现.pdf

    人工智人-家居设计-基于VoiceXML的语音智能交互平台的研究与实现.pdf

    面向盲人上网的语音推送系统研究

    通过综合运用VoiceXML、网页内容自动解析、分块浏览等方式,结合先进的语音合成与识别技术,非视觉语音浏览器和语音推送平台为视力障碍用户提供了全新的上网体验。未来,随着相关技术的不断进步和完善,这类系统的...

    VoiceXML1.0-开发指南

    - **语音浏览器(Voice Browser)**:解析并执行VoiceXML文档的软件,负责处理用户的语音输入和系统的语音输出。 - **语音识别引擎(ASR)**:将用户的语音转化为文字。 - **文本转语音引擎(TTS)**:将计算机文本...

    VoiceXML开发指南.doc

    VoiceXML(Voice eXtensible Markup Language)是一种用于构建交互式语音应答(IVR,Interactive Voice Response)系统的标记语言,它使得电话用户能够通过语音与计算机系统进行交互。VoiceXML将网页技术与电话通信...

Global site tag (gtag.js) - Google Analytics