CSDN博客

img zhaoyang17

让电话用户与Web对话

发表于2004/10/15 18:59:00  886人阅读

让电话用户与Web对话
- VoiceXML带来Web访问新概念

2004/04/09

  随着互联网技术的迅猛发展,互联网所存储的信息和提供的服务与日俱增,改变了人们的生活及工作方式。然而,互联网长期以来与拥有众多用户的公用电话网脱离,使中国九倍于计算机用户的电话用户不能利用电话享受到互联网提供的丰富多彩的信息和服务。虽然计算机的拥有量在不断的增加,但是在相当长的时间内,计算机用户的数量不会接近电话用户的数量。如何使如此庞大的电话用户群也能访问互联网,是一个摆在相关行业营运商、内容提供商、以及服务商面前的一个挑战和商机。

  VoiceXML语音扩展描述语言的问世,给互联网与公用电话网的融合带来希望,使互联网信息能够以语音的方式流向电话网,使互联网服务能够延伸到电话用户。VoiceXML 1.0 是由AT&T、IBM、Lucent Technologies、以及Motorola通过W3C协会于2000年联合推出的电话语音应用系统标准。该标准彻底改变了传统的CTI(计算机电话集成系统) 的开发模式和应用范围,使公用电话网、语音处理技术、以及互联网有机地结合为一体。VoiceXML 1.0一经推出便立即得到世界发达国家相关行业众多厂商的支持,基于VoiceXML标准的产品不断涌向市场。

  目前人们对HTML已经很熟悉,类似于用于Web网页标记的HTML,VoiceXML是为语音应用制订的语音可扩展标记语言。VoiceXML使公用电话网与互联网的结合体现在三个方面:语音浏览器的使用,互联网和公用电话网的信息共享,以及类似于Web网页开发过程的语音应用系统的开发。

1. 语音浏览器
  Web浏览器(IE和 Netscape) 的出现有力地带动了互联网的发展,给人们的日常生活和工作方式带来新的变革。Web浏览器是通过计算机终端与文本信息进行交流。类似地,VoiceXML语音浏览器是通过电话终端与语音信息进行交流。VoiceXML语音浏览的实现主要是依赖于语音处理技术和类似于Web浏览技术的语音浏览技术。

  有了VoiceXML语音浏览器,电话用户可以用语音输入和传统的按键输入方式通过电话与语音应用系统进行对话交流,语音应用系统用语音的方式与用户对话。在此过程中,语音识别(语音到文字的转换) 和语音合成(文字到语音的转换) 等语音处理技术起着重要的作用。语音处理技术的兴起和发展已有相当长的一段时间。然而,语音识别与语音合成技术真正开始走向实际应用还是在最近两年到三年的时间。语音技术是使电话用户能够用自然语言的方式与Web对话的关键技术之一。

  语音识别功能使得应用系统能够识别电话用户的语音输入、将之转换成文本以便计算机处理。近年来,语音识别技术有长足的发展,最好的语音识别系统能够在一定范围内达到自然语言的识别。虽然由于技术的局限和中国多方言多口音的特征,使得语音识别系统的应用受到一定的限制,但是语音识别技术仍然在不断地走进人们的日常生活,人们也在开始接受用语音的方式与电话语音系统进行交流。

  语音合成技术相对于语音识别技术来说在实际应用中显得更成熟。目前,较好语音合成系统已经可以达到比较好的可懂度和自然度。语音合成技术是使互联网信息流向公用电话网的关键。例如,在语音门户站中所提供的文本信息,如及时新闻等,可以利用语音合成技术将其转换成语音格式并通过电话播放给用户。摆脱了电话用户只能收听到预先录制好的录音的传统使用方式。

  除了语音处理技术之外,VoiceXML语音浏览技术也是电话语音应用系统的关键。与HTML类似,VoiceXML使得电话语音应用系统根据对话流所处的状态和具体应用领域的业务需求将对话流程转向下一个互联网上的URI链接定义的对话流程。在对话流程的定义中,不仅可以访问互联网上的URI文件,而且还可以访问互联网和局域网内的数据库。Web浏览技术的引进使电话语音应用系统与互联网有机地结合,使电话语音应用系统以开放式的方式呈现给电话用户。

  VoiceXML语音浏览器利用互联网浏览技术将语音处理技术和互联网技术整合为一体,极大地扩展了电话语音系统的应用范围,同时也使互联网的信息和服务走向电话用户群,从而使互联网赢得更多的用户。

2. 互联网与公用电话网信息共享
  互联网与公用电话网长期以来出于分离状态。随着互联网的飞速发展和互联网信息的迅速增加,让庞大的电话用户群(包括固定电话用户和移动电话用户) 访问互联网信息和享用互联网提供的服务显得越来越重要。VoiceXML标准的问世,无疑对互联网服务商、运营商、以及内容提供商等是一个极好的商机。

  VoiceXML浏览技术是开放式的,VoiceXML浏览器可以浏览互联网上的任何公开的文件和数据,这使得电话用户可以借助于语音处理技术通过电话访问互联网信息。例如,电话用户可以通过VoiceXML浏览器收听网上新闻、查询网上数据库、下载和收听语音文件(如音乐、歌曲、留言、语音邮件等) 。因而,VoiceXML浏览技术的使用,使得互联网的信息能够自然地流向公用电话网。

  VoiceXML浏览技术不仅使电话用户能够访问互联网,也可以将公用电话网信息传给互联网。公用电话网信息与互联网信息不同之处在于前者是动态的、以语音形式为主、随着电话对话流的结束而消失。然而,在有些电话语音应用系统中,需要将对话流所产生的信息保存起来,以便将来通过Web浏览器进行访问。例如,用户的语音留言和对话过程等都可以通过电子邮件或文件传输的形式传到互联网。当这些信息被存放在互联网中后,互联网用户和电话用户都可以分别通过Web浏览器和VoiceXML浏览器访问这些信息。

  VoiceXML浏览技术的引入,使互联网和公用电话网得以有机地结合,使两网信息可以互相流动,从而使互联网与公用电话网达到信息共享。

3. "语音网页"的开发
  VoiceXML标准的出现,不仅改变了语音应用系统的使用方法和使用范围,而且给语音应用系统开发过程带来全新的概念和模式,使语音应用系统的开发实际上是"语音网页"的开发。传统的电话语音系统开发是利用CTI(计算机电话集成)技术将各系统构件,如语音卡或交换机,组织和集成起来。开发人员往往需要熟悉有关的底层编码以及深入了解有关硬件的编程接口,才能建立一个电话语音系统。然而,VoiceXML浏览器的使用,可以使电话应用系统开发人员从繁琐的编程细节中解脱出来。

  语音网页的开发不需要了解各系统组成构件,如语音识别、语音合成、和语音卡/交换机等的编程接口。类似于Web网页的开发,语音网页的开发人员只需要编写VoiceXML脚本,从而使开发人员能够把精力放在应用系统的业务流程上。

  语音网页的开发过程简单、快捷。开发人员不需要掌握C/C++或Java等高级计算机编程语言便可以开发一个完整的电话语音应用系统。并且所开发出来的系统往往比传统开发方式开发出来的系统更开放、功能更强大。

  语音网页的开发对开发人员的技术要求较低、开发周期大幅度缩短,从而使开发成本大大降低。所开发出来的应用系统具有很高的可维护性、可移植性、可扩展性、以及可重用性。

  下面是一个VoiceXML简单例子。当用户与电话语音系统接通以后,将会听到语音合成的提示"用户您好!请选择我们为您提供的服务:" 。当用户说"股票市场" ,语音浏览器(通过语音识别功能识别用户输入)将把对话流转向另一个VoiceXML脚本文件stocks.vxml。stocks.vxml脚本文件是一个向用户提供股票市场相关服务的语音网页。

  显而易见,基于VoiceXML电话语音应用系统的开发,抛弃了传统的CTI开发模式,使其开发过程与Web网页的开发过程相似。VoiceXML电话语音应用系统的开发过程是语音网页的开发过程。

  VoiceXML的出现,使互联网和公用电话网有机地融为一体,从而使得电话用户能够通过电话与网页交流,使公用电话网与互联网信息共享,使语音网页的新概念取代传统的文字浏览的网站,使公用电话网成为互联网的延伸,为互联网内容商、运营商以及服务商提供了难得的商机。目前,VoiceXML在发达国家刚兴起不久,并迅速地得到相关行业的支持和认同。中国在开发VoiceXML相关产品方面也是处于刚刚起步的阶段,深圳市华琛科技有限公司率先在国内推出了VoiceXML语音网关VGateWAY可以全面应用于各类虚拟或自建网站,并同时支持ASP,PHP,CGI,JAVASCRIP等脚本语言。如同编写HTML语言一样的简单方便,它将引导普通网站技术革新,揭开语音网站新篇章!

华琛科技公司供稿 CTI论坛编辑

阅读全文
0 0

相关文章推荐

img
取 消
img