CSDN博客

img zhaoyang17

TTS助力CIC

发表于2004/10/20 16:55:00  1175人阅读

TTS助力CIC

2002/07/02

  随着基金管理公司的陆续设立,各家基金管理公司将在基金营销、客户服务、管理绩效、人才等方面展开全方位竞争,中国基金业将步入群雄逐鹿的时代。在这样的背景下,出于能在激烈的竞争中取得优胜,同时开拓更为宽广的业务市场,各个基金管理公司都在相继建立全面的客户服务中心,并从单纯的人工咨询服务向满足客户多方面的信息查询需求进行改善。与此同时,它也应成为公司了解客户、挖掘客户、分析客户及时调整经营策略的重要途径。因此,基金管理公司客户服务中心系统必须具有开放性、先进性、前瞻性和可扩展性的特点。系统必须面向迅速发展和变化中的业务需求,具有成熟和稳定的产品化软件平台,同时具备业务流程自动生成工具,层次分明的结构化设计,能够实现与后台主机及不同数据库服务器的无缝连接,确保与过户代理系统、直销系统、办公系统及未来的客户关系管理系统整体的整合。

  2002年初,北京汇卓科技有限公司与炎黄新星网络科技有限公司共同推出了专用于基金管理公司的客户中心系统平台——Customer Interaction Center(简称CIC)。CIC客户服务中心系统平台将使客户服务中心系统实现自动服务、人工服务、主动服务、Email服务、监控管理知识库管理及客户信息管理等多种业务功能。

  CIC系统是一个面向客户,以人为本,能够为客户提供个性化、综合性服务的呼叫中心系统,成功运作后,可为包括基金管理公司的所有客户提供相关服务。系统为客户提供多媒体自动应答服务和业务代表服务,客户可以在任何时间,任何地点利用身边多种媒介获得基金信息、办理基金交易手续等全方位的客户服务。系统还可以利用主动呼出的功能配合业务推广部门进行主动营销,实施主动的电话回访及预约拜访。由于大部分客户习惯电话查询的方式,因此在这套系统中,语音合成与传送是一个关键环节。作为系统重要集合键之一的TTS(语音合成技术)起到了具有关键意义的语音报读作用。

  TTS技术又称文语转换技术,是实现以自然语言与计算机进行交流的互动手段。它将计算机自己产生的、或外部输入的文字信息转变为可以听得懂的、流利的汉语口语输出的技术,隶属于语音合成。语音合成为通过机械的、电子的方法产生人造语音的技术。

  TTS的基本结构为(1)语言学处理:在文语转换系统中起着重要的作用,主要模拟人对自然语言的理解过程——文本规整、词的切分、语法分析和语义分析,使计算机对输入的文本能完全理解,并给出后两部分所需要的各种发音提示。(2)韵律处理:为合成语音规划出音段特征,如音高、音长和音强等,使合成语音能正确表达语意,听起来更加自然。(3)声学处理:根据前两部分处理结果的要求输出语音,即合成语音。TTS主要功能是读出计算机所需传递出的字、词、句子、文章及标点、数字、运算符和英文字母,语音输出以句子为单位,读出时可随时改变声音的幅度、基频、语速、词间或句间停顿,如此等等能够使得计算机使用者能直接以听觉感知计算机的相关信息。作为智能计算机研究的主导方向和人机语音通信的关键技术之一,语音合成一直受到各国科学界的广泛关注。如今,随着语音合成技术研究的突破,其对计算机发展和社会生活的重要性日益凸现出来。以语音合成技术开发出的计算机应用软件产品,几乎深入到社会的每个行业和每个方面。

  在CIC系统中使用的TTS技术是由炎黄新星和清华大学合作成立的华意语音计算研究中心研究和开发,其中凝结了清华大学二十多年的语音技术研究成果。清华大学计算机系人机语音对话研究组成立于1979年,在国家863、七五、八五、九五国家攻关、国家自然科学基金、军事预研及学校211、985的支持下,曾取得了多项国际领先的研究成果。早期的语音合成技术的研究,往往集中在语音合成算法本身的研究上,其研究的方法和手段,与语音编码有很多相似之处。其声学模型的构筑,也多通过模拟人的口腔的声道特性来产生。其中比较著名的有Klatt的共振峰(Formant)合成系统,后来又产生了基于LPC、LSP和LMA等声学参数的合成系统。这些方法用来建立声学模型的过程为:首先录制声音,这些声音涵盖了人发音过程中所有可能出现的读音;提取出这些声音的声学参数,并整合成一个完整的音库。在发音过程中,首先根据需要发的音,从音库中选择合适的声学参数,然后根据韵律模型中得到的韵律参数,通过合成算法产生语音。进入九十年代以来,波形拼接(PSOLA)的算法,越来越被广泛的应用在语音合成系统中。同时,随着计算机运算速度越来越快和普及,人工智能领域的研究获得了飞速的发展,而人工智能领域的最新研究成果向语音研究中的大量渗透,导致了语音处理技术及语音合成的研究产生了一个突破性的飞跃。炎黄新星与清华大学在汉语语音合成的研究和开发中,也突破性的运用了人工神经网络、决策树、隐马尔可夫模型等方法,这些方法的运用,彻底改变了汉语语音合成研究的研究重点,使汉语语音合成的研究突破早期重点在单纯算法的研究上,而变成一个系统工程的研究。语音合成的整体研究和开发,迈上了一个全新的台阶,并处在了国际最先进的行列。

  目前常见的客户服务系统,其类似公告以及动态基金的报读都以人工方式预先录制完成,后在客户有需求时进行播报。但这种播报方式存在一些显而易见的弊病,最突出的莫过即时性。即时发布的各种公告以及随时变换的动态基金等发布后,如果单纯依靠人工录音,就需要专人随时待岗,以便录制最新的公告和各种变化后的基金信息。而采用TTS技术的CIC系统,通过TTS技术对文本文件进行实时转换,转换时间甚至之短甚至可以以秒计算。也就是说,当基金公司的最新公告公布之后,可能马上有客户对此公告进行查询,在相应拨入程序完成后,TTS可以在几秒钟时间内对这个公告的文本进行技术处理并在同时以语音方式传输到客户端。此外,采用TTS技术播报相关信息,还可以避免诸多人为失误。很简单,在人工操作中,经常会出现误读误报的现象,而且主观因素对录音效果影响也很大,如果录制者录音当时情绪不饱满那么录制出的效果自然也不能令人满意。这些情况都会令客户对公司的整体印象大打折扣。而采用炎黄新星TTS技术后,这些令人头痛的问题自然都迎刃而解。

  汇卓与炎黄新星共同推出的CIC系统具有强大的交互方式和计算机信息平台,其中炎黄新星成熟的TTS技术使整个CIC系统更为完善,在其特有智能语音控制器作用下,文本输出的语音音律流畅,使得听者(长盛用户)在听取公司播报信息时感觉自然润滑、毫无机器语音输出的冷漠与生涩。TTS语音合成技术语音库覆盖国标一、二级汉字,具有英文接口,自动识别中、英文,支持中、英文混读。所有声音采用真人普通话为标准发音,实现了120——150汉字/秒快速语音合成,朗读速度达3-4汉字/秒,使用户可以听到清晰悦耳的音质和连贯流畅的语调。炎黄新星TTS(即SionSonic)所涉及的关键技术包括:适合汉语语音合成的汉语语料库的设计、语料标注及标注工具的研发、基于统计方法汉语文字处理模块的设计、基于神经网络模型和统计模型的韵律模型设计、语音基元选取的算法及其训练算法、语音合成声学处理的算法研制、系统工作框架的实际。SionSonic系统的特性为:采用最先进的数据驱动技术(可训练)、实现信息的即时传送、同时处理多个呼叫请求、应用领域可不断扩展、系统性能稳定可靠、能在不同做作系统平台下运用、用户接口灵活。作为一种应用性极强的技术,SionSonic系统可衍生为不同产品,包括:语音合成开发包SDK V3.0;语音合成系统;语音合成服务器;智能语音控制器;离线合成系统;虚拟话务员;新华音霸等等。

  一套具有世界领先技术的呼叫中心(CALL CENTER)系统能够成为基金公司迎接挑战的一项重要举措。汇卓与炎黄新星共同推出的CIC系统可以使基金公司来改善服务质量和态度,密切与客户的关系,使之最终成为基金公司与客户沟通的一个最重要窗口。

阅读全文
0 0

相关文章推荐

img
取 消
img