首页>>厂商>>语音识别与合成>>航天华迪

语音电话薄

2005/04/18

1. 前言

  随着国内电信行业改革的不断深化,电信市场的竞争越来越激烈。特别是我国WTO进程的推进使我国的电信市场的竞争格局越来越国际化。怎么样在激烈的竞争中脱颖而出,成为各大运营商关注的主题。

  当前中国电信市场经营的重点已从单纯的用户数量发展、用户规模经营逐步拓展至细分市场的话务量经营。

  对于各大电信运营商而言,都拥有无可比拟的企业用户接入资源和长期累积的品牌价值和管理经验。在巩固和发展核心业务的运营的同时,大力发展增值业务,形成核心业务和增值业务并存的经营模式。在各类的增值业务中,基于语音技术的语音增值业务,最具备资源优势基础。

2. 语音识别的概念

2.1 什么是语音识别(ASR)

  语音识别技术是根据声音的声学特征,来判别使用者是否说过一些预先设置的关键字词(Key Word)。这种技术在应用前,需要对使用相同语言的群体声音预先进行抽样分析,生成声响模型(Acoustic Mode)。只要使用与声响模型相同的语言,使用者无须预先进行识别的培训过程,就可使用识别系统。声响模型甚至可以是多语种的混合模型,以实现多个语言的自动识别。针对不同的应用环境可以建立相应的声响模型,以达到更好的识别效果。

  语音识别技术的研究已经有超过30年的时间,而直至上世纪80年代,语音识别技术才开始进入应用阶段。到90年代中期,语音识别技术已经解决了诸如识别错误率、计算能力等问题,开始了大规模的商业应用。

2.2 语音识别的过程

下面以INFOTALK公司的识别引擎为例,说明语音识别的过程。

  一个语音识别系统,主要包含有语音识别的客户端模块、资源管理模块、识别引擎以及与应用相对应的应用程序。

  1. 识别客户端主要负责对识别请求进行监控和处理。当接收到呼叫请求后,识别客户端马上通知应用程序。
  2. 在收到应用程序的服务确认消息时,识别客户端开始监视呼叫者的声音,并启动智能的噪声处理和打断处理过程。识别客户端的智能噪声处理和打断处理过程,可以有效过滤外界的噪声干扰,正确识别出呼叫者的声音并定位出需要进行语音识别的语音段。
  3. 在对呼叫者的声音进行处理的同时,识别客户端通过资源管理模块,寻找出一个空闲的识别引擎,并把呼叫者的声音传递给识别引擎。
  4. 识别引擎在收到呼叫者的声音后,与系统预先设定的关键字进行对照。关键字是在识别系统中所设定的字词,在应用程序中代表不同的含义。识别引擎把呼叫者所说话语的声响特征与关键字的声响特征进行比较,从而得出两者的吻合数据。
  5. 识别引擎把呼叫者话语和关键字的对比数据传递给应用程序。
  6. 应用程序通过对这些吻合数据的检查,从而得知呼叫者所说话语的含义而提供相应的服务。

3. 语音识别技术的发展及应用

3.1 语音识别技术的发展

语音识别技术的发展可以分为3个方向:

  个人终端设备上的技术——以固化语音模块形式嵌入PDA、手机、玩具、家用电器等产品。其特点是:简单功能,小词汇量、针对特定用户。

  基于个人PC的技术——语音指令控制PC动作、听写录入。支持大词汇量、针对特定用户,使用前必须训练,要求安静的使用环境。

  基于电信网络的技术——应用于电信网络中,提供大词汇量识别、与用户无关。这个领域中的语音识别系统,由于受到语音传输频宽、环境噪声、系统回声、电磁干扰、不允许实现训练等更加苛刻的约束,对技术的要求就更高。

  从20世纪90年代末以来,随着语音技术的成熟和逐步实用化,由于计算机硬件性能的飞速提高,语音门户开始在世界发达国家出现。特别是在欧洲和美洲,较高的用户消费水平能够消化吸收较昂贵的新技术,语音技术开始进入客户服务和信息服务领域,并逐渐与互联网融合在一起,为客户提供个性化和人性化的服务。

  语音门户的含义,即用户可以在任何时间,任何地点,通过拨打电话获取来自传统媒体、网络媒体的生活信息,个人信息等信息内容。随着网络技术,软件开发技术,通讯技术,语音应用技术的发展,使得语音门户服务具备了很好的条件和基础,实现对各种信息的语音浏览:财经,生活,服务,交通,客货,娱乐,旅游,天气,饮食,新闻等信息。同时,语音门户可以插播广告以及招商引荐获得加盟费和广告收入。

3.2 语音识别技术的应用

  语音识别的应用,可概括划分为电信应用和行业应用。这些应用不但可以实现独特的应用功能,更可通过创新的业务策划过程,有机结合起来,对细分的市场提供更个性化的服务。

3.2.1 电信应用

电话簿服务

  只需要说出名称甚至简称,就能够查询和拨打名字所对应的电话,无须记忆繁琐的电话号码。用户可以直接通过语音,或者通过网站、无线短信、人工呼叫中心等方式管理自己的电话簿。通过SIM卡读写器,还可以读取和同步手机的电话簿记录。

语音查号服务

  通过语音识别的查询方式,大大减少查号台的人工支持服务,即使在大话务量的情形下也能应付自如。只需要直接说出公司、单位的名字即可得知对应的号码、地址、广告等信息。

城市天气查询

  直接说出城市名字即可查询到实时的天气气象预报信息。

语音预付费电话卡

  在某些时候,例如开车、行走等时候使用预付费电话,输入长串的帐号、密码和电话号码信息是一件繁琐甚至是不可能的事情。使用语音识别技术,这一过程变得轻松自如。如果结合声纹鉴别技术,用户甚至只需说话就能完成身份鉴别过程,可以直接说出所需要拨打的电话号码。

语音信息门户

  语音识别技术令Voice-Web的应用成为可能。用户通过电话,就可直接访问和定制以前只有互联网站才能提供的信息。新闻、财经、天气、旅游、体育、娱乐、时尚等信息,都可直接语音选择。电信运营商可进一步通过业务平台和信息资源的整合,可以建立一个语音信息门户的业务平台,以品牌的运作方式,扩大市场的发展空间。而信息的提供有两种方式,一是直接在平台提供信息数据,二是通过对互联网站的访问而得到信息。

3.2.2 行业应用

企业电话簿

  企业电话簿不同于电信的个人电话簿服务的地方在于,企业电话簿存放的是企业的通信资源。更重要的是,企业电话簿不但只是实现电话总机的功能,还可进一步结合包括短信、Email等方式的多维信息处理服务,成为企业信息通信处理的中心系统。对于企业的内部使用而言,企业电话簿提供语音方式的信息访问和管理服务。企业员工可以在企业电话簿中查询和拨打电话、查询项目信息、访问自己的EMAIL和其它文件资源等。对于企业外部而言,企业的客户可以直接语音转接到需要的部门和员工、访问企业业务信息和产品信息等。

语音电子银行

  用户通过语音管理自己的银行帐号。如果结合声纹鉴别技术,用户的身份在使用服务前就被自然鉴别。用户可以随时随地通过语音进行查询帐号余额、转帐、交费等操作。电子银行系统可以通过提供中间交易处理平台接口,更可向其它企业提供语音商务服务。用户在电话购物过程中,在结帐时,可通过银行的语音服务进行。

语音证券信息系统

  通过语音识别服务,用户可以说出股票、货币等名字,查询相关的实时信息。系统的交易功能,可以让客户自己通过语音进行交易。用户甚至无须按照菜单的提示逐步选择,而是直接自然地说出需要的服务,如“我想买微软200手的股票,在20块半时买进”等。用户在查询过程中可以选择访问专家的分析意见。语音识别的服务使话务高峰时,人工座席仍能应付自如。

语音航班信息系统

  通过直接说出航班号码、出发地点或者到达地点,查询航班信息。系统还可以与空中管理系统的数据库相连,提供实时的航班调度信息。

物流管理系统

   用户可以通过追踪号码,查询交付货物的运输信息,包括当前到达的地点、进度计划、处理信息等。

旅业语音管理系统

  用户只需要通过电话,就能查询旅行地点的酒店、天气、票务等信息。可以电话预订。所有的服务都无须记忆和跨越繁琐的菜单。

3.3 语音识别技术在国内外应用的实例

3.3.1 语音识别技术在国外的应用

  AT&T的VRCP系统。该系统是有五个单词(collect,person,third number,operator和calling card)的非特定人小词汇量语音识别系统,现已应用于AT&T通信网上,可以实现自动话务员协助式呼叫,代替话务员完成五种呼叫类型,即

  为使用户使用方便,系统配有语音提示告诉用户如何使用。该系统所具有的关键词检测技术可从句子中查找到五个命令字中的一个,从而使用户在讲话时更加自然,如可以讲“collect call please”,整个系统的正确识别率超过99%。

  AT & T 800语音识别服务系统,NTT ANSER语音识别银行服务系统,Northen Telecom股票价格行情系统,使得原本手工操作的工作用语音就可方便地完成。

  Rogers AT&T Wireless给用户提供的"解放手指"的语音电话本服务。语音电话本操作简单、使用便捷,让用户无需记忆电话号码,也不必在路途中翻阅通讯簿了。申请该项服务的用户可以用语音来拨打电话本中1-4000个联系电话。电话本中的联系方式可以从常用的桌面软件中导出,比如Microsoft Outlook 和 Lotus Notes。

  美国最大的无线网络服务商Sprint PCS公司正在使用语音识别系统向她的客户提供语音拨号功能的个人电话簿服务,以保持自己的竞争力和提高业务收入,同时改善其客户服务质量和客户的便利性。而日本电信Japan Telecom通过使用语音识别技术,向客户提供互联网信息服务。日本电信的客户可以使用电话,自然地说出需要的选择,访问网上的新闻、电影、体育、天气、酒店、证券、交通等信息。Yahoo在2002年也发布了Yahoo! Phone Card服务,客户不但可以语音访问Yahoo的网站信息,还可以只使用自然语言拨打预付费电话。

  在企业方面,美国证券商Charles Schwab是最早使用和提供语音识别服务的公司之一。早在1996年Charles Schwab就向其客户提供语音股票查询服务。之后不久,又发布了语音在线交易系统服务。使用了语音识别技术后,Charles Schwab的语音识别系统每月处理超过4百万的呼叫,减少了50%的人工服务量,使人工座席可以专注于提供专业咨询服务。美国航空公司American Airlines对原有的按键式的呼叫中心升级后,可提供语音识别的实时航班信息查询服务。客户只需要直接说出航班号,或者出发/到达地点,就可以查询到相关的航班信息。而VIP用户只需要说出会员号码就可直接获得VIP服务。

3.3.2 语音识别技术在国内的应用

  据我们了解,国内尚无真正投入商用的语音识别系统。在广东电信惠州公司目前已安装了一套实验系统,该系统从去年底至今,已有三千多免费用户,其中有近10%的用户已对该系统形成依赖,经常使用该系统。目前该系统的日呼叫次数大致为4000次。

4. 语音电话簿业务介绍

4.1 业务定义

  语音电话簿业务是以语音识别技术为手段,提供自动电话查询和代拨服务。用户在系统建立和管理自己的电话簿记录数据库后,通过使用特服接入号码,直接说出人名,即可查询相应的电话号码并可以实现由系统代拨相应的电话号码。

  电信语音电话簿业务,按照用户类别区分,可以分为企业电话簿业务和个人电话簿业务。企业电话簿业务的对象为各类企事业单位,企业电话簿的内容为集团所有工作人员的通信方式的记录。企业电话簿在一定程度上相当于集团的虚拟总机。企业电话簿用户通常是电信运营商的Centrex业务用户。个人电话簿业务的服务对象为个人用户,个人电话簿的内容为个人的通信方式记录。

  在系统和业务的运营过程中,存在有三类的角色,包括电信运营商、系统方案集成商和业务用户。

增值电信业务运营商:负责对业务的运营,向业务用户提供电话簿服务。

电信运营商:提供业务的品牌和系统接入资源,收取用户费用。

业务用户:是电信运营商的客户,使用系统提供的电话簿服务。业务用户按照企业电话簿服务和个人电话簿服务可相应分为集团用户和个人用户,分别拥有企业电话簿和个人电话簿。

4.2 应用场景

4.2.1 企业电话簿呼叫

  企业电话簿呼叫中,系统将根据被叫号码判别进入相应的企业电话簿,提供相应的集团总机服务。如需在同一组接入中继中同时提供企业电话簿业务和个人电话簿业务,则系统将首先进行被叫号码鉴别。若存在与被叫号码相对应的企业电话簿,则提供企业电话簿服务;否则,进行主叫号码鉴别,判断是否提供个人电话簿服务。

4.2.2 个人电话簿呼叫

  个人电话簿呼叫中,系统将根据主叫号码,鉴别出主叫的身份,选择进入相应的个人电话簿,提供个人电话簿服务。

4.3 业务功能

4.3.1 企业电话簿

  围绕企业电话簿的服务,可以提供以下的服务业务:

企业总机

  企业电话簿中存储着该企业所有工作人员的通信资料。这些资料包括企业电话号码和分机对应的人名、部门名称、业务名称等。当呼叫企业电话簿时,可以直接说出电话相应的人名、部门名称等,转接到相应的电话。

  可以选择设定一个电话号码作为人工服务电话。当需要人工服务时,呼叫被转接到人工服务电话上。

企业114

  通过企业114服务,查询企业的电话号码信息。

Follow-Me转接

  每个企业分机电话可以设定不同时段的电话号码。在不同的时段,如上班时间和节假日,或者出差期间,呼叫被转接到当前时段的电话上。

电话分机的主人也可以马上启动Follow-Me功能。

同名处理

   当电话簿记录中出现同名时,可以定义同名的区分条件,如不同部门,不同性别等。在语音识别时,根据区分条件提示主叫选择。

企业总机提示语

  企业可以设定、修改电话簿的呼入提示语。可以根据不同时段,例如上班时间、节假日等,设定相应的提示语。

主叫号码替换

   在系统的电话转接过程中,由系统转移拨出的呼叫,可以把真正的主叫号码替换系统本身的中继号码,发送给被叫,使在被叫侧显示出真正的主叫号码而不是系统号码。

企业电话簿管理

  提供企业电话簿管理界面。企业通过电话簿管理界面对电话簿记录和功能进行修改、增加、设定等管理。

4.3.2 个人电话簿

围绕个人电话簿的服务,可以提供以下的服务业务:

电话代拨

  个人电话簿存放个人用户的电话记录信息。个人用户通过特服接入号码访问自己的个人电话簿,说出需要拨打的电话名称,进行电话拨打。

号码查询

  可以查询个人电话簿的电话信息。

多号码识别

  一条电话记录中可以存放多个不同类别的电话。在拨打和查询电话时,选择不同电话号码。

多主叫捆绑

  个人用户可以对自己的个人电话簿捆绑设定多个主叫电话号码。使用这些主叫号码可以访问使用同一个个人电话簿的服务。同一个主叫电话号码只可以捆绑到唯一一个个人电话簿。

主叫号码替换

  在系统的电话转接过程中,由系统转移拨出的呼叫,可以把真正的主叫号码替换系统本身的中继号码,发送给被叫,使在被叫侧显示出真正的主叫号码而不是系统号码。

个人电话簿管理

  提供个人电话簿管理界面。个人通过电话簿管理界面对电话簿记录和功能进行修改、增加、设定等管理。

4.4 基本流程

4.4.1 企业电话簿基本业务流程

4.4.2 个人电话簿基本业务流程

5. 业务运营环境

5.1 服务接入号码

  对于企业电话簿业务,每个企业用户由电信运营商分配给企业一个总机号码。系统根据每个呼叫的被叫号码,也就是总机号码,提供相应的企业电话簿服务。不同企业的电话簿之间互不关联。

  对于个人电话簿业务,电信运营商提供统一的特服接入号码。而个人电话簿与个人用户的电话号码捆绑使用。个人用户呼叫这个个人电话簿特服号码,系统根据主叫号码,提供相应的个人电话簿服务。不同个人用户的电话簿之间互不关联,不可互访。

  系统可以对应于企业电话簿业务和个人电话簿业务,分别设置不同的接入中继组。也可以只设置同一个接入中继组,根据被叫号码识别和主叫号码识别,分别提供相应的服务。如下图所示。



5.2 身份鉴别

   对于企业电话簿业务呼叫,无须对主叫进行身份鉴别,而只需根据被叫号码判别出所需的企业电话簿。

  对于个人电话簿业务呼叫,需要对主叫身份进行鉴别。以下是进行身份鉴别的各种方法和相互比较。

我们建议使用主叫号码捆绑的方案。

5.3 计费和呼叫记录

  系统将记录呼叫过程中的详细信息,包括呼叫时间、电路号、识别时间等。这些信息将可用户进行话务统计和计费。

  业务计费主要涉及基本通话计费、增值业务计费和其它功能计费三部分。基本通话的计费是指业务在使用过程中的常规电信按时长、距离的计费;增值业务计费是指由于使用企业电话簿或个人电话簿等增值服务所涉及的计费;其它功能计费是指由于使用了其它接入功能,如短信、IP电话等,所涉及的计费。

无论是哪一类的计费,其计费方式可能有以下几种:

  按时长计费 - 根据通话的时间长度,结合相应的费率进行计费。

  按次数计费 - 根据通话次数,按照相应的费率进行计费。

  按时间周期计费 - 根据一定的时间周期,按照相应的费率进行计费,例如月租。

  最终的计费方案要视乎电信运营商的策略考量,通常都会涉及计费类别和计费方式的集成。本文件不描述最终的计费策略方案,只探讨和分析在由电信运营商负责计费和由系统负责计费的情形。

5.3.1 电信运营商计费情形

   由电信运营商负责进行计费的好处是可以保证计费数据的有效性。

  电信运营商将根据二类数据进行计费。一是呼叫中的主叫号码、被叫号码和呼叫开始结束时间。这类数据电信运营商可以直接获得。另一类数据是客户资料信息。电信运营商将使用这些信息来进行时间周期计费,如月租等。系统将定期把客户资料信息传送给电信运营商计费中心。资料传送的方式可以是FTP方式。

  对于非授权的呼叫,例如没有申请个人电话簿服务的主叫,如呼叫系统时,系统可以返回空号信令信息给电信运营商交换机。或者可以设定系统提示非授权的主叫进行业务服务申请。

  系统在实现主叫号码替换功能时,在电信运营商的交换机侧,将出现主叫号码重复的电话呼叫记录。例如,用户81357135呼入系统(企业电话簿的呼叫号码为81234567,个人电话簿的呼叫号码为特服号码11400),识别完成后,呼叫被转接到82468246,呼叫完成后用户挂机,则电信运营商交换机侧产生的计费记录如下图所示。

企业电话簿呼叫:

# Caller Called Start Time End Time

1 81357135 81234567 2003/4/1 10:23:10 2003/4/1 10:31:50

2 81357135 82468246 2003/4/1 10:23:28 2003/4/1 10:31:50

个人电话簿呼叫:

# Caller Called Start Time End Time

1 81357135 11400 2003/4/1 10:23:10 2003/4/1 10:31:50

2 81357135 82468246 2003/4/1 10:23:28 2003/4/1 10:31:50

如果系统不进行主叫号码替换,则出现如下图所示记录。

企业电话簿呼叫:

# Caller Called Start Time End Time

1 81357135 81234567 2003/4/1 10:23:10 2003/4/1 10:31:50

2 11400 82468246 2003/4/1 10:23:28 2003/4/1 10:31:50

个人电话簿呼叫:

# Caller Called Start Time End Time

1 81357135 11400 2003/4/1 10:23:10 2003/4/1 10:31:50

2 11400 82468246 2003/4/1 10:23:28 2003/4/1 10:31:50

  企业电话簿业务和个人电话簿业务在上述的呼叫记录中,需要留意一个区别,就是企业电话簿呼叫的转接被叫都属于本地呼叫,而个人电话簿的转接呼叫可能是长途呼叫。

  电信运营商计费系统需能正确识别上述情况,并设定适宜的计费策略。两种情形下的计费比较如下表所示。

 

  电信运营商可以考虑对企业电话簿呼叫不进行主叫号码替换,只对呼入系统的呼叫记录进行正常计费,而系统呼出的记录则不计费。对于个人电话簿呼叫,进行主叫号码替换,对呼入系统的呼叫记录进行按次计费或不计费,系统呼出的记录进行正常计费。

5.3.2 系统计费情形

   系统的呼叫记录可以详细记录呼叫的过程信息,可以按照各种计费策略进行计费。但由系统负责计费需要考虑以下的因素:

  1. 需要符合电信运营商计费的质量要求

  2. 需要与电信运营商的计费中心连接,定期进行计费营帐处理

5.4 信用控制

   如果需要根据业务用户的付费状况和授信情况,对呼叫进行控制,则在没有付费或超过授信额度时,系统将对呼叫拒绝服务。当出现服务拒绝时,提供录音通知信息。

系统将通过信用控制接口与电信运营商的授信数据库相连。并定期定时更新。

5.5 电话簿管理

   电话簿管理包括电话簿记录内容的输入、修改、增加、删除等操作,也包括电话簿服务功能的配置设定和个人信息修改等方面。

  电话簿管理的访问可以有多种方式。对于企业电话簿的管理,通常只需提供互联网网站访问方式。对于个人电话簿的管理,则需考虑有以下的多种方式。

1. 互联网网站访问方式。可以实现所有的管理功能。界面直观。

2. 短信访问方式。可以实现所有的管理功能。移动性好。界面不友好。

3. 语音访问方式。只可实现部分的管理功能。如录入语音识别关键字。

4. 客户端同步方式。在客户端装载专门的客户端软件,或者使用流行商业的个人管理软件,如Microsoft Outlook等,通过互联网连接,与服务器端进行同步。

5. 人工服务方式。通过客服和营业厅的人工服务进行电话簿管理。私密性较差。

6. 无线访问方式。使用GPRS/WAP/3G等无线接入技术。需要无线运营商的支持。

5.6 客户服务和营业厅接口

   系统能提供电信运营商的客户服务接口。客户服务接口提供的内容包括:

   1. 显示呼叫记录信息

   2. 显示呼叫质量信息

   3. 显示业务用户资料信息并可进行增加、修改和删除

   4. 提供业务用户帐号的管理功能包括暂停、恢复等

  系统提供电信运营商的营业厅接口,对业务用户帐号信息进行管理。用户帐号信息管理的内容包括帐号生成、挂起(暂停服务)、删除、帐号信息修改等。

6. 系统结构

6.1 系统连接

  语音接入使用E1数字中继通过接入交换机与公众语音网络相连。接入交换机使用数字E1与系统语音识别端口相连。完成语音识别后,语音识别端口将释放,呼叫在接入交换机上被转接到公众网。转接完成后,每个呼叫将占有接入交换机的两个语音时隙资源。接入交换机与系统语音识别端口的数字E1连接将采用支持呼叫转移的数字信令。

  系统的数据接入连接将通过网关服务器进行。对外部的数据网连接将包括互联网连接、数据专网连接和短信网关连接。互联网连接将用于实现用户数据管理访问、系统远程管理维护等功能。数据专网连接将用于实现客服接口连接、营业厅接口连接、系统远程管理维护、计费连接、漫游数据传送等功能。短信网关连接将用于实现系统的短信功能。

6.2 软件功能架构

呼叫接入平台:负责实现呼叫接入处理和信令交互。

ASR模块:负责智能语音识别处理。

TTS模块:负责自动文本语音转换。

流程控制模块:负责人机交互流程控制。

SMS模块:负责无线短信处理。

监控管理模块:负责系统运行状态的监控和告警管理。

配置管理模块:负责系统资源的配置管理。

计费管理模块:负责系统和呼叫进程的信息管理和计费处理。

信息维护:负责提供系统业务的信息管理界面。

6.3 呼叫转接方案分析

   在提供电话簿服务进行电话转接时,可以有两种电话转接方案。以下是这两种方案的比较。

  在语音识别接入服务器上直接进行呼叫转接:这种方案不需要接入交换机。语音识别服务器通过语音E1板卡,使用标准7号信令与电信运营商的公众电话网相连。在电话需要转接时,启动板卡上的另一个空闲端口进行出局呼叫。呼叫连通后再把入局端口和出局端口在板卡上连接起来,实现呼叫转接。该方案使出局呼叫在完成通话后,不挂机即可返回到系统,继续使用电话簿服务。但每个需要电话簿电话转接的呼叫要占有2个板卡端口资源。由于在整个服务过程中无论是否需要语音识别,都将占用语音识别资源端口,从而令系统投资大幅度增加。

  通过接入交换机进行呼叫转接:这种方案需要使用接入交换机。接入交换机与电信运营商的公众电话网通过7号信令相连。接入交换机与语音识别接入服务器通过E1相连,并使用能够支持呼叫转接功能的数字信令。当呼叫的语音识别完成后,语音识别接入服务器上的端口将释放,呼叫在接入交换机上实现出局呼叫。每个需要电话簿电话转接的呼叫需要占有接入交换机上的2个端口,但无须全程占用语音识别资源。另外,使用接入交换机负责呼叫转接可以提高系统的稳定性。当出局的呼叫完成通话后,不能重新回到系统继续使用电话簿服务。

6.4 系统模块简介

6.4.1 语音接入服务器/信令网关

  语音接入服务器负责系统语音识别的接入服务。语音接入服务器通过语音E1板卡与接入交换机相连。

  接入服务器还需配置语音识别的客户端软件,按预定的流程提供交互式的自动语音应答功能。语音在打包传送给语音识别服务器前进行识别的智能预处理。通过智能预处理,可以滤除大部分的环境噪声,提升识别效果。

6.4.2 语音识别服务器

   语音识别服务器主要实现语音识别功能,需要识别引擎的服务器端软件支持。可按各个机器配置不同而自动调整处理性能,能够支持多引擎、多服务器的大型应用。

接入服务器处理需要识别的呼叫时,把语音打包给语音识别服务器,完成语音识别后,语音识别服务再把识别结果返回给接入服务器,从而实现语音控制的业务服务过程。

6.4.3 语音合成服务器

  语音合成服务器负责把文本信息转变为声音进行播报,需要语音合成软件支持,系统可伸缩性强,支持多机分布式服务模式。

  接入服务器向用户提供异常庞大的信息查询时,无须事先录音,把文字信息传给语音合成服务器,完成进行语音合成后,语音合成服务器再把语音结果返回给接入服务器,从而语音信息查询过程。

6.4.4 数据库服务器

   数据库服务器包括系统核心数据库和业务数据库。系统核心数据库负责存储系统运行支撑数据,系统统计数据、系统告警数据等;业务数据库负责存储业务相关的内容数据,以及用户数据。保证数据安全存储,支持多机热备份。

6.4.5 应用服务器

   应用服务器提供多种中间件服务,采用消息驱动方式,支持同步或异步请求及应答,功能包括屏蔽数据库及操作系统差异,自动平衡通信负载,系统运行监测等。

6.4.6 数据网关/WEB服务器/Email网关

   数据网关/WEB服务器负责对数据网络的外部连接和提供系统网站服务。系统网关服务可以隔离系统和外部的数据信息服务,保证系统的安全运行。外部的数据信息服务包括无线短信服务、信息专网连接、以及公众互连网连接等。

7. 系统容量分析

7.1 分析模型

系统容量分析需要基于一个假设的计算模型,描述如下。

假 设
假设值
标 识
企业电话簿业务平均每个呼叫在电话转接后的通话时长 300秒
A
个人电话簿业务平均每个呼叫在电话转接后的通话时长
180秒
B
平均每个呼叫从听提示语、说人名、语音识别到呼叫转接的时长
15秒
C
交换机的交换接续时间
忽略不计  
每个呼叫只允许有一次电话转接
N/A  
电话转接后通话完成时一次呼叫服务也随之结束
N/A  
企业电话簿业务的非转接电话类别呼叫数忽略不记。
N/A  
个人电话簿业务的非转接电话类别呼叫占总呼叫数的百分比
10%
D
非电话转接呼叫的平均呼叫时长
60秒
E
企业电话簿业务平均忙时呼叫数
30个呼叫/小时
F
个人电话簿业务平均每个用户每天呼叫数
10个呼叫/天
G

7.2 接入交换机端口数和语音识别端口数

按照这个假设模型,分别针对企业电话簿业务和个人电话簿业务,有以下的计算结果。

基于以上的分析,语音识别的端口数和接入交换机的入局中继的比例为1:10。

7.3 用户数
根据8.1节计算模型的假设,每个入局中继E1可以支持的用户数测算如下表所示:

企业电话簿业务
个人电话簿业务

忽略非转接电话类别的呼叫,并假设每个用户在每天的呼叫都集中在10个小时内发生,每个入局中继端口可以支持的个人用户数为:
600/((A+C)*G/10)=11个用户
每个入局中继E1可以支持的个人用户数为:30*11=330个用户

1. 各方利益

   本节分析电话簿业务为各个角色所带来的回报。只有为各个角色实现足够吸引力的回报,才有可能实现成功的业务。

1.1 对于电信运营商

1.2 对于企业用户

1.3 对于个人用户

2. 市场推广建议

   语音电话簿业务面对的客户分为集团客户和个人客户。

在初期的发展中,我们建议以发展集团客户为主,重点发展大客户,原因有以下几点:

  1) 此类客户的定位相对较容易,所能接受的服务较为清晰;

  2) 消费能力较高;

  3) 市场开拓成本不高;

  4) 影响面广,对与企业有关联的集团和个人均有示范作用;

  5) 使用率高,经济效益明显。

对于市场开拓办法,我们有如下建议:

  1) 建议电信运营公司可以先在自己的内部使用,积累语音运营经验,形成相关市场影响;

  2) 前期主要依托电信公司的大客户部,针对大客户,进行业务推广;

  3) 在推广初期,建议采用3个月的免费试用,及赠送若干个个人电话簿的方式;

  4) 建议初期无须做过多的媒体宣传。

在语音电话簿业务有较大的市场影响力和企业客户群体后,再进行个人客户的市场推广。

3. 资费

3.1 收费模式

3.1.1 收费类型

  1) 收取开户费、月租费,不收取记次/记时使用费

  2) 不收取开户费、月租费,收取记次/记时使用费

  3) 收取开户费、月租费、记次/记时使用费

  4) 不收取开户费,收取月租费,记次/记时使用费

我们建议根据运营商的客户资源情况,采取相应收费类型。

3.1.2 收费标准

3.2 测算

在下面我们做了个保守的回报分析,可以看出语音门户是一个值得投资的项目。为了分析更简便,做了一定的设定:

4. 未来发展

  电信运营商通过提供企业电话簿和个人电话簿业务,可以构建语音增值业务服务平台,整合各种用户资源和信息资源,进一步策划和提供各种增值业务应用。

4.1 企业电话簿应用

  企业电话簿将演变成为专门为集团用户提供增值服务的业务平台。围绕企业电话簿业务,电信运营商可以进一步策划和提供针对大企业用户应用需要的语音增值业务。例如会议管理、语音电子邮件、传真信箱等。另外,通过个人电话簿的用户资源整合,电信运营商可以向集团企业用户策划和提供用户营销渠道服务,如信息定向发布、产品广告、服务渠道等业务。通过这些业务的策划和提供,电信运营商可以实现各种用户资源和信息资源的有效整合和增值。

会议通知

   集团使用网页浏览器通过电话簿网站进行集团会议通知设置。企业电话簿将根据用户设定的会议时间和参与人员,自动发送会议通知。发送会议通知的形式可以是语音通知、短信通知、电子邮件通知等形式。在会议开始前,电话簿可以提醒参会人员。

语音信箱

   可以为集团分机配置语音信箱。集团分机用户可以通过电话簿网站管理自己的语音信箱。在集团分机忙或无人应答时,可以把呼叫自动转移到语音信箱。分机用户也可以设置由语音信箱自动应答来话。分机用户可以拨打企业电话簿提取留言,也可以直接在电话簿网站上提取留言。

传真信箱

   在企业电话簿内提供企业传真信箱,可以实现企业传真的传送和收取。可以设置通过电子邮件,按照设置的不同时段,如上班时间和节假日,把传真发送到企业指定的不同地方。也可以通过电话簿网站直接管理企业传真。

企业邮箱

   除了提供企业电话簿服务外,还可以提供集团电子邮件服务,提供具有企业域名的企业邮箱。分机用户可以通过标准电子邮件客户端软件,如Outlook等,或者通过电话簿网站,甚至直接拨打企业电话簿,使用语音方式,访问自己的电子邮件。

信息发布

   通过信息发布服务,企业可以在电话簿里,向企业的用户发布集团信息,如产品信息、企业新闻等。当呼叫进入企业电话簿时,除了进行呼叫转接外,如果选择集团信息服务,则播报企业信息。企业甚至可以利用信息发布业务,实现客户支持服务。企业用户通过电话簿网站,对企业信息发布的内容、流程和功能进行管理。

定向广告

   电信运营商在建立了一定数量的个人电话簿用户后,可以根据个人用户群的喜好特征和用户类别,联盟企业用户,策划出各种资讯服务。不同的个人用户对各种资讯有不同的喜好。而企业用户希望企业信息可以传递到需要的人群中。通过这些个性化了的资讯信息频道服务,企业用户的信息可以定向传递到需要的个人用户。例如个人用户可以选择定制时尚产品的折扣信息频道,获得相应的信息。企业用户可以通过企业电话簿网站进行定向信息的发布,甚至可以知道信息发布的效果。

4.2 个人电话簿应用

  个人电话簿业务可以演变为提供个性化语音增值业务的业务平台。用户可以自己选择需要的业务,以及定制进入个人电话簿后的语音菜单。电信运营商通过个性化的语音增值业务平台,可以策划和提供各种个性化、差异化的增值服务,如个人资讯服务、个人助理服务等。通过整合集团用户资源和个人用户资源,电信运营商可以提供两种资源的渠道服务,如向个人用户提供各种来自集团企业用户的资讯信息服务。通过这些业务的策划和提供,电信运营商可以实现各种用户资源和信息资源的有效整合和增值。

个人邮件

   个人邮件服务向个人电话簿用户提供电子邮件服务。用户可以通过标准电子邮件客户端软件,如Outlook等,或者通过电话簿网站,甚至直接拨打企业电话簿,使用语音方式,访问自己的电子邮件。

数据同步

   通过数据同步服务,用户可以使个人电话簿的信息数据,与自己的终端,如PDA等,进行同步。

资讯定制

   电信运营商可以向个人电话簿用户提供各种信息频道服务。个人用户可以根据自己的需要,定制这些信息服务。在访问自己的电话簿时,用户可以直接选择自己定制好的信息服务。所定制的信息除了可以在电话簿中已语音方式获得外,还可以选择以短信、电子邮件等方式获取。

自助交费

   自助交费业务使用户可以在电话簿中实现各种第三方的服务交费,如电话费、电费、煤气费等。用户还可以定制交费自动通知功能,由电话簿定期自动通知需要交纳的费用信息。

个人财经

   通过个人财经业务,用户可以定制自己需要的股票信息、外汇信息、财经新闻等。用户还可以定制信息通知功能,例如股票的股价告警、外汇汇率告警等,在价位或汇率到达自己设定的数值时,自动发送通知。

电子银行

   电子银行业务可以使用户管理自己的银行帐号,实现帐号的余额查询、转帐等功能。

业务定制

   业务定制使用户可以根据自己的需要,实现业务的个性化设置。在电信运营商提供的各种服务业务中,选择自己需要的服务。业务定制就像流程定制一样,用户无须跨越繁复的服务业务菜单和流程,而是根据自己的使用习惯,直接进入需要的服务。

4.3 其他语音门户应用

   航天华迪语音门户是一个完整的平台,可以支持多种数据库和文本文件的同时访问,平台能提供集中式的文语转换功能、自动语音识别功能、全文检索功能、格式转化功能,数据库访问功能、以及二次开发功能等。在此平台上可开通多种业务,目前已实现的业务如:电话听E-MAIL 、语音查询天气、股票行情查询、航班查询等多种通过语音取代按键操作的自动语音播放信息查询业务。

1)、天气查询

  与传统的天气查询不同的是,用户通过拨打一特服号接入到系统后,不用在系统语音提示下进行多次按键选择,只需在系统语音提示下对着电话说出自己所要查询的城市名即可查到自己所要的信息 。这种方式对用户来说快捷方便,适于要查找多个地方的天气情况 ,每查找完一个信息不用退出系统重新选择,只需根据系统语音提示报出你所另外要查找的地名即可。因为每天的天气是动态变化的,所以平台要通过网关到气象局实时取得数据。

2)、股票行情查询

  证券交易市场的发展伴随着经济的发展而发展,股市的动态牵动着千万股民的心,为了方便股民 及时快捷的查找股市行情,提供一种实时语音交互的信息查询是市场与客户所迫切需要的 。股民只需对着电话简单的说出所要查找的股票代 码即可获得所需的信息。股市是随时动态变化的,对用户的查询信息通过网关实时到证券所数据库取得相关信息,送往TTS文语转换模块转换为语音文件通过IVR播放给用户。

3)、航班查询

  随着社会的发展,人们出差旅游的机会越来越多,对各地航班的查询访问量也更频繁。传统航 班查询都是通过话务员或航班公司售票处座席提供服务,利用TTS/ASR系统,用户直 接对着电话说 出所要查询的航班,平台通过网关到航空公司数据库查找,查找到的信息送至TTS文语合成模块,根据ASR识别的用户语音请求,将相应用户信息通过IVR节点播放给用户。

4)、电话收发E-mail

  用电话接收E-mail的方法可以有两种,传统的方法是由话务员把E-mail的内容直接念给用户听。另一种即利用TTS技术,平台读取E-mail的内容,然后把文本内容送往文语转换模块将其转化为语音信息,通过IVR节点播放给用户。

  用电话发E-mail业务是指用户通过电话接入系统,用户打电话告知系统所要发信的目的电子邮件地址,由ASR自动识别系统内已定义好的IP地址,通过IVR节点录音的语音文件以附件的方式生成Email通过Internet发送到对方的Email信箱中。

5)、会议系统

  可以以平台为基础,利用语音技术召集相关人员,召开电话会议。传统方式是由公司秘书或助理打电话召集公司管理层或部门人员,召开电话会议。而语音技术则可以通过自动语音呼叫或通过语音秘书并通过平台进行多方会议。

6)、秘书服务

  结合平台座席与个人语音电话本实现给注册用户实现个人秘书服务。


航天华迪公司供稿 CTI论坛编辑



相关链接:
机场综合业务解决方案 2005-04-26
自动总机系统解决方案 2005-04-20

分类信息:     技术_语音识别_解决方案