首页 > 技术 > 解决方案 > IP电话的关键技术

IP电话的关键技术

2000-10-19 00:00:00 作者：来源：评论：0 点击：

_ti

王孟宣 _t_t

——1995年年初，以色列VocalTec公司研制出可以通过Internet打长途电话的软件产品“Internet Phone”。只要在多媒体PC上安装该软件，你就可以通过Internet和在世界上任何地方安装同样软件的联机用户进行通话。这个技术上的突破引起全世界的瞩目，其背后的无限商机也使许多研究机构、国际标准组织、产品制造公司开始进行此项技术的研究，从而使IP电话技术得到迅速发展。

——IP电话是一种利用Internet作为传输载体实现计算机与计算机，普通电话与普通电话、计算机与普通电话之间进行话音通信的技术。IP电话是一个复杂的系统工程，涉及到的技术也很繁杂，其中尤以下几种技术的发展最为关键，包括分组语音技术、语音编码和压缩技术、IVR技术等。

一、分组语音技术

——传统的电话网是以电路交换的方式传输语音，它需要的基本带宽为64kbit／s。而要在基于IP 的分组网络上传输语音，就必须对模拟的语音信号进行特殊的处理，使处理后的信号可以适合在面向无连接的分组网络上传输，这项技术称为分组语音技术。

1.分组语音技术简述

——分组语音技术是指将语音信号转换为一定长度的数字化语音包，采用存储转发的方法，以包的形式进行交换和传输的技术。电话技术通常需要64kb／s以上的带宽，而分组语音需要的带宽不到 10kb／s。

——所有分组语音系统都遵循一个共同的模式，如图1所示。

——在这个网络的周边是被称为“语音代理”的设备或部件。这些设备或部件的任务是将语音信息从传统的电话格式转换为适用于分组传输的格式。然后通过网络将分组数据发送到目标的语音代理。

2.处理流程

——无论对于实时的应用（如IP电话）还是非实时的应用（如语音邮件），发送端语音都要经过模拟信号——数字信号——语音包的处理过程，并在接收端对语音包进行相反的处理，从而得到与输入端相同的语音信号。我们可以把处理流程分为发送端的处理流程和接收端的处理流程两部
分来介绍。

——（1）发送端的处理流程

——首先，把模拟信号转换为数字信号，并对其进行进入缓冲器前的量化数据处理。声卡和音频设备先对模拟语音信号进行8位或16位量化，然后再送入缓冲器。许多低比特率的编码器对语音块（也被称为帧）进行编码，典型帧为10～30ms，考虑到传输过程中的代价，语音包通常由60、120 或240ms长的语音数据组成。

——其次，把语音包按照特定的帧长进行编码。大部分的编码器都有特定的帧尺寸，若一个编码器使用15ms的帧，则把从第一级来的120ms的包分成8帧，并按顺序进行编码。每个帧合120个语音样点（抽样频率为8kHz）。编码后，将8个压缩的帧合成一个压缩的语音包送入网络处理器。

——网络处理器为语音包添加包头、时标和其他信息后通过网络传送到另一端点。

——（2）接收端的处理流程

——首先，网络提供一个可变长度的缓冲器，用来调节网络产生的抖动。缓冲器可容纳许多语音包，用户可选择缓冲器的大小，大的缓冲器能调节大的抖动，但产生延迟较大，小的缓冲器产生延迟较小，但不能调节大的抖动。

——其次，解码器将经过编码的语音包解压缩后产生新的语音包。这里也可按帧进行操作，完全和编码器的长度相同。若帧长度为15ms，则120ms的语音包被分成8帧，然后被解码还原成120ms的语音数据流送入解码缓冲器。

——最后，缓冲器中语音样点被播放驱动器取出送入声卡，通过扬声器按预定的频率（例如 8kHz）播出。

——以上两部分处理流程，再经过中间的、传输过程就完成了语音分组通信的一个全过程。

——在这个过程中，全部网络被看成一个整体，从输入端接收语音包，然后将其传送到网络输出端。由于可以在某个范围内变化，就可能出现网络传输中的抖动现象。

3.分组语音的传输方案和传输系统中的几个关键技术

——分组语音传输网络可以基于IP、帧中继或异步传输模式（ATM），这些构成了传统的分组语音传输方案，我们分别称为ATM语音（VoATM）、帧中继语音（VoFR）、IP语音（VoIP）。

——VoATM（Voice over ATM）是指在ATM网络上传递分组语音的技术。ATM是利用固定长度（53 个字节）信元中的48个字节来存放数据信息的，因此，通过ATM传输语音流，要遵循ATM信元的结构规定。

——VoFR（Voice over Frame Relay）是利用帧中继网络传输分组语音的技术。帧中继论坛 FRF.11已经建立了用于帧中继上的语音传输以及有关通话建立、编码类型和分组格式的标准，未来还将提供用于产品互操作性等方面的基本功能。

——VoIP（Voice over IP）是利用IP网络进行语音通信的技术。IP是无连接的，在优先级、资源预留、分组拆分等领域的优势比较引人注目。IP拥有强大的信令、寻址和路由功能。IP的另一优势在于它与当前众多的数据应用程序的集成，使得IP网络应用无所不在。

——另外，在分组语音网络传输系统中需要解决以下几个技术才能使分组语音服务满足质量上的需要。

——（1）语音编码

——即如何将语音信息转换为分组信息以及如何将分组信息重新转换为语音。其中包括优化编码方案、寻找最佳算法、对语音进行高效、优质的编解码以及语音恢复等等，这些都已形成了一个学科分支，并受到人们应有的重视。

——（2）信令

——用于鉴别呼叫方所需要呼叫的对象以及呼叫方在网络中的位置。

——在许多情况下，如何实现语音编码、如何保证语音质量并不是分组语音技术的难点，关键是可行的分组语音应用要求某地的呼叫者连接至使用其标准拨号机制的语音代理，并将呼叫发送至可以访问其他语音代理的用户组。

——在分组语音网络中有两种完全不同的信令联系。一种信令为外部信令，用于语音代理和该代理服务的语音设备。这些语音设备适用于普通的语音网络，外部信令遵循电话标准。另一种信令用于传输网络中语音代理之间，称为内部信令。这种内部信令通过传输网络标准或语音代理本身的标准实现。

——（3）语音压缩算法

——语音压缩是分组语音系统中的重要组成部分。目前，通过调制解调器接入网络的最大速率为 56kbit／s，远远不能适应多媒体通信的要求，而且因特网不能对传输带宽提供保证，因此必须采用低速率的语音压缩算法来处理语音，这对实时语音应用尤为重要。

——（4）音频回声消除技术

——在IP电话的应用中，人们若使用扬声器和麦克风就可能出现回声现象。如图2所示。

——本地扬声器输出的模拟语音信号可能又被话筒接收，当信号被传回到源端时，就会产生不必要的回声。在因特网中，呼叫必须经过多个路由器和网关，其相当长的延迟又会造成回声问题的进一步恶化，在系统中使用回声消除技术可以解决这个问题。目前，回声消除技术主要有回声抑
制和回声抵消两种。

——（5）网络呼叫技求

——IP电话采用分布式的呼叫模式。因为不需要通过电路交换完成呼叫，所以每个终端都使用了呼叫处理器。单工呼叫模式仅支持一个终端的呼叫，且需要本地呼叫驱动的支持。通过触发本地呼叫驱动软件建立一次呼叫，而呼叫驱动利用传输控制协议（TCP）的套接字（Socket）与另一端
的呼叫驱动建立信令连接，从而触发另一端的单工呼叫。这两个单工呼叫被触发后按照Q.931信令协议完成呼叫过程的建立。根据信令的引导，呼叫驱动程序启动语音信息流接入网络和对端的接收设备，建立一个完整的呼叫过程图3。图3中的呼叫对象指明本次呼叫的域名、两端的终端识别码（ID）电话号码、呼叫类型（如单纯语音、语音和数据）等信息。

二、语音的编码及压缩技术

——模拟语音信号必须经过处理，转换成适合在IP网络上传输的IP数据包。这个过程需要先进行数字编码，转换为PCM码，然后经过专门的DSP芯片进行数据压缩，最后再打上IP包的标记，形成 IP数据包的形式，以适合IP网络上的传输带宽，其中涉及到了PCM、DSP、编码、压缩等内容。

1.PCM技术介绍

——脉冲编码调制（Pulse Code Modulation简写为PCM），是指把模拟信号转化为数字信号的过程，为目前世界各国主要采用的方式。PCM包括抽样、量化和编码三个过程。

——（1）抽样

——抽样是指用脉冲对要处理的模拟信号进行调制的过程，即对模拟信号进行脉冲调制。

——（2）量化

——量化是指把抽样信号的幅度离散化的过程。根据量化过程中量化器的。输入输出的关系，可以有均匀量化和非均匀量化两种方式。

——（3）编码

——模拟信号经过抽样和量化后，还要进行编码处理，才能使离散样值成为更适宜传输的数字信号形式。编码形式有多种，如：低速编码和高速编码；线性编码和非线性编码；逐次反馈型、级联型和混合型等等。

——2.DSP介绍

——（1）简述

——DSP是数字信号处理器（Digital Signal Processor）的缩写，属于MPU（微处理器）的一种，它主要应用于声音压缩、图像压缩等数字压缩技术领域，能将声音、图像、温度压力等种种模拟信号高速转变成数字信号。例如，发展极为迅速的手提电话中，DSP将话音模拟信号高速数
字化，并通过代码压缩而发送，接收端再经由DSP把压缩了的数字信号复元、扩展成模拟信号。

——（2）DSP的技求特点

——DSP是一种特殊的单片机，同时它也是一个嵌入式系统。

——网络设备中引入了DSP技术，使得交换以太网和快速交换以太网变得更快、更便宜、也更容易升级。现在数字信号处理器已广泛用于调制解调器和移动电话，发展非常迅速。

——DSP优于RISC（精简指令集计算机）处理器，其原因在于DSP有嵌入的协处理器和用于快速数据处理的并行数据通道。另外，基础系统和扩展模块中的DSP也能分担一些数据处理的任务。因此增加DSP后，交换机性能将迅速提高。

——进入90年代，DSP技术发展十分惊人，目前已成为不少新兴科技的主要推动力，其中包括电信和多媒体技术，以DSP作为主要元件，再加上外围设备和特定功能单元综合成的单一芯片，加速了 DSP方案的发展。同时产品的价格得以降低，运算速度和集成度获得提高。90年代DSP揭开了PC、通信及消费电子市场合一的新纪元，这些技术也反过来促进了DSP的发展和需求。

——DSP从1978年第一块单片DSP投放市场以来，已经发展到目前的第五代产品。在过去十年中DSP 一直以30％的年增长率在发展着。

3.IP语音编码与压缩技术

——通过Internet传输实时的语音或图像与传输普通数据是不一样的，应用网络的组成必须符合这种实时传输的需要。这种传输与传统的数据传输有着很大的区别。对于越来赴多的语音服务商们来说，能支持高品质的VoIP（Voice over IP）应用是走向成功的一个关键因素。

——话音的分组传送通常要求网络提供充足的带宽，所以对现有的多数IP网络而言，话音压缩技术是实施IP话音通信的关键所在。表1给出了当前比较流行的几种话音压缩技术的比较。

表1 几种语音压缩方式的比较

协议 VoIP Codec 压缩后的传输率(kbit／s) 复杂度质量延迟
G.711 PCM 64 很低非常好几乎可以忽略
G.728 ADPCM 40／32／24 低(BMIPS) 好(40K)
差(16K) 非常低
G.729 CS-ACELP 8 高(30MIPS) 好低
G.729a CA-ACELP 8 中等一般低
G.723 MP-MLQ 6.4／5／3 中等偏高(20MIPS) 好(6.4K)
一般(5.3K) 高
G.723.1 MP-MLQ 6.4／5／3 非常高(40MIPS) 好低
G.726 LD-CELP 16 1 1 低

——编码压缩方法由ITU统一制定，并标准化。它的压缩能力由DSP的处理能力决定，通常DSP的处理能力用MIPS（Millions of Intructions Per Second）来度量。

——编码压缩仅负责对实际传输的IP分组数据进行压缩，它不负责对IP头压缩，一般，IP／UDP头（包括地址信息和控制信息）要耗去7kb／s左右的带宽，如果有些IP路由器支持IP包头的压缩，那么带宽损耗可以降低到2～3kb／s左右。

——在实际选择语音压缩的算法时，要综合考虑各种因素。例如，高比特率可以保证良好的话音品质，但要占用大量存储空间，耗费更多的系统资源；而过低的比特率又会影响话音的品质和增加延迟。所以在较低比特率的前提下保持较好的话音质量，是选择压缩算法的原则。

——目前H.323 v2选择G.723.1作为缺省的话音编码标准。

三、IVR技术

——IVR（Interactive Voice Response）即交互式语音应答，可以提高呼叫服务的质量并节省费用。随着技术的进步，IVR也有了一定的发展，可以根据用户输入的内容括放有关的信息，可以是操作提示也可以是具体的信息内容。

——在IP电话中使用的IVR经历了从集中到分布的过程，分布式IVR采用加入智能网关的功能，使得原本远程发送的语音提示信息现在只需要在本地发送，从而既减少了开销又提高了服务质量。下面将分别介绍集中式IVR和分布式IVR。

1.集中式IVR

——IP电话在提供国际电话卡长途服务时，由于大部分传递节点不是在每个国家都有物理上存在的，而有的是在逻辑上存在的，因此必须从国外的传递节点租用带定。目前的电话，所有计费功能、主叫识别以及与电话卡相关的用户提示信息都必须集中处理，这是由于网关缺乏像集中电话网中提供的IVR和计费功能之类的智能特性。在集中式的结构下，国际电话呼叫从“请输入电话卡号和PIN号”和“输入要呼叫的号码”开始，直到按通电话为止，每处理上个国际电话卡业务至少要三次访问中央数据库系统，每个用户的提示信息必需从中央IVR系统发出，并且每次用户响应也要送回IVR系统。IP电话的开办是为了节省费用，但在网络上往返式地传送提示信息造成了大量的开销。传递节点的租用带宽，主要是为了传递语音而用的，但同时也必须为传送语音提示信息而
提供相当大的开销，而且语音提示信息还会拥塞网络，为了保证语音质量，就得提供更多的带宽。在实际应用中，看似很少的语音提示开销能导致很大的损失，这就是集中式IVR的缺点。

——有一种方法可以避免这、问题，即把传统语音提示的功能和特性分布到基于IP的网络中去，这就是分布式的IVR体系。

2.分布式IVR系统

——为了节省提供语音提示而产主的往返传送开销，传递节点把IVR的中央控制功能分散到各个节点。在分布式的体系结构下，通过把IVR功能集成到IP电话网关，要求输入用户电话卡号之类的语音提示就可以实现本地处理。

——用一种简单的控制语言配置网关，使它具有发出语音提示、电话卡核实和拨号处理功能。这样，只有远距离的长途语音信息以语音的方式在IP网络上传送。在此之前，像“请输入卡号”这样的提示信息都由中央控制，因而它们都必须以实际的语音传送。有了集成化的IVR后，中央控制部分把IP信息发送给局域网网关，局域网网关的IVR根据中央控制部分IP信息所表示的指令发送给用户语音提示信息。因为语音提示信息都保留在本地，因而不需要在广域网甚至国际网上传输。广域网上需要传送的只是很小的用于告诉局域网网关该发什么提示信息的IP包，这样节省了大量的带宽资源。

——把功能分布到网关上会有一定的开销，但能带来更大的收益。分布式IVR具有以下优点：

——（1）低代价

——分布式IVR能节省大笔的开销。首先它消除了迂回路由，正是迂回路由使得带宽费用居高不下。如传递节点建在美国，而持卡人在意大利打电话到阿根廷，那么该呼叫必须先返回到美国，每次传递节点都要为自己的节点上的远距离流量传送付费。

——在分布式IVR使用之前，传递节点只能通过在每个国家放置交换设备实现传送功能。可以想象，这样做代价多么昂贵。有了分布式IVR后这些选择都可以在本地做，因而可以充分利用最小代价路由（LCR）。

——同时，还有一种“软节省”。一方面，每个节点不用要独享资源，节省了投资，另一方面，由于呼叫路由具有根强的灵活性，传递节点可以充分利用本地呼叫路由计划和最小代价路由（LCR）计划减少开销。呼叫可以很快而且以较小的代价完成。

——（2）较高的语音质量

——可以不必经过中央处理，直接在本地控制呼叫，在节省费用的同时也提高了语音质量。在两个节点之间采用最短路由传输，减少了话务包的压缩和解压的次数，这样使得呼叫可以快速传输，从而保证了每个呼叫的完整性。

——（3）整个网络的可靠性提高

——把IVR加入到IP电话网关是一种提高整个网络可靠性的策略。与基于PC的网关和路由器不同，真正传递节点的网关采用双机平行处理结构，从而保证数据是冗余的，当其中一个不能正常工作时，网关也能正常运转。

——随着IP电话基础结构的不断发展，高级网关和网络的分布智能化也不断使得服务质量提高。同时，IVR广泛应用于IP电话，将对IP电话起到巨大的推动作用。

——由以上的介绍可以看出，近期IP电话技术发展非常迅速，各研究机构、国际标准组织、产品制造商等纷纷投入到IP电话相关技术的开发中，使之很快就达到了商用的程度。

评论排行

专题

呼叫中心系统性能测试: 　[详细]

上海电信云呼叫中心: 　叫中心成立于1995年，在宋主任的领导下，主旨一切服务...[详细]

云计算不再是“浮...: 　[详细]

中国电信天翼开放...: 2012年3月27日，中国电信在北京召开了主题为汇众智翼...[详细]

IP电话的关键技术

评论排行

推荐阅读

专题

文章排行