首页>>>技术>>>语音应用>>>语音合成(TTS)  语音合成产品

语音应用技术实现人性化沟通

刘德明 2002/08/19

  语音,作为人类最自然的交流方式,正以其不可阻挡的强劲势头融入到网络系统中。在国外市场,以Tellme.com和Nuance 、SpeechWorks为代表的企业异军突起,倡导人性化的语音上网服务。随后Yahoo、Lycos等著名互联网公司纷纷进入相应的服务领域,建立大规模的语音门户网站,AOL则提供所谓AOL-By-Phone服务。除了在互联网的应用之外,现在很多呼叫中心开始利用语音应用技术实现更加人性化的沟通。

  从技术角度看,语音识别技术、文语转换技术已经从实验室逐步走向成熟,其算法的复杂性也逐年下降,从而使这些技术逐步在市场中得以应用。

  语音技术在计算机领域中的关键技术是语音识别技术和语音合成技术。语音识别技术(ASR :Automatic Speech Recognition ),是指将人说话的语音信号转换为可被计算机程序所识别的文字信息,从而识别说话人的语音指令以及文字内容的技术。目前关于中文语音识别的研制和开发的厂商有:Speechworks、Nuance、Philips、Microsoft、IBM、L&H(已解体)、Infotalk、中科模式识别、天朗、得意音通、安可尔通信、声硕科技等。而语音合成技术(TTS :Text to Speech ),是指将文本信息转变为语音数据,以语音的方式播放出来的技术。目前关于中文语音合成的研制和开发的厂商有:捷通华声、炎黄新星、Infotalk、科大讯飞、IBM、Microsoft等。

  类似于互联网上的Web 浏览技术,语音浏览技术是以一种XML 标记语言为数据载体,通过各种网络数据传输协议,而以Client/Server 的方式为语音浏览器所解析,通过语音的方式呈现给用户。这类似于Web与IE浏览器的概念,只不过IE以图像的方式在显示器上将信息呈现出来,而语音浏览器则以语音的方式在电话、手机或其它语音手持设备的通道中呈现。IE 接受用户的鼠标和键盘指令,而语音浏览器接受用户的说话为指令。目前,已经有厂商开始将语音浏览技术应用于呼叫中心,在当今以厂商为中心的模式中,主叫用户只能以挂断电话的方式来"摆脱"某一企业的按键式交互语音应答(IVR)系统,而在未来以用户为中心的模式中,主叫用户可与语音浏览展开交互式对话,可以像网上冲浪般快捷、方便地从一家企业自由地 跳到另外一家企业。

  语音应用技术是语音技术、语音浏览技术、智能文字信息处理技术等技术的集合,它是跨接在以语音为核心的电话网络和以数据为核心的互联网络两者之间的一座桥梁,使人们可以自由地以对话方式与机器和远端语音服务器交谈,以语音的方式命令机器为自己服务。

赛迪网 中国信息化(industry.ccidnet.com)


相关链接:
中文信息处理的主流技术是什么? 2002-07-08
解决语音门户 2002-06-17
比尔-盖茨能讲中文? 微软语音技术大"探秘" 2002-05-09
语音合成技术: 启动“第三种引擎” 2002-04-02
构建更加人性化的交谈式语音应用 2002-03-11

分类信息:  语音合成TTS_与_语音识别ASR     文摘   网络文摘   技术_语音合成_文摘   技术_语音识别_文摘