首页>>厂商>>语音识别与合成>> 捷通华声

捷通华声TTS在掌上电脑、信息家电等领域的解决方案

2002/09/01

1. 掌上电脑

1.1 捷通华声TTS在掌上电脑上的应用

  由于掌上电脑的屏幕太小,阅读信息很不方便,这形成了信息获取的一个瓶颈。人们对掌上电脑追求是越来越小巧,但是越小,这个瓶颈就越发突出。虽然各个厂家都在大力发展掌上电脑的应用软件,尤其是互联网应用的软件,使其能够收发邮件,浏览网页,但是面对互联网上的大量信息,如果都通过一个比手掌还小的屏幕去阅读,其难度可想而知。不仅眼睛容易疲劳,不停滚屏也需要很大的耐心。因此,如果我们能够在掌上电脑上应用语音合成技术,通过"听"而不是"看"来读取大量的信息,就可以打破瓶颈的束缚,为掌上电脑的进一步普及提供一个很有力的基础。

  掌上电脑的内存存储容量十分小,而且没有硬盘一类的外部存储设备,这些因素导致了很多在台式微机上得到很好应用的软件无法在嵌入式操作系统环境下运行,TTS系统也是如此。普通的TTS技术需要20M以上的音库才能完成男女声的语音合成,显然不能完成在掌上电脑的应用,而捷通华声公司的TTS具有音库压缩技术和音色转化技术,从而使捷通华声TTS技术在掌上电脑上的应用成为可能。

1.2 捷通华声TTS在嵌入式操作系统应用历程

  三年来,捷通华声公司积累了将TTS技术与其他应用软件相结合的丰富经验("录易"汉语智能输入输出系统),TTS技术向其他硬件系统上移植的核心技术(TTS在电话语音卡上的开发),为我们实现TTS技术向嵌入式操作系统的移植打下了坚实的技术基础,并保持业已形成的领先优势。

  我们成功实现了捷通华声TTS在"天权2000+"上的移植。在"天权2000+"上移植实验的成功表明捷通华声公司已经具备了向嵌入式操作系统移植中文语音技术的能力,为全面进入产品化阶段打下了基础。

  2000年10月,捷通华声公司成功推出国内第一套应用于掌上电脑的语音软件--语音伴侣-CE版。该软件成功实现掌上电脑"开口说话",为解决嵌入式设备获取信息的"瓶颈"难题提供了一套崭新的方案。掌上电脑等嵌入式设备的软件应用已成为现实。

  2001年7月,捷通华声公司推出了目前世界领先的嵌入式TTS汉语语音合成技术,推动了语音技术在嵌入式中应用的发展。

1.3 捷通华声TTS在掌上电脑的解决方案案

  捷通华声公司的TTS技术与其他文语转换系统相比具有独特的音库压缩等特点,使捷通华声TTS技术向嵌入式操作系统的移植(尤其是向PDA上的移植)具备先决条件。据市场调研及考证:捷通华声公司是最早掌握该技术,及最先提出在掌上电脑应用该技术的公司。该系统在2001年中关村电脑节上荣获"十大IT创新产品"。

  捷通华声公司的TTS技术(jTTS),是具有自我版权的TTS技术,以大规模真实录音的语音库为基础,增加音库压缩算法和音色变换算法形成核心技术。此核心技术与国内其他文语转换技术相比较,具有如下特点:

· 系统输出语音清晰度高。
· 系统输出具有非常好的自然度。
· 音库大小可缩扩,小音库仅为1MB。
· 合成速度快。

  正是因为捷通华声TTS具有以上的特点,使得捷通华声公司的TTS技术可以向嵌入式操作系统移植。特别是小音库和音色转换的特点,使得在嵌入式操作系统下不会占用太大的资源。

  捷通华声公司语音合成技术向WinCE操作系统环境下移植的技术已经成熟,进入到应用阶段。库大小为1M,运行空间在2M左右,完全可以满足掌上电脑应用的需要。

  捷通华声公司提供最新的WinCE环境下的语音合成开发工具包(jTTS-ce SDK),掌上电脑应用程序的开发厂商可以利用此SDK在其自己的应用中加入语音合成的功能。另外,捷通华声公司还可提供WinCE版本下的"语音伴侣",提供阅读电子文档和有声闹钟的功能,以供掌上电脑的生产厂家选用。

  目前捷通华声公司已经在不同的操作系统和硬件环境中进行了移植,操作系统包括:Hopen、Linux、Nucleus、WinCE 2.11 (Palm PC)、WinCE 3.0 (Pocket PC, Pocket PC 2002), WinCE .NET、Penbex等;CUP包括:MIPS、DragonBall,、StrongARM、ARM7、X86等。

2. 信息家电

2.1 TTS在信息家电中的应用

  应该说,无论从商业角度还是从促进用户接触互联网的社会意义上来说机顶盒都是很好的概念。然而我们发现机顶盒的销售并不理想。据我们的分析,有声的电视机变成了无声的网络浏览器是用户并不习惯使用的一个很大的原因。我们注意到,多年以来,人们已经习惯将电视机作为家庭生活的一个娱乐中心,图像和声音必不可少,而在目前的机顶盒系统中,人们在电视前默默无声地阅读网页信息。从开始对商品的认织习惯来说,人们对"热闹惯了"的电视机变成了一个"哑口无言"的显示器,可能会很不习惯。因此,引入语音合成技术会对机顶盒的推广有很大地促进作用。

  语音一直是人们生活中最重要的交流手段,在一些新式的信息家电中,也采用了语音的方式来通知用户状态或信息,但一般都是采用录音回放的方式,无法实现对任意文本的阅读。对于需要上网的信息家电来说,所阅读的信息肯定是任意的而非事先固定的。这也正是语音合成技术的用武之地。

  在信息家电中使用语音合成技术的难点和掌上电脑的情况是一样的,需要较小的库和运行内存。

2.2 捷通华声TTS在信息家电中的解决方案

  类似于掌上电脑,在WinCE操作系统下,捷通华声公司已经推出了实用的语音合成技术。捷通华声公司可以向其它厂商提供捷通华声TTS开发工具包(jTTS-ce SDK)。捷通华声公司也将根据不同用户的需求将语音合成技术移植到HOPEN等不同的操作系统中。

  另外,捷通华声公司将会投入精力在语音合成技术的硬件实现上,例如用DSP(数字信号处理)芯片来实现,以便使语音合成技术更好地为信息家电服务。

3. 其它

  我们所列举的嵌入式应用只是几个最具有代表性的领域,类似的嵌入式应用还有很多,如WAP手机、可以讲故事的玩具等。在这些领域中,由于没有操作系统,语音合成主要的实现手段将是芯片技术,这也正是捷通华声公司今后研究的目标之一。

  值得关注的是,捷通华声还同时提供嵌入式手写识别技术和嵌入式语音识别技术,并将它们有机的结合起来,实现一个完整的嵌入式整体解决方案。相信该方案能为今后各类手持设备、信息家电设备提供必不可少的实用功能。

捷通华声公司供稿 CTI论坛编辑



相关链接:
捷通华声发布jASR5.5 ASR价格面前将无怯步 2008-04-16
捷通华声TTS成功登陆中国邮政储蓄银行 2008-04-03
捷通华声 jTTS 5.5 全面支持 MRCPv2标准 2008-03-31
捷通华声移动导航HCI解决方案广受青睐 2008-03-26
身边的“智能”生活 2007-12-28