灵云语音合成(TTS)技术
捷通华声是国内最早从事中文语音合成研究与应用的企业,灵云语音合成技术在国内处于绝对领先地位,市场占有率达50%以上。
- 灵云语音合成效果自然、流畅、清晰,MOS值达4.6以上。
- 支持中文普通话、粤语、维语、英语、日语、德语、法语等多语种。
- 满足多种音色的应用需求。
- 支持平台级和嵌入式语音合成。
灵云语音识别(ASR) 技术
捷通华声凭借在语音产业扎实的技术积淀,灵云语音识别技术已经达到国内一流水准,识别率达90%以上。
- 识别率高:连续语音识别率可以达到90%以上。
- 识别速度快:采用实时识别方式,实现语音数据的传输和识别的同步,实时率可达0.5以下。
- 可定制:定制模型的识别率可达到95%以上。
- 支持词表识别、语法识别和自由说识别。
- 支持云端识别和本地端识别。
灵云手写识别(HWR)技术
捷通华声作为国内最早提供手写识别技术与产品的公司,灵云手写识别技术处于国内绝对领先地位,市场占有率接近50%。
- 支持单字识别,中文识别率高达99%。
- 支持行写/叠写,全句识别,识别率高达90%。
- 单字识别支持92种语言,行/叠写支持中、日、韩、英等多国语言。
- 中文支持GBK字符集、GB18030字符集和香港增补字符集。
- 支持混合输入中文、字母、数字。
灵云光学字符识别(OCR)技术
捷通华声具有深厚的图像识别研究基础,灵云OCR技术水平在国内处于领先地位。支持文档识别、票据识别、证照识别、条码识别、车牌识别等多种应用领域。
- 支持中文简繁体、纯英文识别,识别率达到99%以上。
- 支持多语种、多字体、多字号识别。
- 支持扫描识别和拍照识别。
- 完善的图像预处理功能,支持图像二值化,版面分析,倾斜校正,表格检测等。
灵云自然语言理解(NLU)技术
灵云自然语言理解技术,处于国内领先水平。支持多领域,支持上下文语义分析,理解准确率高,拒识率高,误识率低,支持用户自定义词典、同义词和敏感词,支持web、微信、微博和短信等多种接入方式,支持后台知识库的数据挖掘。已广泛应用于智能客服、车载导航、智能家居、穿戴式设备等领域。
- 中文分词准确率97%以上,支持用户自定义词典。
- 强大的语义理解能力,智能客服类应用领域准确率95%以上,通用问答及意图理解应用领域准确率85%以上。
灵云声纹识别(VPR)技术
灵云声纹识别技术通过提取说话人的语音身份特征,提供声纹鉴别和声纹确认两类高精准的说话人识别,可广泛应用于国家安全、公安侦查、银行密码、智能门禁和娱乐增值等领域。灵云声纹识别技术具有高性能与可靠的稳定性,满足平台级、电信级用户的应用需求,具备大规模应用的负载能力,为用户提供信息保护、个性化的需求。
- 稳定性强:具有国内领先的抗噪音、抗信道干扰能力。
- 识别率高:根据实际应用场景,可自动设定特定词、非特定词识别方式。