新闻中心/NEWS
壹鸽科普:壹鸽科技说话人实时性别检测技术
2019-10-29 09:48:54
壹鸽科技已经开发了一种低复杂度(纯时域计算)、强抗噪的可固化在发送语音数据端侧(如语音端点检测VAD模块)上的实时说话人性别检测技术,在四种语料上进行了测试,测试结果如下:1)基于AISHELL-1数据集进行测试
- 男声文件:8448
查全率:0.916717473
- 女声文件:11460
查全率:0.964610361
2)基于aidatatang_200zh数据集进行测试
- 男声文件:113830
查全率:0.95279695
- 女声文件:123823
查全率:0.956799199
3)基于Mozilla Common Voice zh-TW数据集进行测试
- 男声文件:15247
查全率:0.934261765
- 女声文件:14192
查全率:0.925590607
4)基于实际电话信道语音数据集进行测试
- 男声文件:1500
查全率:0.892666667
- 女声文件:1500
查全率:0.928619079
机器对说话者的性别属性进行分析,可以通过收到的音频数据判定发音人的性别(男,女,中性),建议检测音频中发音人连续发音时间持续1.5秒左右,音频太短会影响识别效果。
应用场景:
客户画像分析:对于电话客服接到的客户音频信息,可以进行声音特征分析,便于构造用户画像。
PS:高复杂度版本说话人性别检测效果更佳。
声学识别: