首页 > 新闻 > IT与互联网 >

东芝开发出语音区分技术,可快速区分10余人声音

2014-08-29 08:36:54   作者:   来源:日经技术在线   评论:0  点击:4866


  东芝开发出了可用于会议记录等的语音区分软件技术。该软件技术应用于开会等场合时,可以准确区分出10余人的声音。软件可在笔记本电脑及平板终端等移动产品上运行,只要有普通的立体声麦克风就可以使用。该技术将在2014年9月3~5日于日本札幌市举行的日本音响学会2014年秋季研究发布会上发布。
闂傚倸鍊搁崐鎼佸磹閹间礁纾归柟闂寸绾剧懓顪冪€n亝鎹i柣顓炴閵嗘帒顫濋敐鍛婵°倗濮烽崑娑⑺囬悽绋垮瀭濡わ絽鍟粻娑樏归敐鍛础缂佸鑳剁槐鎾诲磼濮橆兘鍋撻悜鑺ュ€块柨鏇氱劍閹冲矂姊绘担鍛婂暈闁荤喆鍎抽幑銏狀潨閳ь剙顕f繝姘亜缁炬媽椴搁弲顒勬⒑閹稿海绠撴繛璇х到鏁堟俊銈呮噺閸嬧剝绻濇繝鍌涘櫣妞わ絽銈搁幃浠嬵敍濞戞ɑ璇為梺璇″枟閻燂妇鎹㈠┑瀣倞闁靛ě鍐ㄥ婵犵數濮烽弫鎼佸磹椤栫偛鐒垫い鎺戝绾惧鏌熼崜褏甯涢柣鎾寸洴閹鏁愭惔鈥茬敖婵犫拃鍐粵闁逛究鍔嶇换婵嬪川椤曞懍鍝楅梻浣告贡閹虫挾鈧氨澧楁穱濠囧箹娴h倽銊╂煥閺冣偓閸庡磭绱為幒妤佲拻闁稿本鐟ㄩ崗宀勬煙閾忣偅宕岀€规洜鏁诲浠嬵敇閻愭鍞甸梻浣芥硶閸o箓骞忛敓锟�...
 

  东芝开发出语音区分技术,可快速区分10余人的声音此次开发的新技术结合“输入声音的特点”和“说话人的方位信息”来区分声音。利用声音特点区分声音时,如果说话的人数增多,声音的特点会随之增多,难以区别。东芝为解决该问题设计的方法是结合说话人的方位信息。就是根据多个麦克风所录音的相位差来推断说话人所在的方位。根据这一信息来提高分辨的准确度。

  对此,存在的问题是需要特殊指向性的麦克风;推断方位的处理量大、计算成本高等。另外,由于难以区分位于同一方位的不同说话人,有时也会影响分辨性能。

  为此,东芝此次开发出了使用普通立体声麦克风的快速且准确的方位推断算法和不影响分辨性能的组合算法。比如,使用配备Core i7(最大工作频率为2.7GHz)CPU和4GB主存的个人电脑,普通会议(参与者为10人左右)在录音结束后5秒左右就能完成分辨处理。分辨成功率(能否准确区分说话人声音)方面,原方法为50%左右,而新技术达到了70%以上。

  新技术计划在2014年度内完成。将嵌入到会议记录辅助软件等产品中。新技术不含语音转换(如将内容做成文字数据)功能,所以有可能与该公司的语音识别技术配套提供。

相关阅读:

分享到:           收藏

专题