
Google上周开源了语音命令资料集( Speech Commands Dataset),可望加速开发人员打造支援语音命令的各种应用。
此一语音命令资料集是由数千名不同的使用者念出30种命令文字,迄今总计采集了6.5万个只有1秒的语音档。这些文字涵盖了Yes、No、Up、Down、Left、Right、On、Off、Stop、Go,以及数字等,方便开发人员用来训练应用程式的基本语音介面。
迄今Google已开源多项人工智慧专案,包含机器学习技术TensorFlow、自造者AI专案—AIY,以及用来采集语音片段的Open Speech Recording网路程式。
此外语音命令资料集是由TensorFlow与AIY团队共同建立,以用它来增加TensorFlow的训练与介面样本程式,Google预期开源後的资料集数量将会持续成长,以带来更多不同的口音。