云端语音识别

　　语音识别是将语音即时的转换成文字，而这音源是源自麦克风或是其它的音讯来源，将其音讯传送到伺服器运算处理或是本地运算辨识。而当将音讯传送到伺服器时，可得到回传的辨识结果，例如文字或是解析音讯的意图；例如“台北市的天气“等等。而当应用程式回应使用者时，此时需要将文字转换成语音。

　　在将语音串流进入辨识前，需要做杂音抑制处理，如果这部分没有处理好，会降低系统的辨识率；例如在安静的环境下，辨识率是很高的，而在杂音较多的地方，是不是也能确实做到语音识别呢？

　　如何的保持声音的品质呢？将噪音消除，可以透过降噪的处理方式，如下图:

　　在降噪的技术里有Feedback ANC及Feed-Forward ANC等等，而这噪音的调校又会跟本身的机构、麦克风的位置、方向是息息相关，缺一不可。

　　当正确取得声音串流时，后续就是选择语音的辨识伺服器，以Google所提供的平台为例，它提供了一系列的Cloud Speech API，让使用者可以轻松的应用语音识别的控制。

　　而将声音串流录制并传送到伺服器及进行本地的语音回应输出、控制；这时你需要一个强而有力的控制平台，想当然尔，大多数会选择Linux平台，可以快速的取得相关的资源并连结网路，所以在挑选Linux开发平台时，最重要的要确认平台是否有持续支援Linux main line，这是一个非常重要的指标，以确保你的Linux平台是可以持续的支援新的Linux版本。

　　Microchip的产品SAMA5D2系列提供Linux开发平台及及丰富周边控制模组，让你可以快速的建立产品应用。而为了缩短使用者的开发时间，也提供SoM的开发平台，这可以大大的降低使用者的开发时间及硬体的设计难度。

　　未来全球语音识别市场将会变得更加多样化，同时软体准确度上会有大幅提升。

　　在医疗领域的应用：

　　不仅是简单的通过智慧手表追踪运动情况和心率，还有直接根据人的身体状况匹配相应的服务如合适的餐厅或食物等，当然这些大多是基于穿戴式设备的。另外他们还考虑到更多场景，诸如紧急语音求助，医患对话存档，呼叫中心的对话听写等。由于医疗领域词汇库专业性强演变性弱，只要建立完整的数据库，就可以做到对疾病名称、药品名称相对精确的识别。

　　在智慧车载的应用：

　　行车安全问题上一直聚焦了很多目光，去年有人曾经设计出一个车载屏幕，可以利用多指的简单手势解决司机操作触控萤幕过度分散注意力的问题。通过将车载平台与手机连接，可以帮用户实现语音控制GPS导航，讯息收发，电话接打，社群网路更新等等。

专题

诚挚邀您参加方位...: 　　时间：5月24日 13：30-17：30　　地点：上海市浦东...[详细]

2017 Genesys G...: 　　欢迎加入Genesys大中华区年度客户体验盛会。2016，...[详细]

CCEC2017主题演讲: 由中国领先的信息与通信技术行业网站CTI论坛主办的2017...[详细]

CeBIT 2017-数字...: 一年一度的国际顶级盛会CeBIT 2017在德国汉诺威如期举...[详细]

评论排行

推荐阅读

专题

大家都在看