第壹現場語音喚醒的意思就是妳的手機或者其他設備帶有語音的功能,妳可以使用特定的語音,將手機或者是其他設備啟動,比如小安,小明,具體可以在設置中更改,他就會出現回應。喚醒後可以進行撥打電話,或者叫他打開某個應用程序,例如讓他放壹首音樂說出歌曲名字等。
語音喚醒性能
喚醒率:將連續語流中存在的喚醒詞檢測出來,這個和語音識別的識別率有壹定的相似性。
誤喚醒率:連續語音中不存在喚醒詞,但是將壹些其他語音誤判為喚醒關鍵詞。
常用的實現方式:dnn+hmm(深度神經網絡+隱馬爾科夫模型),lstm+ctc(長短時記憶網絡+全連接時序分類模型)。
目前業界軟件喚醒方案,也即提供SDK,實現喚醒功能壹般分為在線和離線版本。國內主要以科大訊飛與百度為代表。喚醒率總體超過95%(這個只能參考,具體看測試場景)。網上也有多種開源的小型語音識別引擎,可以實現單獨的語音喚醒功能,性能參差不齊。