文章摘要: 7.0%(和說話者無關的條件)允許使用者在沒有語音洩漏的情況下進行說話和錄音
原標題:微軟研究院正在開發一種識別靜音語音命令的技術
微軟一直致力於開發一種新的語音輸入介面,允許使用者在沒有語音洩漏的情況下進行說話和錄音。該研究由微軟研究院進行,並在UIST 2018中進行了介紹。該模組名為SilentVoice,可以捕捉來自口腔的空氣並記錄聲音而不會打擾周圍的人。此外,該模組還將過濾周圍的語音,因此即使有外界干擾,使用者也可以捕獲清晰的語音。
SilentVoice是一種新的語音輸入介面裝置,所提出的「漸進式語音」方法使得能夠將麥克風放置在非常靠近嘴的前部而不受環境噪聲的影響,捕獲具有良好訊雜比非常柔和的語音。它實現了超小(低於39dB)的語音洩漏,允許使用者使用語音輸入,而不會在公共和移動情況下以及在辦公室和家庭中煩擾周圍的人。
通過測量氣流方向,SilentVoice可以很容易地與正常話語分離,準確率為98.8%,它可以用於帶有經過專門訓練的語音識別器的語音啟用系統,評估其單詞錯誤率(WERs)為1.8%,(依賴說話者的條件),7.0%(和說話者無關的條件)。
該技術仍處於研究階段,但肯定會幫助人們在不打擾周圍人的情況下工作並且錄製語音。返回搜狐,檢視更多
責任編輯: