文章摘要: 它可以通過聲紋識別技術識別語音中存在的涉黃、廣告等違規資訊
科技日報北京8月19日電 (記者劉園園)人工智慧鑑黃技術正從傳統的圖片、視訊、文字,趟進語音鑑黃這片藍海。記者19日獲悉, 阿里 AI語音反垃圾服務上線公測,它可以通過聲紋識別技術,識別語音中存在的涉黃、廣告等違規資訊。
這項服務不僅可以識別中文、日文、英文、俄文等多國語言,還可以識別湖南、湖北、河南、東北、四川、廣東等地方言。
在日常生活中,阿里AI語音鑑黃服務支援離線檔案和實時語音流。阿里安全部技術人員介紹,對那些有語義的內容,系統先將語音識別轉成文字,然後再將這些文字跟文字反垃圾模型或關鍵詞庫比對,判斷是否涉黃。對那些無語義的聲音,通過聲紋也能識別出來。
當然,識別多國語言和多地方言的能力,需要進行訓練學習。「可以把它想象成一個機器人,像一個小孩,需要不斷的餵養、訓練、學習,它才具備這樣的能力。」阿里安全部技術人員介紹,比如廣東話,可以用一些粵語電視劇來訓練學習。
今年6月,全國掃黃打非辦通報,多個網路平臺上存在以ASMR(即自發性知覺經絡反應,主要產品為聲音內容,用於放鬆、助眠)形式傳播低俗甚至淫穢色情的問題。解決類似這種社會問題,人工智慧語音鑑黃技術未來大有可為。