以人臉識別技術為核心的視頻監控時安防行業的主要應用,這種我們無需多談,但未來我們是否也能腦洞大開,用智能語音技術輔助人臉識別,使得視頻監控更為智能化。市場都在談語音識別技術,但很少有企業注意,聲紋識別以及語音情感識別也歸屬于智能語音技術。
聲紋識別也稱說話人識別,通過將聲信號轉換成電信號,再用計算機進行識別。可具體分為說話人辨認和說話人確認。在不同場景,聲紋識別技術的選擇不同,如縮小刑偵范圍時可能需要辨認技術,而銀行交易時則需要確認技術。
語音情感識別是情感識別的方式之一,是指由計算機自動識別輸入語音的情感狀態。計算機通過傳感器對不同聲調表情的語言信號,在時間構造、振幅構造、基頻構造和共振峰構造等特征方面的構造特點和分布規律進行測算和分析,從而識別出所有語言聲調中所隱含的情感內容。
盡管當前人臉識別技術的識別率高達99%甚至是99.9%,但剩下的1%甚至0.1%卻是當前科技無法攻克的難題。想象一下,如果在當前具備人臉識別的視頻監控系統中加入聲紋識別和語音情感識別技術,形成的聲像融合技術(讀唇),即使目標受眾處于無聲狀態,也能對其思想及行為進行預測和識別,當前的視頻監控系統是否也將提升到一個新的智能化高度,真正做到“防患于未然”。
不可否認,由人臉識別、聲紋識別以及語言情感識別形成的多模態交互系統,應該能安防行業打開不少新應用大門。
(本文轉載電子發燒友網,如有侵權,請聯系刪除)