視頻分析(video analyzing)是用計算機從視頻中通過運算和分析,提取視頻中有用信息的一項技術。對計算機來說,視頻圖像只是一個數據數列,一個包含每一幀每一個像素點的灰度值或彩色值的數列,其目標信息包含在那些像素點的值所組成的平面圖像序列中,是需要從“整體”上進行“理解”才能獲得的。而視頻分析技術便是通過特定的核心算法程序提取視頻信號中所包含的內容信息或個體運動信息,以實現計算機對于視頻的理解—— “明白”視頻中所展現的內容或者發(fā)生的的事情,即“事件”。
視頻分析技術范圍很廣,只要是從視頻中通過運算處理,提取有用信息的方式都可稱作視頻分析技術。目前發(fā)展相對成熟并形成產品投入實際項目應用的技術,如車牌識別技術、視頻檢索技術、視頻人臉檢測等,皆可歸為“視頻分析技術”。嚴格來講,這類技術原本只是視頻分析技術中較為粗淺的一部分,不過由于它們已被較好地挖掘和應用,出現一些專門的稱謂,才被單獨提了出來。當前,通常所說的視頻分析技術一般特指從視頻中目標運動行為的分析、提取和識別,它常用于安防監(jiān)控領域,其所指稱的范圍比之字面含義已有大幅縮小。
視頻分析技術運作流程是:首先使得計算機知道視頻中“發(fā)生的是什么事”,再將其與對應的規(guī)則相比對和判斷,由此計算機即可斷定事件的特性。從視頻中個體運動行為的分析、提取和識別角度來看,即令計算機判斷出這些個體進行了一些什么行為,進而能夠判斷這些行為是否符合某些規(guī)則,是否屬于“某一類型”的行為。一旦出現的行為或事件不符合相應的規(guī)則,即刻發(fā)出告警信息,從而擺脫人工的干預和判斷,實現令計算機“代替”人進行監(jiān)控,也即實現了自動監(jiān)控或“智能監(jiān)控”。
實際上,智能視頻分析技術,起源于計算機視覺技術。計算機視覺(ComputerVision)技術,是人工智能(ArtificialIntelligent)研究的分支之一,它能夠在圖像及圖像描述之間建立映射關系,從而能夠通過數字圖像處理和分析來理解視頻畫面中的內容。計算機視覺技術可分為低層視覺技術(Low-level Vision)與高層視覺技術(High-level Vision)。低層視覺技術要解決特征提取、運動檢測、多目標根蹤等基本問題;高層視覺技術要解決對場景的語義理解,如目標運動軌跡的判別,異常行為異常事件的最終結論等。因此,在計算機視覺領域中,一個最根本的問題就是如何從底層原始視頻數據得到高層的語義理解,而智能視頻監(jiān)控技術中的智能視頻分析技術的研究正是緊緊圍繞這個基本問題,其研究范圍不是僅局限于某個特定問題,而是涉及到計算機視覺中從底層到高層的許多基本問題。
智能視頻監(jiān)控技術主要是對視頻自動進行分析,從視頻中提取關鍵信息,發(fā)現與識別異常的感興趣事件,從而可以替代人為監(jiān)控或者協(xié)助人為監(jiān)控。顯然,視頻分析與識別涉及到復雜的軟件算法,它可以通過編程識別出奇怪與異常的行為。視頻內容分析與識別軟件能通過分析現場或記錄的視頻流,檢測識別出可疑的活動、事件或者行為模式。視頻監(jiān)控系統(tǒng)的智能化是指在不需要人為干預的情況下,系統(tǒng)能自動實現對監(jiān)控畫面中的異常情況進行檢測、識別,并及時作出預/報警。
視頻分析技術通常采用背景減除技術來進行圖像變化的檢測(如入侵、丟包、逆行等都是一種模式的圖像變化),即對視頻幀與基準背景圖像進行比較,相同位置的像素(區(qū)域)變化則認為是變化了的區(qū)域,對這些區(qū)域進一步處理、識別、跟蹤,得到包括目標位置、尺寸、形狀、速度、停留時間等基本形態(tài)信息和動態(tài)信息,完成目標的跟蹤和行為理解之后,也就完成了圖像與圖像描述之間的映射關系,從而使系統(tǒng)進一步進行規(guī)則判定,直到觸發(fā)報警。
目前,普遍使用的運動目標檢測方法就是背景減除法,其算法雖較簡單,但仍然會受到光線、天氣等自然條件及背景自身變化(海浪、云影、樹葉搖動等情況)的影響。針對不同的天氣以及自然干擾,已應用有多種附加算法(過濾器)來彌補這些干擾。隨著光電圖像處理技木及微電子技術的發(fā)展,相信智能視頻分析技術會進一步成熟。
從廣義上來說,也可以把智能視頻分析技術分為如下三類。
視頻分析類
該類主要是在監(jiān)控圖像中找出目標,并檢測目標的運動特征屬性。如目標相對的像素點位置,目標的移動方向及相對像素點移動速度,目標本身在畫面中的形狀及其改變。根據以上的基本功能,視頻分析可分為以下幾個功能模塊。
· 周界入侵檢測、目標移動方向檢測;
· 目標運動、停止狀態(tài)改變檢測;
· 目標出現與消失檢測;
· 人流量、車流量統(tǒng)計;
· PTZ自動追蹤系統(tǒng);
· 系統(tǒng)智能自檢功能等。
視頻識別類
該類包括人臉識別、步態(tài)識別與車牌識別,其主要技術是在視頻圖像中找出局部中一些畫面的共性。如人臉必然有兩個眼睛,如果可以找到雙目的位置,那么就可以定性人臉的位置及尺寸(在現有技術條件下,人臉識別系統(tǒng)必須在雙目可視的情況下,才可進行人臉比對)。視頻識別類其主要包括。
· 人臉識別系統(tǒng);
· 步態(tài)識別系統(tǒng);
· 車牌識別系統(tǒng);
· 照片比對系統(tǒng);
· 工業(yè)自動化上的零件識別即機器視覺系統(tǒng)等。
視頻改善類
該類主要是針對一些不可視、模糊不清,或者是對振動的圖像進行部分優(yōu)化處理,以增加視頻的可監(jiān)控性能。具體包括。
· 紅外夜視圖像增強處理;
· 車牌識別影像消模糊處理;
· 光變與陰影抑制處理;
· 潮汐與物體尺寸過濾處理;
· 視頻圖像穩(wěn)定系統(tǒng)等。