動態(tài)視頻目標檢測技術(shù)
傳統(tǒng)電視監(jiān)控技術(shù)只能達到“千里眼”的作用,把遠程的目標圖像(原始數(shù)據(jù))傳送到監(jiān)控中心,由監(jiān)控人員根據(jù)目視到的視頻圖像對現(xiàn)場情況做出判斷。智能化視頻監(jiān)控的目的是將視頻原始數(shù)據(jù)轉(zhuǎn)化為足夠量的可供監(jiān)控人員決策的“有用信息”,讓監(jiān)控人員及時全面地了解所發(fā)生的事件:“什么地方”,“什么時間”,“什么人”,“在做什么”。將“原始數(shù)據(jù)”轉(zhuǎn)化為“有用信息”的技術(shù)中,目標檢測與跟蹤技術(shù)的目的是要解決“什么地方”和“什么時間”的問題。 目標識別主要解決“什么人”或“什么東西”的問題。行為模式分析主要解決“在做什么”的問題。
動態(tài)視頻目標檢測技術(shù)是智能化視頻分析的基礎(chǔ)。本文將目前幾種常用的動態(tài)視頻目標檢測方法簡介如下:
背景減除
背景減除(Background Subtraction)方法是目前運動檢測中最常用的一種方法,它是利用當前圖像與背景圖像的差分來檢測出運動目標的一種技術(shù)。它一般能夠提供相對來說比較全面的運動目標的特征數(shù)據(jù),但對于動態(tài)場景的變化,如光線照射情況和外來無關(guān)事件的干擾等也特別敏感。
實際上,背景的建模是背景減除方法的技術(shù)關(guān)鍵。最簡單的背景模型是時間平均圖像,即利用同一場景在一個時段的平均圖像作為該場景的背景模型。由于該模型是固定的,一旦建立之后,對于該場景圖像所發(fā)生的任何變化都比較敏感,比如陽光照射方向,影子,樹葉隨風(fēng)搖動等。大部分的研究人員目前都致力于開發(fā)更加實用的背景模型,以期減少動態(tài)場景變化對于運動目標檢測效果的影響。
時間差分
時間差分(Temporal Difference 又稱相鄰幀差)方法充分利用了視頻圖像的特征,從連續(xù)得到的視頻流中提取所需要的動態(tài)目標信息。在一般情況下采集的視頻圖像,若仔細對比相鄰兩幀,可以發(fā)現(xiàn)其中大部分的背景像素均保持不變。只有在有前景移動目標的部分相鄰幀的像素差異比較大。時間差分方法就是利用相鄰幀圖像的相減來提取出前景移動目標的信息的。
讓我們來考慮安裝固定攝像頭所獲取的視頻。我們介紹利用連續(xù)的圖像序列中兩個或三個相鄰幀之間的時間差分,并且用閾值來提取出視頻圖像中的運動目標的方法。我們采用三幀差分的方法,即當某一個像素在連續(xù)三幀視頻圖像上均有相當程度的變化(及大于設(shè)定的閾值時),我們便確定該像素屬于運動目標。時間差分運動檢測方法對于動態(tài)環(huán)境具有較強的自適應(yīng)性,但一般不能完全提取出所有相關(guān)的特征像素點,在運動實體內(nèi)部容易產(chǎn)生空洞現(xiàn)象,只能夠檢測到目標的邊緣。 而且,當運動目標停止運動時,一般時間差分方法便失效。
光流
基于光流方法(Optical Flow)的運動檢測采用了運動目標隨時間變化的光流特性,如Meyer 等作者通過計算位移向量光流場來初始化基于輪廓的跟蹤算法,從而有效地提取和跟蹤運動目標。該方法的優(yōu)點是在所攝場所運動存在的前提下也能檢測出獨立的運動目標。然而,大多數(shù)的光流計算方法相當復(fù)雜,且抗噪性能差,如果沒有特別的硬件裝置則不能被應(yīng)用于全幀視頻流的實時處理。
當然,在運動檢測中還有一些其它的方法,如運動向量檢測法,它適合于多維變化的環(huán)境,能消除背景中的振動像素,使某一方向的運動對象更加突出的顯示出來。但是,運動向量檢測法也不能精確地分割出對象。[nextpage]
動態(tài)視頻目標跟蹤技術(shù)
在傳統(tǒng)監(jiān)控系統(tǒng)中,目標跟蹤是由監(jiān)控人員手工操作來完成。由于所有的目標的運動特性是非線性的,其速度和方向都在隨時發(fā)生改變。即使目標的速度、方向不變,但它與攝像機的距離也在變化,從而引入很強的非線性因素,因而用人工操作的方法來實現(xiàn)控制非常困難。
智能化視頻監(jiān)控技術(shù)提供有效的目標自動跟蹤的工具,在用計算機自動處理視頻流的過程中,如發(fā)現(xiàn)和跟蹤感興趣的目標,就提示監(jiān)控人員加以關(guān)注,并可以控制靈巧快球攝像機,對移動目標實現(xiàn)自動跟蹤。下面我們簡述典型的目標跟蹤算法的幾個步驟。
目標運動軌跡假設(shè):軌跡的交合與分離
在目標軌跡跟蹤問題中,一般有五種基本情況:
1、有一個運動檢測區(qū)域存在,但與任何已知目標都不匹配。在這種情況下,我們需為其創(chuàng)立一個新的目標模型,但它的可信度值比較低。
2、有一個已知目標與任何一個運動檢測區(qū)域都不匹配。在這種情況發(fā)生的可能性包括:在該目標已移出圖像視場,該目標被其他目標遮擋,或該目標未被檢測出來。在這種情況下,該目標的可信度值也比較低。
3、有一個已知目標與一個運動檢測區(qū)域完全匹配,這是目標軌跡跟蹤問題中的一種最好情況。將該目標的運動軌跡模型更新,并增加其可信度。
4、有一個已知目標與多個運動檢測區(qū)域都匹配。發(fā)生這種情況的可能性包括:一個目標分裂成為多個獨立目標(例如一輛車里出來多個人,或一個多人組合各奔東西),或者目標檢測中的聚類算法未能將同一個目標的像素正確地聚為一個目標。在這種情況下,我們可以根據(jù)相關(guān)函數(shù)的值來選擇一個最好的區(qū)域作為目標的新位置。
5、多個目標與一個運動檢測區(qū)域匹配。發(fā)生這種情況的可能性包括:兩個目標互相遮擋,兩個目標交合(例如多個人上了一輛車,或多個人組合成為一個組),或者是由于聚類算法的失誤而分類的同一目標的兩部分重新歸為一個。 在這種情況下,需要對該目標的以前的軌跡做一分析。比如這兩個目標以前一段時間內(nèi)的軌跡重合或很相似,則可以將他們合為一個目標。否則,需要將他們按兩個獨立目標分別對待。
更新目標軌跡模型
根據(jù)目標匹配的情況對目標模型的參數(shù)進行更新。更新后的目標位置由相關(guān)函數(shù)計算到亞像素精度。更新后的速度經(jīng)一個IIR濾波器得出。
消除誤報
任何一個高性能和高可靠性的目標跟蹤系統(tǒng)都需要處理誤報問題。視頻圖像中存在的噪聲,隨風(fēng)飄動的樹葉等等,都會引起目標檢測與跟蹤系統(tǒng)的誤操作。一個較為可行的消除誤報的方法是檢查其持續(xù)性,因為一個持續(xù)出現(xiàn)的檢測信號要比偶爾出現(xiàn)一次的信號更有可能成為有效的目標;另外一個可以用來消除誤報的方法是檢查目標的目的性,來回晃動的樹葉并不具備目的性,而運動的人或車輛會向一些特定的目標移動。
以上介紹的主要是單路視頻圖像的目標跟蹤問題。在實際監(jiān)控系統(tǒng)中,往往同一個人或目標出現(xiàn)在多個攝像機的視場里。如何將與此目標相關(guān)的各個攝像頭采集的視頻圖像關(guān)聯(lián)起來,根據(jù)物體的運動情況,形成其運動軌跡,并自動發(fā)送PTZ 控制指令,使攝像機能夠自動跟蹤物體,尤其在物體超出該攝像機監(jiān)控范圍之后,自動通知物體所在區(qū)域的攝像機繼續(xù)進行追蹤。這才能使目標真正獲得了跟蹤。
結(jié)語
上面簡要地介紹了動態(tài)視頻目標檢測和跟蹤技術(shù)的基本問題,作為拋磚引玉。其目的是引起安防技術(shù)人員的關(guān)注和研究,若有商榷之處,歡迎共同商討指正。