近年來,人臉識別越來越受到人們的關(guān)注。與此同時(shí),許多研究機(jī)構(gòu)也一直在研究將人臉識別技術(shù)應(yīng)用到監(jiān)控當(dāng)中的方法。如何將人臉識別“植入”監(jiān)控,有何難點(diǎn),本文為您講述一二。
應(yīng)用現(xiàn)狀
自2001年的911事件和2004年的倫敦地鐵爆炸案發(fā)生以來,在視頻監(jiān)控中應(yīng)用人臉識別的呼聲越來越高。圖1給出了美國FRVT2006人臉識別測試發(fā)表的國際上歷年來人臉識別的代表性的性能指標(biāo)。
根據(jù)圖1可以看出,2006年國際上已達(dá)到了在錯(cuò)誤接收率為0.1%時(shí),人臉識別的正確識別率為99%。這確實(shí)是一個(gè)高的技術(shù)指標(biāo),但是,得到這一高指標(biāo)的條件是達(dá)到兩眼距離為450像素的人臉分辨率,同時(shí),還需要可控光照和正面人臉的條件。然而,在普通監(jiān)控條件下,人臉圖像的質(zhì)量遠(yuǎn)遠(yuǎn)達(dá)不到這些可以稱為苛刻的條件。
我們知道,人臉識別分為辯識(identification)、驗(yàn)證(verification)、監(jiān)視目標(biāo)人識別(watch list)三類。辯識是通過未知人的人臉圖像與數(shù)據(jù)庫內(nèi)已知身份的人臉圖像進(jìn)行比對來確定未知人身份的過程,是一對多的人臉識別;驗(yàn)證是通過當(dāng)前被識別人的人臉圖像與數(shù)據(jù)庫中被識別人所聲明身份的人臉圖像的比對來驗(yàn)證被識別人所聲明身份對或錯(cuò)的過程,屬于一對一的人臉識別;監(jiān)視目標(biāo)人識別,是對于一個(gè)未知身份的待測樣本,人臉識別系統(tǒng)探測其是否在監(jiān)視名單上,屬于一對多的人臉識別。圖1所列的指標(biāo)屬于驗(yàn)證的性能指標(biāo)。FRVT2006沒有測試監(jiān)視目標(biāo)人識別的性能指標(biāo),而在FRVT2002發(fā)布的監(jiān)視目標(biāo)人識別的性能指標(biāo)中,最好的成績是虛警率(指不是監(jiān)視名單中的人被認(rèn)定為是監(jiān)控名單中的人的概率)為0.1%時(shí),目標(biāo)人在第一名的正確識別率不到60%(圖庫大小為3000),而實(shí)際場景的性能指標(biāo)將更差。
我們分析當(dāng)前人臉識別成功應(yīng)用的一些實(shí)例,如出入境的護(hù)照查驗(yàn),是清晰照片之間的比對;而應(yīng)用在火車站的治安管理上,被識別人也是在室內(nèi)規(guī)范地站在攝像機(jī)前拍攝人臉。圖2為人臉識別在2008年北京奧運(yùn)中的應(yīng)用實(shí)例,這是一種驗(yàn)證人臉識別,其人臉拍攝的條件相對較好,場景是在大棚內(nèi),被識別人站在攝像機(jī)前(有停留),這是較為典型的應(yīng)用??梢哉f,當(dāng)前人臉識別的成功應(yīng)用,主要是有條件的人臉識別應(yīng)用。
難點(diǎn)及解決方案
在三類識別中,監(jiān)視目標(biāo)人識別是最難的,主要原因在于非主動(dòng)性的識別方式和場景的差異性,姿態(tài)、光照以及年齡、人臉分辨率等方面的變化嚴(yán)重地影響了人臉識別率。許多研究單位一直在研究如何將人臉識別技術(shù)應(yīng)用到監(jiān)控中。筆者認(rèn)為,在當(dāng)前的條件下,首先應(yīng)該考慮的仍然是拍攝到好的人臉圖像。除算法方面的努力外,從系統(tǒng)應(yīng)用本身來看,主要需要解決如下的問題:系統(tǒng)結(jié)構(gòu)問題、人臉分辨率問題、姿態(tài)問題、光照問題和年齡問題。[nextpage]
系統(tǒng)結(jié)構(gòu)問題及解決方案
監(jiān)控系統(tǒng)是一個(gè)大型系統(tǒng),如何在現(xiàn)有系統(tǒng)中插入人臉識別,這是一個(gè)系統(tǒng)結(jié)構(gòu)問題。例如一個(gè)監(jiān)控群有100個(gè)監(jiān)控點(diǎn),有兩種方案可供選擇:每一個(gè)監(jiān)控點(diǎn)都進(jìn)行人臉識別或者選擇性地對監(jiān)控點(diǎn)進(jìn)行人臉識別。圖3為選擇性進(jìn)行人臉識別的系統(tǒng)結(jié)構(gòu)示意圖。根據(jù)圖示,如果將人臉識別服務(wù)器置于監(jiān)控中心,視頻圖像的通道較少(如16路)。在條件允許的情況下,可另外設(shè)置一個(gè)電視墻用來顯示人臉識別的結(jié)果,可同時(shí)顯示報(bào)警通道號、報(bào)警時(shí)間等日志信息,也可顯示監(jiān)控的當(dāng)前目標(biāo)人和數(shù)據(jù)庫對應(yīng)的目標(biāo)人圖像。
在大型監(jiān)控群里選用每一個(gè)監(jiān)控點(diǎn)都進(jìn)行人臉識別的方案,需要增添更多的設(shè)備,改變當(dāng)前的監(jiān)控結(jié)構(gòu),或增添專用硬件。
人臉分辨率問題及解決方案
在監(jiān)視目標(biāo)人識別的應(yīng)用中,應(yīng)用了人臉分辨率的概念。人臉檢測技術(shù)可以檢測到人臉分辨率低的人臉,但現(xiàn)在的人臉識別技術(shù)對人臉分辨率卻有一定的要求,美國FRVT2006所指的低分辨率是指兩眼的距離為75像素,滿足這一條件的人臉圖像尺寸約為180(寬)x240(高)。而在實(shí)際監(jiān)控中,不管是標(biāo)清還是高清,大量獲得的是人臉分辨率低的人臉圖像。通過采用綜合人臉檢測、人臉分辨率檢測和自動(dòng)變焦的技術(shù)方案,可以獲得滿足人臉識別需要的人臉分辨率高的圖像。通常所提到的最佳二維人臉,其中包括最佳姿態(tài)、最佳人臉分辨率等概念,采用這種方案需要在系統(tǒng)軟件上增添自動(dòng)變焦功能。
另一種方案則采用一些其它的新技術(shù),包括應(yīng)用專用硬件,來獲得滿足人臉識別需要的分辨率高的人臉圖像。
姿態(tài)問題及解決方案
姿態(tài)問題是監(jiān)視目標(biāo)人識別非常棘手的問題。主要是在姿態(tài)判別??爝M(jìn)行姿態(tài)的判別,云臺的調(diào)整也是為了獲得更好的拍攝角度。如果當(dāng)前人臉的水平轉(zhuǎn)動(dòng)角、俯仰角在某一范圍之內(nèi),則可直接進(jìn)行人臉識別;如果在特定范圍之外,可以采用人臉形成技術(shù),形成正面人臉圖像,繼而進(jìn)行人臉識別。人臉形成算法的復(fù)雜度較高,要考慮運(yùn)行速度問題。當(dāng)然,也可以安裝多部攝像機(jī)來拍攝一個(gè)人,通過選優(yōu)的方法選取最好姿態(tài)的人臉圖像。
同時(shí),在正面人臉形成的方法中,有單攝像機(jī)和多攝像機(jī)的區(qū)別。一般來說,多攝像機(jī)的信息多于單攝像機(jī)的信息,由此形成的正面人臉的效果要優(yōu)于單攝像機(jī)的效果,但代價(jià)較高(包括攝像數(shù)量、合成算法的復(fù)雜度等)。[nextpage]
光照問題及解決方案
光照問題是監(jiān)視目標(biāo)人識別的又一個(gè)難點(diǎn)。人臉光照是指外界光源照射在人臉上,經(jīng)人臉表面反射后傳播到感光器材上的光線強(qiáng)度。實(shí)際采集圖像時(shí)的光照條件千變?nèi)f化,不同的光照條件如偏光、測光、高光所導(dǎo)致的人臉圖像過亮、過暗、陰陽臉等都會使人臉檢測和識別的性能大幅度下降。
光照的估計(jì)和分類可以依據(jù)水平和俯仰角度等要素來進(jìn)行。有條件的場所應(yīng)對光照進(jìn)行控制,也盡量將全天候的露天環(huán)境改造為室內(nèi)環(huán)境并適當(dāng)采用補(bǔ)光的措施。當(dāng)然,采用近紅外的光照可以減弱環(huán)境光的影響。
年齡問題及解決方案
要將當(dāng)前人的人臉和他十年前的人臉進(jìn)行識別,其難度是很大的。采用年齡估計(jì)與年齡模擬的方法,可以在一定程度上改善識別效果。圖4為一個(gè)年齡模擬的實(shí)驗(yàn)效果。
在實(shí)際應(yīng)用中,常采用數(shù)據(jù)即時(shí)更新的方法,把身份確認(rèn)后的當(dāng)前采集的人臉圖像替代以前存儲的人臉圖像,以減少年齡變化帶來的不利影響。
應(yīng)該注意的是,當(dāng)前用于監(jiān)視目標(biāo)人識別的人臉識別技術(shù)亟待發(fā)展,技術(shù)水平也還有待于進(jìn)一步提升,具有很大的發(fā)展空間。
目前,在機(jī)場、地鐵等公共場所已經(jīng)安裝了一些監(jiān)視目標(biāo)人識別的人臉識別系統(tǒng),這是可喜的事情。但是,應(yīng)用效果距離應(yīng)用方的要求尚有較大距離。在這個(gè)階段,廠家不要夸大其詞,用戶也不要漫無邊際,廠家與用戶的有機(jī)結(jié)合,將有助于人臉識別性能在應(yīng)用中提高。