在恐怖勢(shì)力日漸猖獗的國(guó)際社會(huì)環(huán)境下,奧運(yùn)會(huì)成為了他們頭號(hào)破壞和打擊的目標(biāo)。2008北京奧運(yùn)會(huì)的成功舉辦,向世界展示了一次偉大的平安盛會(huì)。本文就著重對(duì)在北京奧運(yùn)會(huì)上人臉識(shí)別技術(shù)的應(yīng)用展開了探討,并對(duì)當(dāng)前人臉識(shí)別技術(shù)的應(yīng)用趨勢(shì)和存在的誤區(qū)進(jìn)行深入分析,僅供讀者參考。
1972年9月5日,慕尼黑奧運(yùn)會(huì)出現(xiàn)了舉世震驚的一幕:巴勒斯坦恐怖分子持槍襲擊運(yùn)動(dòng)員村,當(dāng)場(chǎng)殺害兩名以色列運(yùn)動(dòng)員,劫持9名人質(zhì),比賽全部停止,奧運(yùn)村一片混亂。最終,被綁人質(zhì)無一獲救,5名恐怖分子和1名德國(guó)警察死亡。1996年亞特蘭大奧運(yùn)會(huì),恐怖主義的陰影再次籠罩了這一全人類最隆重的盛會(huì),發(fā)生在奧林匹克公園的爆炸案,造成2人死亡,110多人受傷。而最近兩屆奧運(yùn)會(huì)在開賽前,也面臨著極為嚴(yán)峻的安全形勢(shì):2000年悉尼奧運(yùn)會(huì),恐怖組織策劃的襲擊事件險(xiǎn)些上演;2004年雅典奧運(yùn)會(huì)開幕前,希臘先后發(fā)生了5起爆炸事件。
可以說,自慕尼黑慘案后,奧運(yùn)會(huì)便有了兩個(gè)戰(zhàn)場(chǎng)——體育與反恐。安保工作成為東道主國(guó)越來越頭疼的問題,近幾屆奧運(yùn)會(huì)東道主國(guó)投入在安保上的費(fèi)用直線上升,2004年的雅典奧運(yùn)會(huì)更以15億美元的安保費(fèi)用令世人側(cè)目。
自2001年北京申奧成功之日起,政府就已經(jīng)開始著手進(jìn)行奧運(yùn)安保準(zhǔn)備工作?!?·11”事件的發(fā)生,讓政府更加重視奧運(yùn)安保工作。2001年,奧運(yùn)會(huì)安?;I備工作正式展開,2004年成立了北京奧運(yùn)安保協(xié)調(diào)小組。北京奧組委也早在2002年就從奧運(yùn)場(chǎng)館的建設(shè)著手,提出了五個(gè)同步的理念,將安保設(shè)施與場(chǎng)館同步規(guī)劃、同步設(shè)計(jì)、同步建設(shè)、同步驗(yàn)收、同步投入使用。這些措施使奧運(yùn)場(chǎng)館從建設(shè)時(shí)起,就符合奧運(yùn)安保要求。2007年黨的十七大新聞發(fā)布會(huì)上,北京市副市長(zhǎng)、北京奧組委執(zhí)行副主席劉敬民在回答國(guó)外記者提問時(shí)說,“安保工作向來是奧運(yùn)會(huì)籌備工作最為重要的一件事情。在北京奧運(yùn)會(huì)上,政府采取一系列國(guó)際上先進(jìn)的技術(shù)措施確保安保。比如,在一些重點(diǎn)場(chǎng)次的票務(wù)上,使用了RFID(電子芯片的作用)技術(shù),及時(shí)全面地查證入場(chǎng)人的身份,這些都會(huì)對(duì)奧運(yùn)會(huì)安全提供絕對(duì)的保障?!庇脕砗蚏FID技術(shù)結(jié)合查證入場(chǎng)人身份的,正是近年來漸趨成熟的人臉識(shí)別技術(shù)。
生物特征識(shí)別與人臉識(shí)別
在安全防范領(lǐng)域,生物特征識(shí)別技術(shù)一直處于金字塔的頂端。對(duì)指紋、虹膜、掌紋、人臉、簽名、靜脈、姿態(tài)(手勢(shì))和語音等的研究,結(jié)合模式識(shí)別技術(shù),形成了當(dāng)前主要的生物特征識(shí)別的各個(gè)研究方向。
[nextpage]
在應(yīng)用層面,為了達(dá)到安全防范要求,一般生物特征識(shí)別技術(shù)可分為檢測(cè)(監(jiān)視)、認(rèn)證和檢索三大類。因此,一種生物特征識(shí)別技術(shù)是否在某個(gè)細(xì)分市場(chǎng)中適用,只需要考察上述三大類問題的影響因素。如圖1所示,檢測(cè)問題又受到輸入設(shè)備、待識(shí)別對(duì)象的主動(dòng)/被動(dòng)問題、環(huán)境和特征穩(wěn)定性以及檢測(cè)儀器的建設(shè)成本等因素的影響。在認(rèn)證應(yīng)用上,則需要考察系統(tǒng)的數(shù)據(jù)庫建設(shè)的可行性和成本、認(rèn)證系統(tǒng)的FAR(False Accept Rate, 錯(cuò)誤接受率,也稱認(rèn)假率)和FRR(False Rejection Rate, 錯(cuò)誤拒絕率,也稱拒真率)。對(duì)檢索系統(tǒng)而言,除了同樣需要考慮數(shù)據(jù)庫建設(shè)問題外,還需要考慮前N名(或前n%名)的命中率和檢索速度(對(duì)于海量數(shù)據(jù)庫而言)。
根據(jù)International Biometric Group近期出版的生物識(shí)別市場(chǎng)及產(chǎn)業(yè)趨勢(shì)分析報(bào)告指出,生物識(shí)別市場(chǎng)中傳統(tǒng)的指紋識(shí)別仍然處于主導(dǎo)地位,而人臉識(shí)別技術(shù)位居第2,占12.9%。
眾多生物特征識(shí)別技術(shù),從終端采集的層面可以分成主動(dòng)配合和被動(dòng)采集兩大類。主動(dòng)配合的有指紋、虹膜、掌紋、靜脈和簽名等;被動(dòng)采集的手勢(shì)、語音和姿態(tài)(手勢(shì))等。顯然,主動(dòng)配合方式將需要目標(biāo)對(duì)象有意識(shí)地在一定的環(huán)境條件和特殊的采集設(shè)備下進(jìn)行信息的采集,這種方式適用于有較強(qiáng)限制條件下的身份認(rèn)證和識(shí)別。由于應(yīng)用模式本身假定目標(biāo)對(duì)象將會(huì)根據(jù)要求進(jìn)行配合,因此受到環(huán)境的影響較小,但是采集終端建設(shè)成本偏高。被動(dòng)采集則不需要(或要求很寬松)目標(biāo)對(duì)象對(duì)采集終端進(jìn)行特別的配合。通常適用于監(jiān)視、檢測(cè)和未公開的身份認(rèn)證,如涉及到軍隊(duì)、國(guó)家安全、公共安全和重點(diǎn)場(chǎng)所的保安監(jiān)控,一般都要求被動(dòng)采集。這種方式對(duì)目標(biāo)對(duì)象沒有嚴(yán)格的限制,因此受到環(huán)境的影響較大,特征的穩(wěn)定性也較差,但采集終端的建設(shè)成本相對(duì)較低。
在人臉識(shí)別技術(shù)發(fā)展的早期,由于人們無法較好地消除環(huán)境影響以及由姿態(tài)、光照、年齡等變化帶來的人臉特征的不穩(wěn)定性,人臉識(shí)別技術(shù)應(yīng)用局限于對(duì)特定分辨率和特定光照、姿態(tài)、表情和年齡約束條件下的試驗(yàn),國(guó)外多個(gè)研究機(jī)構(gòu)建立了一些用于測(cè)試的數(shù)據(jù)庫(如FERET人臉數(shù)據(jù)庫、MIT數(shù)據(jù)庫、YALE數(shù)據(jù)庫、ORL數(shù)據(jù)庫等),這些數(shù)據(jù)庫無論是從樣本數(shù)量和變化因素的跨度上而言,都僅僅停留在實(shí)驗(yàn)階段,無法全面描述實(shí)用型的人臉識(shí)別應(yīng)用。
近10年來,隨著對(duì)人臉識(shí)別技術(shù)的深入研究,研究人員逐漸突破了來自于環(huán)境等影響到人臉特征的不穩(wěn)定因素,人臉識(shí)別系統(tǒng)逐步進(jìn)入到實(shí)用階段。如清華大學(xué)聯(lián)合北京普賽科技有限公司在廣州建成了世界上第一套實(shí)用的2000萬數(shù)據(jù)庫容量的大型檢索系統(tǒng),該系統(tǒng)在命中率和檢索速度上均處于世界領(lǐng)先地位。
2008年8月24日,隨著北京奧運(yùn)會(huì)閉幕式的結(jié)束,人臉識(shí)別技術(shù)首次正式應(yīng)用于奧運(yùn)會(huì)安保即取得了巨大的成功。
[nextpage]
人臉識(shí)別系統(tǒng)在北京奧運(yùn)會(huì)的應(yīng)用
需求分析
業(yè)務(wù)需求:確保重要場(chǎng)館內(nèi)的人員身份合法,避免不法分子為達(dá)成其某種目的而造成的會(huì)場(chǎng)混亂。
需求點(diǎn)1:參會(huì)人員(運(yùn)動(dòng)員、志愿者、工作人員、觀眾)采用實(shí)名制登記。
需求點(diǎn)2:參會(huì)人員從特定的通道進(jìn)行身份認(rèn)證后方可入場(chǎng)。
需求點(diǎn)3:建設(shè)參會(huì)人員數(shù)據(jù)庫和重點(diǎn)嫌疑人員數(shù)據(jù)庫。
用例1:參會(huì)人員遞交身份信息(含近期照片),系統(tǒng)檢查照片信息的適用性,提取照片信息的數(shù)字特征,建立數(shù)字特征與入場(chǎng)通行證件(如門票)的一一對(duì)應(yīng)關(guān)系。
用例2:參會(huì)人員持入場(chǎng)通行證件通過特定通道,部署于通道的人臉識(shí)別系統(tǒng)獲取通行證件的數(shù)字ID,調(diào)用數(shù)據(jù)庫內(nèi)數(shù)字特征。
用例3:部署于通道的檢測(cè)設(shè)備檢測(cè)到待通過參會(huì)人員,檢測(cè)出待通過參會(huì)人員的人臉圖像,提取該人臉圖像的數(shù)字特征。
用例4:將用例2中的數(shù)字特征和用例3中的數(shù)字特征進(jìn)行比對(duì),根據(jù)設(shè)定的相似度閾值,給出該兩組數(shù)字特征是否為合法匹配。如合法,則放行;如非法,則給出報(bào)警提示。
用例5:建立重點(diǎn)嫌疑人員人臉圖像數(shù)據(jù)庫,提取其數(shù)據(jù)特征備查。
用例6:將用例3中數(shù)字特征與用例5中的數(shù)字特征中進(jìn)行檢索,如檢索到可疑人員則給出報(bào)警提示。
建庫流程如圖2所示,現(xiàn)場(chǎng)認(rèn)證流程如圖3所示。
部署
服務(wù)于奧運(yùn)會(huì)的人臉識(shí)別系統(tǒng)包括前端的人臉識(shí)別認(rèn)證終端和后臺(tái)的服務(wù)器。人臉識(shí)別認(rèn)證終端用于現(xiàn)場(chǎng)的人臉比對(duì)認(rèn)證,并將認(rèn)證結(jié)果通過中轉(zhuǎn)服務(wù)器上傳到安保中心的服務(wù)器,用于觀眾入場(chǎng)信息的匯總和統(tǒng)計(jì),便于安保指揮人員實(shí)時(shí)掌握所有通道的觀眾流量、通過情況等信息,為指揮決策提供必要的輔助。系統(tǒng)架構(gòu)如圖4所示。
[nextpage]
每一臺(tái)人臉識(shí)別認(rèn)證終端包括一臺(tái)用于識(shí)別門票RFID信息的刷票設(shè)備和一臺(tái)人臉識(shí)別認(rèn)證設(shè)備。當(dāng)觀眾刷票時(shí),人臉識(shí)別認(rèn)證識(shí)別自動(dòng)獲得由刷票設(shè)備發(fā)來的信號(hào),啟動(dòng)人臉識(shí)別比對(duì)功能,隨后將比對(duì)結(jié)果返回給刷票設(shè)備,并顯示在刷票設(shè)備的顯示屏上,供志愿者參考。人臉識(shí)別認(rèn)證設(shè)備將結(jié)果同時(shí)上傳到中轉(zhuǎn)服務(wù)器,由中轉(zhuǎn)服務(wù)器上傳至安保中心。認(rèn)證流程如圖5所示。
由于整個(gè)奧林匹克中心區(qū)需要在短短數(shù)小時(shí)之內(nèi)快速通過多達(dá)10萬名觀眾入場(chǎng),因此部署了大約100臺(tái)人臉識(shí)別認(rèn)證終端。在人流量密集時(shí),這些終端設(shè)備上傳的數(shù)據(jù)流量較大,為了避免網(wǎng)絡(luò)擁塞,減少安保中心服務(wù)器的負(fù)荷,系統(tǒng)通過多級(jí)中轉(zhuǎn)服務(wù)器轉(zhuǎn)發(fā)數(shù)據(jù),有效降低了網(wǎng)絡(luò)壓力,提高了系統(tǒng)的穩(wěn)定性和響應(yīng)速度。
系統(tǒng)運(yùn)行情況
在已經(jīng)成功舉行的奧運(yùn)會(huì)開閉幕式上,觀眾總?cè)藬?shù)都達(dá)到了接近10萬人,每個(gè)通道的平均人流量達(dá)到1000人次,一些人流量比較密集的安檢棚通過的人數(shù)更多。在整個(gè)系統(tǒng)運(yùn)行期間,所有服務(wù)器和終端設(shè)備運(yùn)行良好,未出現(xiàn)一例故障,充分保證了觀眾的通行速度,并且,利用具有人臉比對(duì)功能的票證系統(tǒng),查處了十幾起冒用、持有非法門票的行為,充分保障了奧運(yùn)會(huì)開閉幕式的順利進(jìn)行。
清識(shí)?人臉識(shí)別技術(shù)的特點(diǎn)
成功應(yīng)用于北京奧運(yùn)會(huì)的人臉識(shí)別系統(tǒng)具有以下主要特點(diǎn)。
·友好:該人臉識(shí)別系統(tǒng)融合了計(jì)算機(jī)圖像處理技術(shù)與生物統(tǒng)計(jì)學(xué)原理,通過提取人像特征點(diǎn)、分析并建立數(shù)學(xué)模型、進(jìn)行比對(duì)驗(yàn)證等一連串復(fù)雜的運(yùn)算工作。在計(jì)算機(jī)人臉識(shí)別的基礎(chǔ)上,提供豐富的人機(jī)交互功能,具有良好的可視化效果,易于人們接受;
·隱蔽:利用攝像機(jī)自動(dòng)采集合適的人臉像傳輸?shù)胶笈_(tái)比對(duì),不會(huì)引起被檢測(cè)人的的反感。而在一些場(chǎng)合,更具備隱蔽性,在被檢測(cè)人不經(jīng)意間完成人像采集和比對(duì);
·高效:相對(duì)于其他生物特征識(shí)別,人臉采集要更加快捷方便。該人臉識(shí)別系統(tǒng)利用多種專利技術(shù)對(duì)人臉檢測(cè)、特征提取和匹配進(jìn)行了優(yōu)化加速,使得整個(gè)比對(duì)識(shí)別過程要快捷很多。在理想的系統(tǒng)環(huán)境和硬件設(shè)備支持下,完成一個(gè)比對(duì)識(shí)別工作所需時(shí)間不到1秒;
·安全:人臉采集手段一般為可見光下非接觸式的,而且普通攝像頭就能完成,相比于其他一些需要特殊采集設(shè)備或接觸式設(shè)備來說,對(duì)被檢測(cè)人的各種身體損害也降到最低;
·準(zhǔn)確:該系統(tǒng)結(jié)合RFID的數(shù)字匹配,F(xiàn)AR和FRR均低于萬分之一;
·易于集成:視頻監(jiān)控已經(jīng)在很多領(lǐng)域廣泛應(yīng)用,一般的攝像設(shè)備和其他硬件均能達(dá)到人臉識(shí)別要求,所以無需投入大量的其他設(shè)備,就能在現(xiàn)有硬件基礎(chǔ)上進(jìn)行升級(jí)改造至人臉識(shí)別系統(tǒng),大大降低了建設(shè)成本。
人臉識(shí)別技術(shù)的趨勢(shì)和誤區(qū)
雖然隨著科學(xué)技術(shù)的發(fā)展,人臉識(shí)別的準(zhǔn)確率有了長(zhǎng)足的提高;但不可否認(rèn),任何一項(xiàng)識(shí)別技術(shù)都有其技術(shù)的局限性。要獲得更高的識(shí)別率、更快的速度、更強(qiáng)的適應(yīng)性,除了要找對(duì)研究方向,加大研發(fā)投入,還要根據(jù)實(shí)際的需求,結(jié)合多種應(yīng)用模式來揚(yáng)長(zhǎng)補(bǔ)短。根據(jù)分析表明,我國(guó)人臉識(shí)別技術(shù)及其產(chǎn)業(yè)逐漸呈現(xiàn)出幾個(gè)趨勢(shì),同時(shí)也存在著一些誤區(qū),需要研究和應(yīng)用單位引起注意。 [nextpage]
技術(shù)分工的細(xì)化
人臉識(shí)別技術(shù)已經(jīng)成為生物特征識(shí)別市場(chǎng)的一個(gè)新的熱點(diǎn)和增長(zhǎng)點(diǎn),光是我國(guó)就有上百個(gè)研究單位在開展著相應(yīng)的研究,而其中不乏一些創(chuàng)新的思想和方法。自主知識(shí)產(chǎn)權(quán)的技術(shù)已經(jīng)越來越受到國(guó)家和研究機(jī)構(gòu)的重視,而隨著研究的深入,對(duì)于人臉識(shí)別的各個(gè)步驟的細(xì)化分工也漸趨明朗。
研究和產(chǎn)業(yè)化的分離
近年來,人臉識(shí)別領(lǐng)域涌現(xiàn)出一批新的企業(yè)。相較于若干年前以研究單位為代表的技術(shù)推廣,逐漸走向了專業(yè)分工,即研究單位專心研究算法的提高,而實(shí)體企業(yè)則致力于產(chǎn)品化和應(yīng)用推廣。
標(biāo)準(zhǔn)化
由于技術(shù)分工的細(xì)化,各個(gè)環(huán)節(jié)之間的交互顯得愈加重要,而對(duì)這種交互的接口標(biāo)準(zhǔn)化要求也日益緊迫。同時(shí),產(chǎn)業(yè)化也要求各個(gè)人臉識(shí)別技術(shù)提供廠商有一個(gè)統(tǒng)一的規(guī)范。針對(duì)這一現(xiàn)狀,我國(guó)公安部組織有關(guān)單位逐步開始了人臉識(shí)別技術(shù)的標(biāo)準(zhǔn)化工作,并著手建立中國(guó)的人臉識(shí)別統(tǒng)一測(cè)試平臺(tái)。
國(guó)際測(cè)試和識(shí)別率誤區(qū)
正如前文所述,當(dāng)前國(guó)際上已有若干研究單位建立了用于人臉識(shí)別研究的人臉數(shù)據(jù)庫,也有國(guó)際組織不定期組織全球主要人臉識(shí)別研究者和廠商的技術(shù)測(cè)試;但是,由于人臉識(shí)別技術(shù)的有效性很大程度上依賴于輸入設(shè)備、人臉圖像的質(zhì)量、人臉數(shù)據(jù)庫的構(gòu)成等等不確定因素,因此,針對(duì)不同的應(yīng)用需求不應(yīng)該拘泥于某一種特定的人臉識(shí)別算法,而應(yīng)該審慎分析實(shí)際應(yīng)用情況,選擇最適合的應(yīng)用模式。某種算法在A測(cè)試中是優(yōu)秀的算法,但是在B應(yīng)用中或許就是一種糟糕的選擇。某種人臉識(shí)別技術(shù)在測(cè)試數(shù)據(jù)庫C中有著很好的識(shí)別率,但是在D數(shù)據(jù)庫中或許就并不適用了。
芯片化誤區(qū)
雖然芯片化有著其獨(dú)特的優(yōu)勢(shì)和誘惑力,但是由于人臉識(shí)別技術(shù)需要處理大量的圖像數(shù)據(jù),因此對(duì)圖像處理速度和內(nèi)存容量均有著較高的要求。我們認(rèn)為,利用固化硬件對(duì)人臉識(shí)別的若干步驟進(jìn)行優(yōu)化加速是可行的,但是如果盲目追求識(shí)別技術(shù)的全盤芯片化,極有可能會(huì)得不償失。