【安防知識網(wǎng)】:隨著科技的進步與發(fā)展,人臉識別技術得到了飛速的發(fā)展與突破,且具有廣闊的應用前景。上一次為讀者介紹了人臉識別的五點創(chuàng)新特點,我們將繼續(xù)為讀者們介紹人臉識別技術的發(fā)展路線描述和具體的創(chuàng)新實現(xiàn)方法。
人臉識別技術路線描述
動態(tài)實時人臉智能監(jiān)控布控系統(tǒng)從系統(tǒng)結構上分為:前端視頻Client和后臺搜索Server兩大部分(如圖1)。
Client部分
1、視頻采集系統(tǒng)(VideoCapture)
采集攝像機模擬視頻流并進行處理,得到VFW/Directshow等標準格式的數(shù)字視頻流輸入人臉檢測定位系統(tǒng)。
2、動態(tài)人臉檢測定位系統(tǒng)(FaceCapture)
對每秒20~30幀的數(shù)字視頻流進行逐幀分析,用連續(xù)自適應Boost強分類器構造的瀑布式檢測器,以及姿態(tài)預估計和多分辨率搜索策略進行快速的人臉檢測定位,并對畫面中定位的人臉分別根據(jù)約定的規(guī)格化尺寸進行剪切,得到標準的人臉圖像,然后通過網(wǎng)絡轉送到后臺Server。
Server部分
1、人臉圖像接收管理系統(tǒng)(FaceReceiver)
從網(wǎng)絡不斷接收前端Client傳送來的人臉圖像,按順序進行隊列緩存。
2、人臉圖片導入系統(tǒng)(FaceInput)
單張?zhí)峤换蚺繉胱杂玫娜四樥掌⑦M行人臉檢測定位和規(guī)格化處理。[nextpage]
3、人臉特征分析提取系統(tǒng)(TemplateGen)
對來自Client或者注冊提交的人臉圖像進行光線預處理,用全局光照子空間方法進行歸一化處理,并用基于圖像序列的極大似然估計算法和梯度光照子空間進行陰影消除。然后根據(jù)LFA算法和SIFT算法,提取基于局部幾何骨骼特征的人臉數(shù)據(jù),得到標準的人臉特征模板(Template)。
4、人臉特征模板存儲系統(tǒng)(TemplateDB)
對人臉特征模板進行存儲管理,與其對應的人臉照片,以及相關文字說明信息進行數(shù)據(jù)庫關聯(lián)。
5、人臉特征數(shù)據(jù)快速運算系統(tǒng)(FaceEngine)
利用瀑布式的多層搜索運算策略,對人臉特征模板進行快速的一對多批量匹配運算,并對通過最后一層細化搜索的每個人臉對象和現(xiàn)場人臉之間的匹配分值進行排序。
6、報警提示系統(tǒng)(AlertCenter)
根據(jù)搜索匹配的結果,根據(jù)最高匹配分值是否超過系統(tǒng)設置的報警閾值,判定是否需要報警提示,并按系統(tǒng)設定進行本地或遠程報警,報警信息包括匹配雙方的照片和文字信息。
7、人臉搜索引擎管理系統(tǒng)(SysAdmin)
對核心算法性能參數(shù)以及系統(tǒng)參數(shù)進行集中配置管理。
8、搜索報警記錄管理系統(tǒng)(LogDB)
對人臉圖片和報警日志進行記錄存儲和管理,提供按條件進行查詢檢索,以及數(shù)據(jù)備份恢復等功能。
人臉識別技術創(chuàng)新實現(xiàn)
人臉識別從基于特征點的方法發(fā)展到了目前主流的基于二維圖像的方法,并開始逐步走向基于三維模型的算法。作為人工智能和計算機視覺的最困難的研究領域之一,人臉識別在過去的十多年里得到了長足的發(fā)展,并開始在國防、金融和商務等眾多領域中走向實際應用。
國內的人臉識別技術研究和應用嘗試起步相對較晚,但是卻在近期幾年取得了非??捎^的進展,并在室內正面人臉光照、模糊人臉圖片處理、紅外人臉光線處理等諸多方面提出了有效的算法和理論,為人臉識別技術的性能提高以及實際應用奠定了堅實的基礎。
以人臉識別技術的創(chuàng)新研發(fā)和應用推廣為己任,在國內外先進人臉識別研究理論的基礎上,結合實際應用的需求和條件,努力提出創(chuàng)造性的解決方法,使人臉技術能夠完美的同實際應用相結合并發(fā)揮作用。在目前的LFA特征分析算法、多姿態(tài)人臉檢測算法、光線歸一化和陰影消除、SIFT算法等先進理論的基礎上,結合視頻監(jiān)控中進行動態(tài)實時人臉智能布控的需求和實施特點,創(chuàng)造性地提出了進一步提高人臉識別效果并解決實際應用問題的方法。
人臉骨骼架構特征是人臉特征的唯一性
從理論上講,雖然從人眼辨別的角度人臉的面貌會受到發(fā)型、膚色、表情、胡須、胖瘦等諸多不穩(wěn)定因素的影響,從數(shù)字圖像分析和模式識別的角度也會受到光線變化和角度變化以及長時間跨度面部變化帶來的影響,但是人臉骨骼架構特征確實含有了足以將每個人區(qū)分開的信息,而且以某種形式表現(xiàn)在采集到的數(shù)字照片的大量像素中,可以通過算法和技術的不斷改善和優(yōu)化來提高建模和匹配運算的精確度,從而達到通過可見的人臉特征準確辨認身份的作用。[nextpage]
在具體的算法設計和實現(xiàn)上,研究人員還可以進行多種優(yōu)化嘗試,提高識別的精確度和速度。在實時動態(tài)多角度人臉檢測方面,采用連續(xù)自適應Boost算法學習強分類器并構造出逐層淘汰非人臉樣本的瀑布式檢測器,同時通過姿態(tài)預估計和金字塔式多分辨率搜索策略對檢測過程進行加速,并用局部直方圖特征提高檢測的穩(wěn)定性;在光線預處理方面,從三維的角度出發(fā),在商圖像理論基礎上用基于全局光照子空間的方法進行光線歸一化,并通過基于圖像序列的極大似然估計算法和水平垂直梯度光照子空間消除圖像中的光照陰影,減少光線的影響;在有限分辨識別方面,基于SIFT算法提取與尺度大小無關的關鍵特征點,并通過多尺度濾波實現(xiàn)尺度不變性,通過8個方向的梯度直方圖實現(xiàn)旋轉不變性和部分仿射不變,在實際視頻監(jiān)控中獲取到的分辨率較低的人臉圖像中實現(xiàn)精確的識別;在時間跨度處理上,通過非線性流形學習策略和大量樣本的統(tǒng)計分析,減少年齡因素對人臉識別的影響。
此外還可以在以上原有的算法進行進一步的深入和優(yōu)化,并不斷嘗試更具有創(chuàng)造性的有效策略和方法。
針對大量樣本數(shù)據(jù)的統(tǒng)計分析學習
不同的光線照明造成的不同臉部陰影,以及不同角度不同時間造成的各種人臉的信息變化,不同年齡的時間跨度帶來的面部變化等等,都會模糊同一個人自身人臉變化范圍和與他人人臉特征區(qū)別程度的界限。但是,除了上述的各種算法優(yōu)化策略外,人們還可以通過收集大量的不同光照組合及包含各種變化因素的人臉圖片樣本,只要樣本信息足夠多,就可以基于統(tǒng)計分析方法,通過不斷訓練學習不斷修正的方法得出最優(yōu)的算法模型,找到在各種不同實際應用情況下能夠準確區(qū)別不同身份之間的人臉差異的尺度。并且,還可以嘗試讓算法動態(tài)自適應學習來針對每個具體應用場合的條件和特定人臉樣本庫達到最優(yōu)化的性能。
在此基礎上,人們還可以采用非線性流形學習的方法(Nonlinear Manifold Learning),將同一個人不同時間段的樣本用最近鄰的方法,連接成為一個復雜的流形,這樣每個人都有一個流形。然后,采用區(qū)分分析法,尋求不同人的流形的最佳投影方向,從而達到良好的分類效果。
特征數(shù)據(jù)表達格式和搜索運算的可優(yōu)化性
通過不斷的特征提取算法優(yōu)化和科學數(shù)值表達方法與技巧的運用,總是能夠用更加有效更加精準更加少的數(shù)據(jù)來表示每張人臉的特征信息。另外,人臉模板的存儲和檢索管理,以及大批量的搜索運算,均可以通過行之有效的系統(tǒng)設計方法和技術實現(xiàn)技巧進行優(yōu)化。從而提高一對多人臉搜索匹配的速度,使系統(tǒng)達到實時響應的速度要求。
針對人臉模板的讀取延遲,可以事先將所有布控對象的人臉模板快速導入內存并進行有效的空間地址分配,從而可以在目標人臉模板中進行快速的搜索對比運算。同時,還可以根據(jù)匹配運算的強度遞增,進行多層的瀑布式搜索,先用粗略而又快速的匹配運算,對全局模板空間進行粗略搜索,排除掉那些相似程度明顯較低的人臉模板,然后在剩下的候選對象中進行更為精細的搜索對比,直到完成人臉的定位。
并行處理及軟件系統(tǒng)設計
另外,還可以通過對硬件運算資源的合理高效利用,實現(xiàn)對系統(tǒng)整體資源和性能的合理配置。在同時輸入的監(jiān)控視頻流數(shù)量和布控對象人數(shù)都比較多的的時候(如同時支持100路攝像機對50萬人進行實時布控),可以運用計算機并行處理技術構建服務器組,用多個計算節(jié)點并行處理特征分析和識別運算工作。同時,通過數(shù)據(jù)庫優(yōu)化等諸多應用軟件層面上的設計方法和技巧,提高整個系統(tǒng)的性能。
此外,還可以將部分算法運算映射到CPU顯卡上,分擔服務器CPU的運算負荷和速度壓力。(本文作者:黃曉斌 現(xiàn)任職于北京時代鼎典信息技術有限公司)