久久久18,天天躁夜夜躁狠狠躁婷婷,国产成人三级一区二区在线观看一,最近的2019中文字幕视频 ,最新免费av在线观看

a&s專業(yè)的自動(dòng)化&安全生態(tài)服務(wù)平臺(tái)
公眾號(hào)
安全自動(dòng)化

安全自動(dòng)化

安防知識(shí)網(wǎng)

安防知識(shí)網(wǎng)

手機(jī)站
手機(jī)站

手機(jī)站

大安防供需平臺(tái)
大安防供需平臺(tái)

大安防供需平臺(tái)

資訊頻道橫幅A1
首頁 > 資訊 > 正文

如何解鎖安防行業(yè)人臉識(shí)別這個(gè)小目標(biāo)?

深度學(xué)習(xí)的欣欣向榮直接推動(dòng)了人臉識(shí)別技術(shù)的飛速發(fā)展,人臉識(shí)別一下子從刀耕火種的原始階段進(jìn)階到長(zhǎng)風(fēng)破浪的盛世王朝。很多公司都喜歡在各個(gè)測(cè)試集上刷榜,99%的識(shí)別準(zhǔn)確率早已不是什么大新聞,在標(biāo)準(zhǔn)測(cè)試集上,人眼的識(shí)別準(zhǔn)確率早就敗給了計(jì)算機(jī)。

  2016年北京安博會(huì)上,各家公司人臉識(shí)別產(chǎn)品百花齊放,但就是在這個(gè)人臉識(shí)別的鼎盛時(shí)代, 實(shí)際上需求最痛的安防行業(yè)還是無法大規(guī)模應(yīng)用。根據(jù)最高人民檢察院和最高人民法院關(guān)于刑事案件數(shù)量的統(tǒng)計(jì),2015年全國人民法院新收刑事一審案件1126748件,同比上升8.29%。(數(shù)據(jù)來源:2001-2016年《中國法律年鑒》)。滿大街的攝像頭,各種智能檢測(cè)分析,依舊有很多人肆無忌憚地進(jìn)行著違法犯罪活動(dòng)。

  文/繆冬琴

  針對(duì)此,本文首先回顧了目前人臉識(shí)別技術(shù)的發(fā)展?fàn)顩r,然后重點(diǎn)探討了目前安防行業(yè)大規(guī)模應(yīng)用人臉識(shí)別還需要解決的問題。

  人臉識(shí)別技術(shù)的發(fā)展?fàn)顩r

  深度學(xué)習(xí)技術(shù)出現(xiàn)之前,幾乎所有人臉檢測(cè)都是采用滑動(dòng)窗口式的方法。在識(shí)別輸入圖像前,我們會(huì)先用一個(gè)固定大小的窗口在輸入圖像上進(jìn)行滑動(dòng),窗口框定的區(qū)域會(huì)被送入到分類器,去判斷是人臉窗口還是非人臉窗口?;瑒?dòng)的窗口其大小是固定的,但是人臉的大小則多種多樣,為了檢測(cè)不同大小的人臉,還需要把輸入圖像縮放到不同大小,使得不同大小的人臉能夠在某個(gè)尺度上和窗口大小相匹配。這種滑動(dòng)窗口式的做法有一個(gè)很明顯的問題,就是有太多的位置要去檢查,去判斷是人臉還是非人臉。

  2000年前后出現(xiàn)的Viola-Jones人臉檢測(cè)器,使得這種人臉檢測(cè)技術(shù)開始成熟起來,并出現(xiàn)了相關(guān)的實(shí)際應(yīng)用,例如數(shù)碼相機(jī)中的人臉對(duì)焦的功能,照相的時(shí)候,相機(jī)會(huì)自動(dòng)檢測(cè)人臉,然后根據(jù)人臉的位置把焦距調(diào)整得更好。

  就人臉檢測(cè)而言,人臉可以大致看成是一種剛體,通常情況下不會(huì)有非常大的形變,比方說嘴巴變到鼻子的位置上去。但是對(duì)于公安實(shí)際應(yīng)用中既關(guān)注人臉也關(guān)注全身來說,人可以把胳膊抬起來,也可以把腿翹上去,這使得人體有非常多的非剛性變化,從而使得檢測(cè)的準(zhǔn)確率大大降低。

  2013年底,深度學(xué)習(xí)給人臉檢測(cè)任務(wù)點(diǎn)起了一把火,這個(gè)火種就是R-CNN,其中R對(duì)應(yīng)于“Region(區(qū)域)”,意指CNN以圖像區(qū)域作為輸入,這個(gè)工作最終發(fā)展成了一個(gè)系列,R-CNN的變革首當(dāng)其沖的是拋棄了滑動(dòng)窗口范式,取而代之的是一個(gè)新的生成候選窗口的環(huán)節(jié);其次不再采用人工設(shè)計(jì)的特征,而是用CNN來自動(dòng)學(xué)習(xí)特征。傳統(tǒng)滑動(dòng)窗口范式做目標(biāo)檢測(cè)時(shí),需要對(duì)每一個(gè)物體去設(shè)計(jì)和和學(xué)習(xí)單獨(dú)的檢測(cè)器,例如做人臉檢測(cè)和車輛檢測(cè),兩個(gè)檢測(cè)器特征會(huì)不一樣,分類器也不一樣,對(duì)于每一類物體,需要去嘗試不同的特征和分類器的組合。但是現(xiàn)在,采用深度學(xué)習(xí)的R-CNN在物體類別上沒有任何限制。換句話說,它既可以檢測(cè)人臉,也可以同時(shí)檢測(cè)其他類別的物體,比如說人體形態(tài),這在公安實(shí)戰(zhàn)應(yīng)用中是一個(gè)非常重要的優(yōu)勢(shì)。

  R-CNN帶來了目標(biāo)檢測(cè)精度的一次巨大提升,然而由于所采用的候選窗口生成方法和深度網(wǎng)絡(luò)都具有比較高的計(jì)算復(fù)雜度,因而檢測(cè)速度非常慢。為了解決R-CNN的速度問題,緊接著出現(xiàn)了Fast R-CNN和Faster R-CNN,速度一個(gè)比一個(gè)快。與此同時(shí),一部分研究人員把研究視角切換到將傳統(tǒng)的人臉檢測(cè)技術(shù)和深度網(wǎng)絡(luò)(如CNN)的結(jié)合,保證檢測(cè)速度的情況下進(jìn)一步提升精度,專做人臉檢測(cè)的Cascade CNN可以認(rèn)為是傳統(tǒng)技術(shù)和深度網(wǎng)絡(luò)相結(jié)合的一個(gè)代表,吸取傳統(tǒng)人臉檢測(cè)技術(shù)中的精華,借鑒深度學(xué)習(xí)研究的最新成果,提升某一類目標(biāo)檢測(cè)精度和速度,這是一條值得繼續(xù)探索的道路。

  目前,人臉檢測(cè)方法正日趨成熟,在現(xiàn)實(shí)場(chǎng)景中也已經(jīng)得到了比較廣泛的應(yīng)用,在特定配合場(chǎng)景下如照片的檢索、門禁考勤等應(yīng)用,目前已基本成熟。但是人臉檢測(cè)問題還并沒有被完全解決,復(fù)雜多樣的姿態(tài)變化、千奇百怪的遮擋情況、捉摸不定的光照條件、不同的分辨率、迥異的清晰度、微妙的膚色差,各種內(nèi)外因素的共同作用讓人臉的變化模式變得極其豐富,在非配合場(chǎng)景下的萬級(jí)及以上的目標(biāo)檢測(cè)如安防監(jiān)控庫的應(yīng)用,依舊任重道遠(yuǎn)。

  安防行業(yè)應(yīng)用人臉識(shí)別

  具體到安防行業(yè),特定配合場(chǎng)景下如公安系統(tǒng)的大庫比對(duì)、身份查重等,人臉識(shí)別等應(yīng)用已經(jīng)有很多成功的案例。與簡(jiǎn)單的靜態(tài)場(chǎng)景相比,安防市場(chǎng)中應(yīng)用前景更廣闊的一個(gè)方向是動(dòng)態(tài)場(chǎng)景下的人臉識(shí)別:基于視頻中的人臉照片進(jìn)行遠(yuǎn)距離、快速、無接觸式的重點(diǎn)人員布控預(yù)警。讓應(yīng)用于車站、機(jī)場(chǎng)、地鐵等重點(diǎn)場(chǎng)所和大型商場(chǎng)超市等人群密集的公共場(chǎng)所視頻監(jiān)控系統(tǒng)能夠?qū)σ曨l圖像進(jìn)行采集、自動(dòng)分析、抓取人臉實(shí)時(shí)比對(duì),主動(dòng)在監(jiān)控場(chǎng)景中識(shí)別重點(diǎn)關(guān)注人員,實(shí)現(xiàn)重點(diǎn)人員的布控和識(shí)別。這是一個(gè)熱鬧的研究方向,同時(shí)也是一個(gè)巨大的研究挑戰(zhàn)。

  算法前移:計(jì)算資源與算法精度的平衡問題

  采用深度學(xué)習(xí)的方法來做人臉識(shí)別,需要消耗非常多的計(jì)算資源,針對(duì)服務(wù)器資源昂貴的市場(chǎng)情況,想要實(shí)現(xiàn)智能監(jiān)控系統(tǒng)的大規(guī)模部署,必須要考慮到承擔(dān)的經(jīng)濟(jì)成本。目前不少公司采用了將算法內(nèi)嵌至前端攝像機(jī)的經(jīng)濟(jì)做法,比如科達(dá)公司推出的感知型攝像機(jī)等,讓前端攝像機(jī)具備人臉檢測(cè)的功能,后端服務(wù)器再做二次分析,以此減少后端服務(wù)器的計(jì)算壓力。

  顯而易見,如果想在前端攝像機(jī)上集成精度高速度快的人臉識(shí)別模塊,勢(shì)必需要前端硬件性能的匹配。而目前已有的硬件還達(dá)不到這樣的要求,只能在算法上做一些犧牲,如降低算法的復(fù)雜性,但這樣應(yīng)用到實(shí)際場(chǎng)景中,則會(huì)造成檢測(cè)效果的降低,如漏檢、誤檢。

  大數(shù)據(jù)訓(xùn)練:數(shù)據(jù)從何而來以及如何訓(xùn)練

  深度學(xué)習(xí)最核心的優(yōu)勢(shì)在于深度化,用足夠多的數(shù)據(jù)來訓(xùn)練,訓(xùn)練的越多,算法的魯棒性、泛化能力越強(qiáng)。目前深度學(xué)習(xí)算法的訓(xùn)練數(shù)據(jù)普遍都是幾十萬、上百萬級(jí),像一些互聯(lián)網(wǎng)行業(yè)的IT巨頭們,他們的訓(xùn)練數(shù)據(jù)都是上千萬、甚至上億級(jí)別。

  Fei-Fei LI在2015年TED TALK中向公眾介紹人工智能中計(jì)算機(jī)視覺技術(shù)的最新進(jìn)展時(shí)說道,ImageNet中下載了接近十億張照片,在巔峰時(shí)期,總共有接近五萬工作者,來自167個(gè)國家,幫助他們清理、分類、標(biāo)記,接近十億張候選圖片。“十億張”、“五萬工作者”這些關(guān)鍵詞無不暗示著獲取有標(biāo)注數(shù)據(jù)的時(shí)間和金錢成本。

  首先,安防行業(yè)的“十億張”從何而來?據(jù)了解,盡管視頻監(jiān)控帶來了圖片與視頻資源的激增,一方面出于安全及隱私的考慮,不少公司做大數(shù)據(jù)訓(xùn)練時(shí),樣本采用的是本公司自有建設(shè)的監(jiān)控資源庫,小范圍的區(qū)域監(jiān)控遠(yuǎn)遠(yuǎn)夠不成海量;另一方面,目前安防產(chǎn)品的形態(tài)并沒有給深度學(xué)習(xí)留下一個(gè)很好的空間,比如說安防系統(tǒng)的數(shù)據(jù)大多都存儲(chǔ)在一個(gè)錄像機(jī)、存儲(chǔ)設(shè)備里,他們可以是DVR、NVR、IPSAN或者云存儲(chǔ)里,這樣的構(gòu)成體系不太方便讓一個(gè)計(jì)算設(shè)備把它的數(shù)據(jù)挖掘出來,然后去處理。如果在未來可以有一個(gè)更友好的基礎(chǔ)設(shè)施出現(xiàn):所有的監(jiān)控?cái)z像機(jī)都連到一個(gè)云上,在云上把深度學(xué)習(xí)的算法加載在上面,讓其接觸并分析所有的數(shù)據(jù),真正實(shí)現(xiàn)大數(shù)據(jù)訓(xùn)練。

  其次,“五萬工作者”的研發(fā)體量可望不可及。每天,安防企業(yè)的研發(fā)者都需要花大量的精力和人力投入到給圖像打標(biāo)簽的工作上,但是大量無監(jiān)督數(shù)據(jù)的獲取成本卻是微乎其微的。

  回顧深度學(xué)習(xí)的發(fā)展史,有趣的是,2006年Hinton教授等人倡導(dǎo)的卻恰恰是利用無監(jiān)督學(xué)習(xí)來對(duì)深層神經(jīng)網(wǎng)絡(luò)進(jìn)行預(yù)訓(xùn)練。對(duì)無監(jiān)督數(shù)據(jù)的學(xué)習(xí)能力嚴(yán)重不足,以致大量無監(jiān)督數(shù)據(jù)就像富含黃金的沙海,我們卻沒有高效淘金的利器。直接從大量無監(jiān)督數(shù)據(jù)中學(xué)習(xí)模型確實(shí)是非常困難的,“無師自通”并非朝夕之功,但“少量有監(jiān)督數(shù)據(jù)+大量無監(jiān)督數(shù)據(jù)”的模式也許值得大力研究。

  監(jiān)控?cái)z像機(jī):智能是左手,高清是右手

  從模擬到720p到1080p到4K,更高清甚至超清的監(jiān)控?cái)z像機(jī)始終是安防人的首要關(guān)注點(diǎn),畢竟沒有有效的圖像采集信息,后面一切圍繞圖片或視頻展開的智能應(yīng)用都是紙上談兵。

  一個(gè)很典型的例子便是2013年波士頓馬拉松暴恐案的偵破過程,警方在監(jiān)控畫面中定位到涉案的兩個(gè)嫌疑人,盡管嫌疑人距離監(jiān)控?cái)z像機(jī)不遠(yuǎn),但他們的面部完全沒有到達(dá)一個(gè)清晰可辨的程度,后來警方借助現(xiàn)場(chǎng)媒體、民眾提供的視頻、照片,才鎖定了犯罪嫌疑人。因此,如果數(shù)據(jù)在采集過程中就沒有捕捉到,后期是沒有辦法把它捏造出來的,要根本解決這個(gè)問題,需要發(fā)明更好的監(jiān)控?cái)z像機(jī),能夠在大廣角的情況下,仍然可以看清很遠(yuǎn)的距離。時(shí)至今日,除了特定場(chǎng)景下的高空瞭望攝像機(jī)外,我們依然沒有很好的監(jiān)控?cái)z像機(jī)可以遠(yuǎn)距離采集有效的人臉信息。

  總結(jié)

  人臉識(shí)別的最終訴求莫過于確認(rèn)身份,回答“他是誰?”、“他在干什么?”、“何地?”、“何時(shí)?”這四個(gè)問題,從而通過決策推理解決“應(yīng)該采取什么措施”的問題。在科研上,人臉識(shí)別技術(shù)日新月異,但落地到實(shí)際應(yīng)用時(shí),大規(guī)模部署時(shí)系統(tǒng)的經(jīng)濟(jì)性、復(fù)雜環(huán)境下系統(tǒng)的魯棒性以及對(duì)應(yīng)的硬件支撐都是需要考慮的現(xiàn)實(shí)問題,解決了這些,小目標(biāo)的達(dá)成也將觸手可及。

  (作者現(xiàn)任職于蘇州科達(dá)科技股份有限公司)
 

參與評(píng)論
回復(fù):
0/300
文明上網(wǎng)理性發(fā)言,評(píng)論區(qū)僅供其表達(dá)個(gè)人看法,并不表明a&s觀點(diǎn)。
0
關(guān)于我們

a&s傳媒是全球知名展覽公司法蘭克福展覽集團(tuán)旗下的專業(yè)媒體平臺(tái),自1994年品牌成立以來,一直專注于安全&自動(dòng)化產(chǎn)業(yè)前沿產(chǎn)品、技術(shù)及市場(chǎng)趨勢(shì)的專業(yè)媒體傳播和品牌服務(wù)。從安全管理到產(chǎn)業(yè)數(shù)字化,a&s傳媒擁有首屈一指的國際行業(yè)展覽會(huì)資源以及豐富的媒體經(jīng)驗(yàn),提供媒體、活動(dòng)、展會(huì)等整合營銷服務(wù)。

免責(zé)聲明:本站所使用的字體和圖片文字等素材部分來源于互聯(lián)網(wǎng)共享平臺(tái)。如使用任何字體和圖片文字有冒犯其版權(quán)所有方的,皆為無意。如您是字體廠商、圖片文字廠商等版權(quán)方,且不允許本站使用您的字體和圖片文字等素材,請(qǐng)聯(lián)系我們,本站核實(shí)后將立即刪除!任何版權(quán)方從未通知聯(lián)系本站管理者停止使用,并索要賠償或上訴法院的,均視為新型網(wǎng)絡(luò)碰瓷及敲詐勒索,將不予任何的法律和經(jīng)濟(jì)賠償!敬請(qǐng)諒解!
? 2024 - 2030 Messe Frankfurt (Shenzhen) Co., Ltd, All rights reserved.
法蘭克福展覽(深圳)有限公司版權(quán)所有 粵ICP備12072668號(hào) 粵公網(wǎng)安備 44030402000264號(hào)
用戶
反饋