據(jù)悉,湯曉鷗教授領(lǐng)導(dǎo)的計(jì)算機(jī)視覺(jué)研究組 (mmlab.ie.cuhk.edu.hk) 開(kāi)發(fā)了一個(gè)名為DeepID的深度學(xué)習(xí)模型, 在LFW (Labeled Faces in the Wild)數(shù)據(jù)庫(kù)上獲得了99.15%的識(shí)別率,這也是有史以來(lái)首次超過(guò)99%的LFW識(shí)別率。
在此之前,,F(xiàn)acebook發(fā)布了另一套基于深度學(xué)習(xí)的人臉識(shí)別算法DeepFace,在LFW上取得了97.35%的識(shí)別率。本次湯曉鷗教授的研究團(tuán)隊(duì)發(fā)布的DeepID在實(shí)驗(yàn)數(shù)據(jù)的應(yīng)用數(shù)量上只有20萬(wàn),但是錯(cuò)誤率更低。
在談到人臉識(shí)別領(lǐng)域的時(shí)候,湯曉鷗教授表示從學(xué)術(shù)上來(lái)講,人臉識(shí)別技術(shù)起到了一個(gè)標(biāo)桿的作用,對(duì)于其他研究有著深度的借鑒意義。他同時(shí)表示,從2000年從事人臉識(shí)別技術(shù)研發(fā)開(kāi)始,已經(jīng)有了10多年的科研經(jīng)驗(yàn),除了人臉識(shí)別之外,包括檢測(cè)、定位、表情、姿態(tài)等相關(guān)技術(shù)也有涉及。
湯曉鷗教授還特別談到了DeepID的主要內(nèi)容——deep learning,這是一種模仿人大腦的學(xué)習(xí)過(guò)程,是一項(xiàng)比較開(kāi)創(chuàng)性的工作。DeepID的識(shí)別率要高于人眼,意味著替代人類(lèi)做更可靠的工作,很多靠人工識(shí)別圖像的工作可以由機(jī)器承擔(dān)。
在談到NVIDIA的加速作用時(shí),湯曉鷗教授表示——用了NVIDIA Tesla K40以后,GPU可以將計(jì)算時(shí)間提高幾十到上百倍,大大縮短模型生成過(guò)程的時(shí)間。就現(xiàn)有項(xiàng)目里的實(shí)際情況,原來(lái)30天的計(jì)算量,現(xiàn)在10個(gè)小時(shí)就可以完成。NVIDIA給了我們很多支持,我們要做成世界第一,最后我們也實(shí)現(xiàn)了。
在談到DeepID人臉識(shí)別技術(shù)的市場(chǎng)化時(shí),湯曉鷗教授認(rèn)為它將有助于提升智慧城市的實(shí)現(xiàn)速度。不過(guò)他也談到目前該項(xiàng)技術(shù)還僅限于小眾范圍應(yīng)用,大規(guī)模的普及還需要市場(chǎng)的檢驗(yàn)。