據(jù)英國(guó)《金融時(shí)報(bào)》報(bào)道,微軟目前已經(jīng)悄然刪除其最大的公開人臉識(shí)別數(shù)據(jù)庫(kù)——MSCeleb。
MSCeleb數(shù)據(jù)庫(kù)2016年建立,擁有超過1000萬張圖像,將近10萬人的面部信息。微軟描述其為世界上最大的公開面部識(shí)別數(shù)據(jù)集,并用于培訓(xùn)全球科技公司和軍事研究人員的面部識(shí)別系統(tǒng)。據(jù)了解,數(shù)據(jù)庫(kù)中的面孔來自公眾人物,但許多人并沒有授權(quán)微軟使用自己的面部照片。相反,微軟是通過“知識(shí)共享”許可來抓取圖像和視頻的。根據(jù)“知識(shí)共享”許可,你可以將照片用于學(xué)術(shù)研究,但照片中的人物并不一定授權(quán)許可,而是擁有版權(quán)所有者授權(quán)。
微軟技術(shù)與研究院首席研究員 / 研究經(jīng)理張磊博士曾對(duì)外表示,MS-Celeb-1M 的目標(biāo)是識(shí)別百萬人臉,是計(jì)算機(jī)視覺內(nèi)最大規(guī)模的分類問題,并且其中一個(gè)人物對(duì)應(yīng)一個(gè) entity,綁定了知識(shí)庫(kù),并且知識(shí)庫(kù)中提供了每個(gè)人的職業(yè),性別等等豐富的信息,從而解決了人物重名的問題,可以從識(shí)別達(dá)到認(rèn)知。
雖然在微軟的認(rèn)知中,最開始這個(gè)數(shù)據(jù)集是面向?qū)W術(shù)界做的,但后來,這一數(shù)據(jù)集被許多工業(yè)界的同行所使用。根據(jù)相關(guān)的引文資料,MS-Celeb-1M 數(shù)據(jù)庫(kù)已經(jīng)被多商業(yè)機(jī)構(gòu)所使用,比如說 IBM、松下電氣、阿里巴巴、輝達(dá)、日立、商湯科技、曠視科技等,甚至有消息稱,也有相關(guān)的軍事研究人員采用了這一數(shù)據(jù)庫(kù)來訓(xùn)練面部識(shí)別系統(tǒng)。
“這個(gè)網(wǎng)站是用于學(xué)術(shù)用途,它是由一位已經(jīng)不在Microsoft工作的員工運(yùn)行的,并且已被刪除?!蔽④浄Q。不過,即使MSCeleb已被刪除,其內(nèi)容仍可以從網(wǎng)絡(luò)上下載獲得。“你不能讓數(shù)據(jù)庫(kù)消失。一旦你發(fā)布它,人們下載它,它就存在于全世界的硬盤上?!卑l(fā)現(xiàn)MSCeleb數(shù)據(jù)庫(kù)侵權(quán)問題的柏林研究員AdamHarvey在接受媒體采訪時(shí)稱。
值得一提的是,伴隨著微軟刪除了 MS-Celeb-1M 數(shù)據(jù)庫(kù),另外兩個(gè)學(xué)術(shù)單位也刪除了它們旗下的類似相關(guān)數(shù)據(jù)庫(kù),包括由杜克大學(xué)研究人員建造的 Duke MTMC 監(jiān)控?cái)?shù)據(jù)庫(kù)和斯坦福大學(xué)的 Brainwash 數(shù)據(jù)庫(kù)。