人臉交換是一種深度偽裝技術(shù),利用人工智能和機(jī)器學(xué)習(xí),它可以將現(xiàn)有媒體中的人臉提取出來, 并將其替換為其他人的臉部特征,目前其已被MixBooth和SnapChat之類的應(yīng)用程序推廣開來,盡管其底層技術(shù)使復(fù)雜的圖像編輯成為可能,但它同時(shí)也引起了人們對潛在誤用或?yàn)E用的擔(dān)憂。
不同的組織已經(jīng)編譯了可操縱的媒體來支持人臉交換檢測方法的發(fā)展,但截止目前,以發(fā)布的樣本數(shù)量相對較少或者過于人工化,基于此,SenseTime 研究院的研究人員與新加坡南洋理工大學(xué)達(dá)成合作,共同開發(fā)了一種大規(guī)模人臉檢測數(shù)據(jù)集——“DeeperForensics-1.0”,研究人員表示該數(shù)據(jù)集是同類數(shù)據(jù)集中最大的一個(gè),擁有超過6萬個(gè)視頻,,其中包含大約1,760萬幀。
根據(jù)研究人員的說法,“DeeperForensics-1.0”中所有的源視頻都經(jīng)過精挑細(xì)選,它們的質(zhì)量和多樣性都很好。從表面來看,由于它們更接近現(xiàn)實(shí)世界中真實(shí)的檢測場景,所以它們比其他數(shù)據(jù)集更為真實(shí)。而且它們還包含壓縮、模糊和傳輸偽像,這些偽影與野外環(huán)境發(fā)現(xiàn)的是一致的。
為了構(gòu)建“DeeperForensics-1.0”,研究人員收集了來自26個(gè)不同國家的100名男女演員的面部數(shù)據(jù),他們的年齡20歲到45歲不等,所有人都被要求在9種燈光條件下轉(zhuǎn)動(dòng)頭,自然地用53種以上的表情進(jìn)行表達(dá)。他們通過AI框架(DeepFake Variational AutoEncoder簡稱DF-VAE)來運(yùn)行這些視頻,并使用1,000個(gè)YouTube視頻作為目標(biāo)視頻,100個(gè)演員的每一個(gè)面孔都被交換到10個(gè)目標(biāo)上。他們故意用35種不同的方式扭曲每個(gè)視頻來模擬真實(shí)世界的場景,從而使得最終的數(shù)據(jù)集包含了5萬個(gè)未經(jīng)處理的視頻和1萬個(gè)經(jīng)過處理的視頻。
“我們發(fā)現(xiàn),在建立高質(zhì)量數(shù)據(jù)集的過程中,源人臉比目標(biāo)人臉扮演著更為關(guān)鍵的角色,”研究人員在一份預(yù)先打印的論文中詳細(xì)介紹了他們的工作。“特別是源面部的表情、姿勢和光照條件應(yīng)該更加豐富,以實(shí)現(xiàn)可靠的面部交換。”
研究人員還在“DeeperForensics-1.0”中創(chuàng)建了他們所謂的“隱藏”測試集——一組精心挑選的400個(gè)視頻,以便更好地模擬真實(shí)場景中的假視頻。策劃這組視頻的過程包括收集由未知的換臉方法生成的偽造視頻,然后用真實(shí)場景中常見的失真掩蓋它們,最后只選擇在100個(gè)用戶研究中選擇至少欺騙了50個(gè)人類觀察者的50個(gè)視頻。
為了評估“DeeperForensics-1.0”與其他公開數(shù)據(jù)集的質(zhì)量,研究人員讓100名計(jì)算機(jī)視覺專家對其中包含的視頻子集的質(zhì)量進(jìn)行排名。報(bào)告稱,與FaceForensics++、Celeb-DF等其他流行的Deepfake檢測語料相比,“DeeperForensics-1.0”在真實(shí)性方面領(lǐng)先。
在未來的工作中,研究團(tuán)隊(duì)打算逐步擴(kuò)展DeeperForensics,并與研究界合作,共同確定面部偽造檢測方法的評估指標(biāo)。
從全球范圍來看,全球與深度偽造的斗爭似乎正在加劇。去年夏天,DARPA的Media Forensics計(jì)劃的成員測試了一種原型系統(tǒng),該系統(tǒng)可以通過查找不自然的閃爍等提示來自動(dòng)檢測AI生成的視頻;初創(chuàng)公司Truepic在去年7月融資了800萬美元,正在嘗試使用深度偽造的“檢測即服務(wù)”業(yè)務(wù)模型; 在2019年12月,F(xiàn)acebook與微軟、學(xué)者合作伙伴共同發(fā)起了Deepfake檢測挑戰(zhàn)賽,該挑戰(zhàn)賽將提供數(shù)百萬美元的贈(zèng)款和獎(jiǎng)勵(lì),以刺激Deepfake檢測系統(tǒng)的開發(fā)。
(本文編譯自外網(wǎng),內(nèi)容尚有增減)