一、什么是數(shù)據(jù)標(biāo)注?
數(shù)據(jù)標(biāo)注是對計(jì)算機(jī)視覺或自然語言處理 (NLP)可識別的材料內(nèi)容進(jìn)行標(biāo)記的過程。當(dāng)我們標(biāo)記或標(biāo)注這些類型的數(shù)據(jù)時(shí),它們變得更容易輸入算法或編程以通過 NLP 進(jìn)行解釋。
數(shù)據(jù)標(biāo)注是大部分人工智能算法得以有效運(yùn)行的關(guān)鍵環(huán)節(jié)。簡單來說,數(shù)據(jù)標(biāo)注是對未經(jīng)處理過的語音、圖片、文本、視頻等數(shù)據(jù)進(jìn)行加工處理,從而轉(zhuǎn)變成機(jī)器可識別信息的過程。
二、數(shù)據(jù)標(biāo)注的意義
得益于數(shù)據(jù)標(biāo)注,人工智能 (AI) 或機(jī)器學(xué)習(xí)模型可以解釋高質(zhì)量圖像和視頻以及文本中的數(shù)據(jù)。數(shù)據(jù)標(biāo)注使自動(dòng)駕駛汽車等機(jī)器學(xué)習(xí)項(xiàng)目能夠成功地將我們帶到目的地。
三、數(shù)據(jù)標(biāo)注的主要類型
圖像標(biāo)注:圖像標(biāo)注是對未經(jīng)處理的圖片數(shù)據(jù)進(jìn)行加工處理,轉(zhuǎn)換為機(jī)器可識別信息,然后輸送到人工智能算法和模型里完成調(diào)用。常見的圖像標(biāo)注方法有語義分割、矩形框標(biāo)注、多邊形標(biāo)注、關(guān)鍵點(diǎn)標(biāo)注、點(diǎn)云標(biāo)注、3D立方體標(biāo)注、2D/3D融合標(biāo)注、目標(biāo)追蹤等。
語音標(biāo)注:語音標(biāo)注是數(shù)據(jù)標(biāo)注行業(yè)中一種比較常見的標(biāo)注類型。語音標(biāo)注的就是標(biāo)注員把語音中包含的文字信息、各種聲音先“提取”出來,再進(jìn)行轉(zhuǎn)寫或者合成,標(biāo)注后的數(shù)據(jù)主要被用于人工智能機(jī)器學(xué)習(xí),這相當(dāng)于給計(jì)算機(jī)系統(tǒng)裝上了“耳朵”,使其具備了“能聽”的功能,使計(jì)算機(jī)可以實(shí)現(xiàn)精準(zhǔn)的語音識別能力。
文本標(biāo)注:當(dāng)對文本進(jìn)行數(shù)據(jù)標(biāo)注時(shí),它只是幫助人工智能和機(jī)器改進(jìn)語音識別的一種方式。通過標(biāo)注,人工智能可以更好地理解人類之間的交流和說話過程。在實(shí)際使用方面,人工智能可以利用文本標(biāo)注來充分理解用戶所說的內(nèi)容并提供有意義的回應(yīng)。
視頻標(biāo)注:與文本標(biāo)注不同,視頻標(biāo)注充分利用視頻來解釋多個(gè)移動(dòng)對象之間發(fā)生的事情。通過視頻標(biāo)注,逐幀分析對象。自動(dòng)駕駛汽車等自動(dòng)駕駛汽車可以使用帶有視頻標(biāo)注的訓(xùn)練數(shù)據(jù)來幫助識別和避開障礙物。