一、什么是數(shù)據(jù)標(biāo)注?
數(shù)據(jù)標(biāo)注是對(duì)計(jì)算機(jī)視覺(jué)或自然語(yǔ)言處理 (NLP)可識(shí)別的材料內(nèi)容進(jìn)行標(biāo)記的過(guò)程。當(dāng)我們標(biāo)記或標(biāo)注這些類型的數(shù)據(jù)時(shí),它們變得更容易輸入算法或編程以通過(guò) NLP 進(jìn)行解釋。
數(shù)據(jù)標(biāo)注是大部分人工智能算法得以有效運(yùn)行的關(guān)鍵環(huán)節(jié)。簡(jiǎn)單來(lái)說(shuō),數(shù)據(jù)標(biāo)注是對(duì)未經(jīng)處理過(guò)的語(yǔ)音、圖片、文本、視頻等數(shù)據(jù)進(jìn)行加工處理,從而轉(zhuǎn)變成機(jī)器可識(shí)別信息的過(guò)程。
二、數(shù)據(jù)標(biāo)注的意義
得益于數(shù)據(jù)標(biāo)注,人工智能 (AI) 或機(jī)器學(xué)習(xí)模型可以解釋高質(zhì)量圖像和視頻以及文本中的數(shù)據(jù)。數(shù)據(jù)標(biāo)注使自動(dòng)駕駛汽車等機(jī)器學(xué)習(xí)項(xiàng)目能夠成功地將我們帶到目的地。
三、數(shù)據(jù)標(biāo)注的主要類型
圖像標(biāo)注:圖像標(biāo)注是對(duì)未經(jīng)處理的圖片數(shù)據(jù)進(jìn)行加工處理,轉(zhuǎn)換為機(jī)器可識(shí)別信息,然后輸送到人工智能算法和模型里完成調(diào)用。常見(jiàn)的圖像標(biāo)注方法有語(yǔ)義分割、矩形框標(biāo)注、多邊形標(biāo)注、關(guān)鍵點(diǎn)標(biāo)注、點(diǎn)云標(biāo)注、3D立方體標(biāo)注、2D/3D融合標(biāo)注、目標(biāo)追蹤等。
語(yǔ)音標(biāo)注:語(yǔ)音標(biāo)注是數(shù)據(jù)標(biāo)注行業(yè)中一種比較常見(jiàn)的標(biāo)注類型。語(yǔ)音標(biāo)注的就是標(biāo)注員把語(yǔ)音中包含的文字信息、各種聲音先“提取”出來(lái),再進(jìn)行轉(zhuǎn)寫(xiě)或者合成,標(biāo)注后的數(shù)據(jù)主要被用于人工智能機(jī)器學(xué)習(xí),這相當(dāng)于給計(jì)算機(jī)系統(tǒng)裝上了“耳朵”,使其具備了“能聽(tīng)”的功能,使計(jì)算機(jī)可以實(shí)現(xiàn)精準(zhǔn)的語(yǔ)音識(shí)別能力。
文本標(biāo)注:當(dāng)對(duì)文本進(jìn)行數(shù)據(jù)標(biāo)注時(shí),它只是幫助人工智能和機(jī)器改進(jìn)語(yǔ)音識(shí)別的一種方式。通過(guò)標(biāo)注,人工智能可以更好地理解人類之間的交流和說(shuō)話過(guò)程。在實(shí)際使用方面,人工智能可以利用文本標(biāo)注來(lái)充分理解用戶所說(shuō)的內(nèi)容并提供有意義的回應(yīng)。
視頻標(biāo)注:與文本標(biāo)注不同,視頻標(biāo)注充分利用視頻來(lái)解釋多個(gè)移動(dòng)對(duì)象之間發(fā)生的事情。通過(guò)視頻標(biāo)注,逐幀分析對(duì)象。自動(dòng)駕駛汽車等自動(dòng)駕駛汽車可以使用帶有視頻標(biāo)注的訓(xùn)練數(shù)據(jù)來(lái)幫助識(shí)別和避開(kāi)障礙物。