什麼是數據标注?(案例說明)

發布時間:2021-02-11 14:24:58 閱讀次數:520

  1.下面演示一(yī)個實際案例,幫您更好的(de)了解這類崗位。

  理(lǐ)解數據标注之前先來理(lǐ)解一(yī)下機(jī)器學(xué)習,簡單來講,機(jī)器學(xué)習就是讓計算機(jī)也可(kě)以‘聽音識曲’、認識‘花鳥魚蟲’。而數據标注就可(kě)以理(lǐ)解為(wèi)手把手教機(jī)器‘讀書寫字’的(de)老師,那麼,教授過程中所使用的(de)‘教材’和(hé)‘教學(xué)方法’分别是什麼呢(ne)?比如(rú),本節課的(de)內(nèi)容是教授計算機(jī)識别圖片中的(de)貓,則所用的(de)‘教材’就是大量的(de)貓的(de)圖片,‘教學(xué)方法’就是數據标注員将各圖片中的(de)貓标注出來,并告訴計算機(jī)‘這是一(yī)隻貓’,目的(de)是通過這樣大量的(de)、反複不斷的(de)練習,使計算機(jī)掌握貓的(de)特征,當再次拿到新的(de)關(guān)于貓的(de)圖片後,計算機(jī)可(kě)以将其自(zì)動識别,也就是說數據标注的(de)核心是标出想讓計算機(jī)學(xué)習的(de)內(nèi)容,通過反複訓練讓其掌握學(xué)習內(nèi)容的(de)特點并達到自(zì)動識别的(de)效果。

  2.如(rú)何進行(xíng)數據标注

  仍以教授計算機(jī)識别貓為(wèi)例,過程如(rú)下:

什麼是數據标注?通過一(yī)個案例了解下

  1) 收集大量的(de)關(guān)于貓的(de)圖片,并進行(xíng)數據清洗,包括去(qù)除無效數據、整理(lǐ)格式等,具體要求需要與算法人員确認。

  2) 将各圖片中的(de)貓進行(xíng)标注,标注完成後将圖片劃分為(wèi)訓練集和(hé)測試集,使用訓練集作為(wèi)計算機(jī)學(xué)習貓特征的(de)‘教材’,将測試集用來檢測計算機(jī)的(de)學(xué)習效果,得到本次學(xué)習的(de)準确率。

  3) 基于計算機(jī)的(de)學(xué)習效果,不斷優化标注過程,使得內(nèi)容對應的(de)特征更加準确、明了,從而使計算機(jī)擁有(yǒu)對貓更加準确的(de)識别能力。

  總的(de)來講,數據标注就是對收集的(de)數據,包括文本、圖片、語音等等,進行(xíng)整理(lǐ)與标注的(de)過程。以上就是數據标注類崗位日常工作中的(de)一(yī)個案例。

什麼是數據标注?通過一(yī)個案例了解下


在線客服 聯系方式 二維碼

電話

17791672784

掃一(yī)掃,關(guān)注我(wǒ)們(men)