數據标注的(de)應用場景

發布時間:2022-02-11 14:25:56 閱讀次數:483

  數據标注的(de)應用場景

  智能安防

  智能安防是人工智能與信息技術結合的(de)關(guān)鍵領域,對于城市(shì)與民生發展有(yǒu)重要的(de)意義。通過生物識别、行(xíng)為(wèi)監測等技術手段,廣泛地(dì)應用于城市(shì)道(dào)路監控、車輛人流監測、公共安全防範等領域。

  人臉标注在智能安防中主要應用于人臉識别與身份識别。

  人臉識别也稱人像識别、面部識别,是基于人的(de)臉部特征信息進行(xíng)多年(nián)齡段、多角度、多表情、多光線的(de)人臉圖像采集,從而完成身份識别的(de)一(yī)種生物識别技術。人臉識别涉及的(de)技術主要包括計算機(jī)視(shì)覺、圖像處理(lǐ)等。

  人臉識别(視(shì)覺識别技術的(de)一(yī)種應用)在國(guó)內(nèi)的(de)應用大緻經曆從公共安全領域擴展到商(shāng)業領域的(de)過程。最初,機(jī)場、高(gāo)鐵站以及酒店等場景使用這項技術對個人身份進行(xíng)驗證,随後商(shāng)業銀行(xíng)也開始采用人臉識别實現遠程開戶。再之後,刷臉支付、刷臉門禁也相繼出現,人臉識别逐漸從少數有(yǒu)限場景滲透到人們(men)的(de)日常生活之中,目前,人臉識别技術已廣泛應用于多個領域,除了智能安防之外,還應用于金融、司法、公安、邊檢、航天、電力、教育、醫療等衆多領域。

  此外,物品标注在智能安防應用中,物品标注需要和(hé)行(xíng)為(wèi)标注結合。

  智能交通

  近年(nián)來,随着人工智能浪潮的(de)興起,無人駕駛、智能交通安全系統一(yī)度走進我(wǒ)們(men)的(de)生活,國(guó)內(nèi)許多公司紛紛投入到自(zì)動駕駛和(hé)無人駕駛的(de)研究,例如(rú)百度啟動的(de)“百度無人駕駛汽車”計劃,其自(zì)主研發的(de)無人駕駛汽車Apollo還曾亮(liàng)相2018年(nián)央視(shì)春晚。

  在汽車自(zì)動駕駛的(de)過程中,想要讓汽車本身的(de)算法做(zuò)到處理(lǐ)更多、更複雜的(de)場景,背後就需要有(yǒu)海量的(de)真實道(dào)路數據做(zuò)支撐。而這就需要依靠數據标注。

  此外還有(yǒu)智慧停車,這些也都要依賴于人工智能數據标注的(de)介入,對于行(xíng)車視(shì)頻進行(xíng)采集,路況進行(xíng)提取,停車點進行(xíng)标注,包括D點雲障礙物、紅(hóng)綠(lǜ)燈、車道(dào)燈及高(gāo)精地(dì)圖。為(wèi)行(xíng)人識别、車輛識别、紅(hóng)綠(lǜ)燈識别、車道(dào)線識别等技術提供精确訓練數據,為(wèi)智能交通保駕護航。

  智能醫療

  智能醫療是通過打造健康檔案區域醫療信息平台,利用最先進的(de)物聯網技術,實現患者與醫務人員、醫療機(jī)構、醫療設備之間的(de)互動,逐步達到信息化。AI與醫療行(xíng)業的(de)結合将有(yǒu)望迎來跨越式發展。

  醫療影像标注是對醫療影像進行(xíng)區域标注及分類标注,多應用于輔助臨床診斷。人工智能通過學(xué)習大量的(de)醫療影像标注數據集,将會很好的(de)輔助醫生進行(xíng)臨床診斷以及提出治療方案。

  得數據者,得人工智能

  人工智能主要算法應用領域集中在計算機(jī)視(shì)覺、語音識别/語音合成,以及自(zì)然語言處理(lǐ)三個方面。

  圖像方面:一(yī)個新研發的(de)計算機(jī)視(shì)覺算法需要上萬張到數十萬張不等的(de)标注圖片訓練,新功能的(de)開發需要近萬張圖片訓練,而定期優化算法也有(yǒu)上千張圖片的(de)需求,一(yī)個用于智慧城市(shì)的(de)算法應用,每年(nián)都有(yǒu)數十萬張圖片的(de)穩定需求。

  語音方面:頭部公司累計應用的(de)标注數據集已達百萬小時以上,每年(nián)需求仍以20%-30%的(de)增速上升,要求數據服務商(shāng)不僅要掌握專業的(de)聲學(xué)知識、數據标注經驗,還要擁有(yǒu)語音合成的(de)算法能力。

  自(zì)然語言處理(lǐ)方面:随着工業、醫療、教育的(de)AI應用産品進一(yī)步爆發,将會有(yǒu)更多交互方式出現,自(zì)然語義數據處理(lǐ)的(de)需求将會持續增長(cháng),有(yǒu)望成為(wèi)繼圖像、語音之後的(de)第三大增量市(shì)場。

  有(yǒu)多少智能,就有(yǒu)多少人工

  這些海量的(de)數據幾乎全部依賴數據标注師手工進行(xíng)标注,數據标注行(xíng)業的(de)缺口十分可(kě)觀,并且數據标注已經在各行(xíng)業産生了極廣的(de)應用,行(xíng)業也開始逐漸升級,走向産業化。

  在數據标注行(xíng)業流行(xíng)着一(yī)句話,“有(yǒu)多少智能,就有(yǒu)多少人工”。

  近日,來自(zì)普林斯頓大學(xué)、康奈爾大學(xué)、蒙特利爾大學(xué)以及美國(guó)國(guó)家統計科(kē)學(xué)研究院共同發表的(de)最新論文指出,這部分手動标記工作大多在美國(guó)及其他西方國(guó)家之外完成,并對全球各地(dì)的(de)工人施以殘酷剝削。

  以 Sama(原 Samasource)、Mighty AI 以及 Scale AI 等數據标記公司為(wèi)例,他們(men)主要使用來自(zì)撒哈拉以南非洲以及東南亞地(dì)區的(de)勞動力,每天支付給員工的(de)薪酬僅為(wèi) 8 美元(折合成人民币為(wèi) 51.6 元)。但與此同時,這些企業每年(nián)卻能賺取數千萬美元的(de)巨額收益。

  現代人工智能依賴各種算法處理(lǐ)規模達數百萬的(de)示例、圖像或文本素材。但在此之前,首先需要由工作人員在圖片數據集中手動标記出對象,再将标記完成的(de)大量圖像交付給算法以學(xué)習模式,掌握如(rú)何準确識别對象。這類工作量極大、過程極其枯燥且耗時的(de)手動數據标記過程,已經成為(wèi) AI 經濟體系中的(de)重要組成部分。

  未來,随着AI應用場景逐漸多領域化,在數據标注行(xíng)業內(nèi)部,從業者也必将随着AI行(xíng)業而一(yī)同進入細分市(shì)場追逐階段,可(kě)謂機(jī)遇與挑戰并行(xíng)。


在線客服 聯系方式 二維碼

電話

17791672784

掃一(yī)掃,關(guān)注我(wǒ)們(men)