91在线观看视频-91在线观看视频-91在线观看免费视频-91在线观看免费-欧美第二页-欧美第1页

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

自動駕駛下的AI識別 數據標注賦能背后的自動化偽命題

高工智能汽車 ? 來源:未知 ? 作者:胡薇 ? 2018-05-24 09:40 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

智能駕駛中,汽車需要通過在感知、規劃、決策、控制方面的努力,讓機器具備“智力”。人們通常愿意把這一個過程,稱之為人工智能。

而事實上,所謂的智能只是一個結果,想要讓機械具備智能,過程當中需要無數人力勞動的堆砌。

數據標注就是這樣一個工作,它存在的意義便是讓機器理解、認識世界。通常的數據標注,一般有語音、文本、圖像等類型,工作人員需要更具行業的標準或者客戶要求,對相應的數據進行分類、畫框、注釋、標記等等,然后將結果數據反饋給客戶??蛻粢来藖碛柧殭C器對上述特征的認識,C端用戶所體驗到的智能語音交互、視覺圖像識別等都因此而來。

數據標注是一個重人工的工作,需要大量人員做簡單重復的工作,成本高昂,業內也在尋求一種自動化的方式。

業內人士告訴《高工智能汽車》,自動化數據標注在目前的行業內還屬于一個”遙遠的夢”,在可預見的時期內,數據標注還將以人為主。

數據標注分類

數據標注的對象通常有圖像、語音、文本、視頻、雷達等。圖像類主要針對視覺識別類公司,所要標注的圖像內容包括人像、建筑物、植物、道路、交通標志、車輛等,每項內容下面,又會根據不同的特征進行不同標簽的標注。

以應用最廣的人像為例,標注公司可能需要對目標的性別、年齡、膚色、著裝、表情、發型、姿態做出標志,方式會是畫框、打標簽等。

語音標注也是常見的一種,公司會將音頻的文字對照寫出,同時也可能會將語句中的主謂賓標出,方便機器學習。

隨著激光雷達在自動駕駛中頻繁的應用,雷達對障礙物掃描識別的需求也愈加頻繁,而如何讓激光雷達掃描到的物體通過更直觀的形式顯示給用戶,也成了要完成的工作。

數據標注公司會將激光雷達掃描出的物體大概,進行更精細的物體輪廓勾勒,同時也會對相應障礙物進行標識,包括但不限于名稱、類別,以及通過不同顏色進行展示。通過這種深度處理后,激光雷達也就間接具備了識別障礙物的能力。

無論圖像、語音還是雷達數據的標注,通常數據標注公司會有一套自己的標準,對數據進行分類,而目標客戶也會有自己的標注。

業內人士表示,一般而言,客戶會有自己的需求,公司依規而行。目前在國內,阿里巴巴、騰訊、百度等大型互聯網公司,擁有海量的數據標注需求,單個訂單量都是以億元為單位。如此大的訂單,基本都是分包給不同的數據標注公司進行處理,國內外還沒有一家公司能夠處理這樣大的訂單。

另外還有自動駕駛公司,以及視覺圖像處理的公司,也有著數據標注的強烈的需求,他們需要用標注后的數據來訓練人工智能,而人工智能的日趨成熟,是永無止境的。

勞動密集型產業

面對數據標注的巨大需求,整個行業的技術水平如何?在回答這個問題之前,首先給大家羅列一組數據。

ImageNet 是一個計算機視覺系統識別項目名稱,是由美國斯坦福的計算機科學家李飛飛教授領銜的團隊模擬人類的識別系統建立的,它是目前世界上圖像識別最大的數據庫——1,500 萬張標注圖片的數據集,這是來自 167 個國家的 48,940 名工作者,花費了 2 年時間,清理、分類、標記了近十億張通過互聯網搜集到的圖片,才得到的。

由于數據龐大又開源,ImageNet 很快成為成為研究圖像識別的首選。但盡管如此, ImageNet 也有自己的弱點:標注框太大、標注方式少和不時出現的錯誤,使它難以被用來訓練實際應用的算法模型。

從以上可以看出,即使是業內最強大的圖像識別庫,數據標注都是通過人工完成的。因此,其它宣傳數據標注自動化的,可信度較低。

業內人士透露,數據標注是一個簡單又困難的事情。簡單之處在于,確定了篩選規則以后,操作人員只需依規操作即可,沒有執行上的難度,而困難之處在于,數據標注本質上是要獲得更準確,更精細化的數據結果,高質量的數據是業內急需的。

但數據標注本身是一項枯燥的工作,工作人員需要對大量數據不斷進行重復勞動,數據的一致性很難保證。

而這些數據標注的工作,本身是為了提升機器學習的能力,因此這部分工作只能由人來完成,人與機器之間的鴻溝,正是機器要跨越的。

數據標注公司目前的做法,是雇傭部分專業的標注人員,然后再外聘一些兼職的人員,共同完成訂單。由于人工成本高昂,大部分數據標注公司,都將公司設在了三線以下的城市。

專業人員跟兼職人員的工作能力,還是存在一定的差距的。為了保證數據標注的質量,通常數據標注公司還會設立審核團隊,對標注后的數據進行把關。

數據的采集、標注都是專業性很強的工作,必須有針對性的對每個素材進行專業指導。培訓的過程包括了解目標 - 學習規則 - 線上培訓&錄像學習 - 實際場景練習 - 達標考試 - 進行工作 - 糾錯講解&改錯(如果錯誤嚴重、產出不達標會打回規則學習階段)。審核方面公司會采用多重交叉審核審核機制進行標注與審核,嚴格把控標注的每一道流程 。

業內人士表示,進行數據標注的人力成本還是較高,以語音數據為例,客戶通常會提供完整有效的數據音頻,然后以完成的有效時間段計量價格。

音頻通常會包含方言,雜音等,標注人員有時需要反復聽音頻,才能完成音頻轉文字的工作。一小時的音頻,常常需要一天才能完成,業內給出的價格通常在300元左右。

這個市場完全是自由市場,甲乙雙方一方面要兼顧成本、質量等因素,另一方面也要考慮到人力成本,由于技術含量低,上升空間小,做數據標注工作的大部分都是短期工,從業人員積極性低,面臨較大的人才流失問題。資本市場的博弈,最終要找到一個平衡點,讓工人愿意留下來繼續工作。

眾包下的半自動化

資本逐利,為了降成本,提效率,無論數據標注公司還是客戶,都在想辦法提升數據標注的效率。

人們談到更多的便是數據標注自動化,但業內人士表示,數據標注自動化是一個偽命題,除卻技術可行性,完成自動化所需要的人才,在業內都屬鳳毛麟角。

本質上而言,大公司是最有實力做這部分工作的,但現實是大公司的數據標注業務,基本都外包給了小工司來做。而小公司,則還沉浸在人海戰術中。

數據標注公司要提高標注的效率,以及降低成本,目前所努力的方向基本是眾包、半自動化。所謂的眾包,類似于國外高精地圖的采集,即公司將訂單發放到網上,讓擁有閑暇時間的網友來合力完成數據標注的工作,中間可能會涉及到給予一些獎勵,但相比現在的線下重勞力模式,已經減輕了不少成本。

但眾包的形式,對數據標注的工作流程,有了更高的要求。網絡用戶完成數據標注,一定要簡單,快速,容易上手,由此才能普及。目前的數據標注過程,需要人工畫框,打標簽,還需要后續的人工審核,整個流程較為復雜。

業內人士表示,現在能提高效率的工作,便是開發一套網上系統,將標注工作簡單化、標準化,為標注人員盡量減少一些重復簡單的工作。

開發這樣一套系統,需要專業的研發人員,而大部分數據標注公司,鮮少擁有余力來進行這一部分純粹投入、研發。因此,數據標注公司未來的目標是能夠實現半自動化的數據標注,而這背后,還仍然要依靠眾包。

所謂的自動化標注,本身是一個偽命題,如果數據都能通過自動化標注了,那本質上已經不需要標注了,因為人工智能已經有了如人一般的識別能力。而這一天什么時候會到來?眾所期待~

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 人工智能
    +關注

    關注

    1807

    文章

    49029

    瀏覽量

    249703
  • 智能駕駛
    +關注

    關注

    4

    文章

    2815

    瀏覽量

    49985

原文標題:自動駕駛下的AI識別,數據標注賦能背后的自動化偽命題 | GGAI視角

文章出處:【微信號:ilove-ev,微信公眾號:高工智能汽車】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    什么是自動駕駛數據標注?如何好做數據標注

    [首發于智駕最前沿微信公眾號]在自動駕駛系統的開發過程中,數據標注是一項至關重要的工作。它不僅決定了模型訓練的質量,也直接影響了車輛感知、決策與控制的性能表現。隨著傳感器種類和數據量的
    的頭像 發表于 07-09 09:19 ?249次閱讀
    什么是<b class='flag-5'>自動駕駛</b><b class='flag-5'>數據</b><b class='flag-5'>標注</b>?如何好做<b class='flag-5'>數據</b><b class='flag-5'>標注</b>?

    端到端數據標注方案在自動駕駛領域的應用優勢

    10-20TB,其中需要標注數據占比超過60%。在這樣的背景,端到端數據標注方案應運而生,正在重塑
    的頭像 發表于 06-23 17:27 ?303次閱讀

    淺析4D-bev標注技術在自動駕駛領域的重要性

    ?自動駕駛技術的發展日新月異。從最初簡單的輔助駕駛功能,逐步邁向高度自動化甚至完全自動駕駛的階段。其中,海量且精準的數據是訓練高性能
    的頭像 發表于 06-12 16:10 ?386次閱讀

    AI將如何改變自動駕駛?

    [首發于智駕最前沿微信公眾號]五一假期繼續閑聊一,還歡迎大家隨意留言,隨著人工智能(AI)的發展,很多車企及自動駕駛供應商正嘗試將AI融入自動駕駛
    的頭像 發表于 05-04 09:58 ?273次閱讀

    自動化標注技術推動AI數據訓練革新

    結果的高準確率,相對純人工標注效率可提升70%以上,為用戶提供更性價比的數據方案和服務。本文將就自動化標注平臺是什么以及為AI
    的頭像 發表于 03-14 16:46 ?692次閱讀

    標貝自動化數據標注平臺推動AI數據訓練革新

    結果的高準確率,相對純人工標注效率可提升70%以上,為用戶提供更性價比的數據方案和服務。本文將就自動化標注平臺是什么以及為AI
    的頭像 發表于 03-14 16:42 ?914次閱讀
    標貝<b class='flag-5'>自動化</b><b class='flag-5'>數據</b><b class='flag-5'>標注</b>平臺推動<b class='flag-5'>AI</b><b class='flag-5'>數據</b>訓練革新

    自動駕駛行業,分析數據標注在人工智能的重要性

    自動駕駛中,數據標注的作用尤為突出。自動駕駛系統依賴大量傳感器數據(如攝像頭、激光雷達、雷達等)來感知周圍環境,而這些
    的頭像 發表于 02-08 15:43 ?877次閱讀

    自動駕駛角度解析數據標注對于人工智能的重要性

    自動駕駛中,數據標注的作用尤為突出。自動駕駛系統依賴大量傳感器數據(如攝像頭、激光雷達、雷達等)來感知周圍環境,而這些
    的頭像 發表于 02-08 15:40 ?2948次閱讀
    以<b class='flag-5'>自動駕駛</b>角度解析<b class='flag-5'>數據</b><b class='flag-5'>標注</b>對于人工智能的重要性

    淺析基于自動駕駛的4D-bev標注技術

    4D-bev標注技術是指在3D空間中以時間作為第四個維度進行標注的過程。4D-bev通常在地場景較為復雜的自動駕駛場景中使用,其可以通過精準地跟蹤和記錄動態對象的運動軌跡、姿勢變化以及速度等信息,全面理解和分析動態對象在連續的時
    的頭像 發表于 12-06 15:01 ?3556次閱讀
    淺析基于<b class='flag-5'>自動駕駛</b>的4D-bev<b class='flag-5'>標注</b>技術

    標貝科技:自動駕駛中的數據標注類別分享

    的必要條件,數據采集、數據標注服務已成為支撐自動駕駛熱潮必不可少的一環。本文將以數據標注的視角,
    的頭像 發表于 11-22 15:07 ?2028次閱讀
    標貝科技:<b class='flag-5'>自動駕駛</b>中的<b class='flag-5'>數據</b><b class='flag-5'>標注</b>類別分享

    標貝科技:自動駕駛中的數據標注類別分享

    的必要條件,數據采集、數據標注服務已成為支撐自動駕駛熱潮必不可少的一環。本文將以數據標注的視角,
    的頭像 發表于 11-22 14:58 ?3833次閱讀
    標貝科技:<b class='flag-5'>自動駕駛</b>中的<b class='flag-5'>數據</b><b class='flag-5'>標注</b>類別分享

    自動駕駛汽車安全嗎?

    隨著未來汽車變得更加互聯,汽車逐漸變得更加依賴技術,并且逐漸變得更加自動化——最終實現自動駕駛,了解自動駕駛汽車的安全問題變得非常重要,這樣你才能回答“自動駕駛汽車安全嗎”和“
    的頭像 發表于 10-29 13:42 ?1127次閱讀
    <b class='flag-5'>自動駕駛</b>汽車安全嗎?

    FPGA在自動駕駛領域有哪些優勢?

    領域的主要優勢: 高性能與并行處理能力: FPGA內部包含大量的邏輯門和可配置的連接,能夠同時處理多個數據流和計算任務。這種并行處理能力使得FPGA在處理自動駕駛中復雜的圖像識別、傳感器數據
    發表于 07-29 17:11

    FPGA在自動駕駛領域有哪些應用?

    是FPGA在自動駕駛領域的主要應用: 一、感知算法加速 圖像處理:自動駕駛中需要通過攝像頭獲取并識別道路信息和行駛環境,這涉及到大量的圖像處理任務。FPGA在處理圖像上的運算速度快,可并行性強,且功耗
    發表于 07-29 17:09

    自動駕駛識別技術有哪些

    自動駕駛識別技術是自動駕駛系統中的重要組成部分,它使車輛能夠感知并理解周圍環境,從而做出智能決策。自動駕駛識別技術主要包括多種傳感器及其融
    的頭像 發表于 07-23 16:16 ?1506次閱讀
    主站蜘蛛池模板: 免费在线观看一级毛片 | 久精品视频村上里沙 | 国产手机在线国内精品 | 六月色播 | 色啦啦影院 | 精品国产柚木在线观看 | 国产理论视频在线观看 | 黄色三级在线看 | 欧美一区二区三区视频 | 久青草免费在线视频 | 你懂的免费在线观看 | www永久免费视频 | 午夜免费看片 | 91国内在线 | 啪啪小视频网站 | 天堂网在线资源www最新版 | 亚洲va久久久噜噜噜久久 | 色天天综合久久久久综合片 | 欧美人与物另类 | 可以看黄色的网站 | 性欧美视频videos6一9 | 伊人狠狠丁香婷婷综合色 | 好紧好爽太大了h快穿 | 免费观看三级毛片 | 好吊色7777sao在线视频观看 | 18毛片 | 五月六月伊人狠狠丁香网 | 成熟妇女毛耸耸性视频 | 天天看天天干天天操 | 欧美色图亚洲激情 | 男人午夜禁片在线观看 | 最刺激黄a大片免费观看下截 | 四虎黄色影院 | 久久福利青草精品资源站免费 | 狠狠操狠狠操 | 亚洲午夜顶级嘿嘿嘿影院 | 性欧美精品 | 美女网战色 | 亚洲美女啪啪 | 久久午夜影视 | wwwxx在线观看|