“更好的數據意味著更好的決策”。這句話如今被越來越多智能駕駛領域人士提及和認可。
讓汽車具備“智慧”,智能駕駛成為全球許多國家都在關注的一個重要課題。而在這一過程中,AI數據對于汽車智能駕駛而言至關重要,它是汽車變得更“聰明”的關鍵。然而,關于智能駕駛引發的事故我們也已經看到太多,這些教訓也在告誡我們,我們需要更加安全的智能駕駛,需要更多精準的數據為安全保駕護航,能夠在汽車感知、規劃、決策、控制方面進行指揮,才是真正的人工智能。
在汽車智能駕駛的過程中,汽車本身需要具備感知、策劃、決策、控制等一些列能力,而數據則是培養智能駕駛AI能力的重要因素,數據標注存在的意義是讓機器理解并認識世界,想要讓汽車本身的算法做到處理更多、更復雜的場景,背后就需要有海量的真實道路場景數據做支撐。
算力、算法方興未艾:高質量數據成產業落地著力點
數據、算力、算法是推動人工智能技術進步的“三駕馬車”。如今,在計算機視覺、語音識別領域,AI的商業化落地突破并不明顯,原因就在于算法算力的技術瓶頸。
從宏觀角度來看,現有算法、算力無法準確處理復雜環境下無限可能的長尾場景,這時候AI數據的覆蓋就顯得更加重要。
我們看到,在現有的算法算力的基礎上,越來越多的AI進化方式是通過對大量的原始數據進行框選、提取、分類,從而將復雜的原始數據標簽化,轉為機器學習可以識別的精準數據,以提升AI的感知能力。
對于智能駕駛技術而言,這樣的數據精確化顯得更為重要:一方面,現實交通場景復雜、安全威脅多,非常重視數據分析的效率和敏捷。尤其是國內路況的復雜性和國內智能駕駛起步稍晚的現狀,更需要高質、更精準的數據來進行算法訓練。
從安全性上來看,標注數據質量的高低將直接影響智能駕駛的安全性。例如,人像、建筑物、植物、道路、交通標志、車輛等數據標注的準確性直接決定智能駕駛AI對于路況的判斷,數據標注偏差或者完成度不高會直接影響行駛安全。
2017年5月17日,美國加利福尼亞州一名車主在開啟了智能駕駛狀態下撞上前方轉彎的卡車不幸身亡。原因是智能駕駛系統沒有辨別出前方白色車輛和天空的區別,沒有識別出障礙物導致智能剎車沒有及時制動引發的事故。
從體驗上,首先安全性的保證本身就是最佳的體驗,精準的數據是確保AI智能駕駛落地的重要前提。兼備數量與質量的標注數據可以很大程度上提升汽車智能駕駛的安全性與實用性,如何解決數據質量問題,規避數據錯誤、保障數據質量已經成為智能駕駛領域發展的頭等大事。
“當下,人工智能正加速往應用人工智能方向發展,在算法、算力沒有重大突破的前提下,質量高和安全性強的數據成為人工智能商業化落地的關鍵點。”Testin云測CTO陳冠誠在接受媒體采訪時表示。
從產業的角度來看,智能駕駛的產業化落地將成為高精度數據標注行業未來發展方向的一個重要縮影,高質量數據在促使自動駕駛產業化落地的同時,也成為數據產業商業化程度不斷深入的著力點。
云測數據優勢:專業定制、獨立安全,方能有的放矢
數據是整個人工智能行業的燃料,數據在智能駕駛領域的重要性不容置疑。絕大部分智能駕駛企業對數據也非常重視,但現實情況是缺乏獲得大量且高質量數據的渠道。
據2018年智研發布的《2019-2025年中國數據標注與審核行業市場專項分析研究及投資前景預測報告》顯示,近幾年,數據標注與審核行業快速發展,2018年市場規模已達到52.55億元,阿里、騰訊、百度等多家互聯網巨頭都擁有海量的數據標注需求。
實際上,數據標注是一個簡單又困難的事情,一方面,在執行上的難度相對算法開放要低得多,但另一方面數據標注本質上是要獲得更準確,更精細化的數據結果,而場景數據缺失、數據質量良莠不齊,以及隱私安全問題成為數據行業面臨的三大痛點。
為解決這些行業性問題,國內AI數據服務頭部企業云測數據,通過提供定制化的場景化數據,來滿足業內高標準的數據需求。
以云測數據的場景化為例,為了滿足智能駕駛領域不同場景的特殊需求,云測數據搭建了自己的場景實驗室,為各種智能駕駛細分場景模擬無噪的專屬數據,通過定制化數據采集直擊特定場景化下的數據缺失、質量良莠不齊等行業問題。一方面,在場景下的定制化數據采集更加精準、數據質量更高,另一方面,定制化的數據集也與智能駕駛需求端的匹配度更高,從而最大化將數據轉化為生產力。
對于智能駕駛來講,無噪的專屬數據采集完成后,數據通過標注后或者說加上標簽才有意義,才能用于算法的學習和訓練,最終智能駕駛的應用落地。
當前的自動駕駛所需數據需求,正向著多模態的方向發展。所謂多模態,即是對多維時間、空間、環境數據的感知與融合。比如當前的自動駕駛需要雷達+攝像頭才能跑的更穩,相對應的,就需要2D/3D融合標注工具。
在標注工具方面,云測數據自研了一套可以支持圖片、語音、文本等多品類的標注平臺,其中的三維標注工具,尤其是3D點云的標注工具,對雷達成像的圖像中的機動車、障礙物、行人等多目標進行3D標注,并通過渲染引擎的優化,來保證整個過程的流暢和快捷,在數據質量的導向下實現更優的品控和更快的數據交付,當屬業內領先。對此,數據數據總經理賈宇航表示,“我們希望通過精準高質、獨立安全的數據幫助智能駕駛客戶快速構建核心數據壁壘。”
值得一提的是,智能駕駛客戶在選擇數據供應商時,獨立第三方數據標注公司更具優勢。
某業內人士在接受采訪時表示“考慮到大廠能也有自動駕駛的團隊或業務,難免會擔心自家數據被拿去訓練別人的模型;再加上要價不菲,所以合作并不多。如果跟第三方數據標注公司合作,就不用擔憂這種問題。他們要價合理,而且既不會把數據外泄,也不會自用。”
目前云測數據在華東、華北、華南設有數據標注基地,還有幾個基地在部署中,并擁有行業內最大規模的專業數據服務全職人員,用來構建整體 AI 數據的生態。
尾聲:
隨著AI技術商業化的持續深入,算法、算力方興未艾之時,場景化的數據成為推動AI深入長尾應用的關鍵推動力。
作為人工智能領域內最值得期待的場景,智能駕駛產業落地的大門已然開啟。場景化、定制化的高質量的數據已成為智能駕駛領域最需要的基礎動力之一,而數據產業也將在不斷深入的產業落地中,為科技的進步和發展貢獻著力量。
編輯:hfy
-
AI
+關注
關注
88文章
35168瀏覽量
280111 -
人工智能
+關注
關注
1807文章
49029瀏覽量
249649 -
智能駕駛
+關注
關注
4文章
2815瀏覽量
49978 -
自動駕駛
+關注
關注
790文章
14323瀏覽量
170706
發布評論請先 登錄
評論