“不可思議”的GPU集群賦能Autopilot系統及全自動駕駛的AI開發工作。
為了應對這項有史以來最大的計算挑戰之一,特斯拉需要配備前所未有的算力。
在本周的CVPR(國際計算機視覺與模式識別會議)上,汽車制造商特斯拉的AI高級總監Andrej Karpathy公布了公司內部用于訓練Autopilot與自動駕駛深度神經網絡的超級計算機。這個集群使用了720個節點的8個NVIDIA A100 Tensor Core GPU(共5760個GPU),實現了1.8 exaflops級別的超強性能。
Karpathy表示:“這是一臺性能卓越的超級計算機,以FLOPS計,它大概可以在全球超級計算機中排到第5位”。
通過將汽車行業前所未有的算力作為其研發周期的核心,特斯拉讓其自動駕駛汽車工程師能夠使用前沿技術來高效完成工作。
NVIDIA A100 GPU為全球最強的數據中心提供各種尺度的加速。A100 GPU基于NVIDIA Ampere架構打造,其性能比上一代產品高出20倍,并且可以劃分成7個GPU實例,動態地適配不同的需求。
使用100多萬輛在路上行駛的Tesla汽車(的數據)來持續優化和迭代新功能,是Tesla自動駕駛的垂直整合之道,而GPU集群在其中扮演了重要角色。
從汽車到數據中心
特斯拉的數據循環始于汽車。“影子模式”在不實際控制車輛的情況下,悄無聲息地執行著感知和預測深度神經網絡(DNN)。
任何錯誤預測、誤識別都會被記錄下來。隨后,這些實例會被特斯拉工程師所用,來創建/擴充一個包含多種復雜場景的訓練數據集,以完善DNN。
當前已經收集了100萬個以每秒36幀的速度記錄的10秒片段,總數據量高達1.5PB。在數據中心,DNN基于這些場景被反復訓練直到性能可接受。最后,DNN被發送回車內,并開始下一輪(數據)循環。
Karpathy表示,以這種方式在如此大量的數據上訓練DNN需要龐大的計算能力,特斯拉為此建立并部署了內置高性能A100 GPU的最新一代超級計算機。
連續迭代
除了全方位的訓練之外,特斯拉的超級計算機還為自動駕駛汽車工程師提供了在開發過程中進行實驗和迭代所需的性能。
Karpathy表示,特斯拉目前部署的DNN結構可以讓一個由20名工程師組成的團隊同時在一個網絡上工作,通過隔離不同功能來實現并行開發。
這些DNN運行訓練數據集的速度會比之前快速迭代時還更快。
Karpathy表示:“計算機視覺是我們一切工作的基礎,并且也是實現Autopilot的關鍵。為此,我們必須訓練一個龐大的神經網絡并進行大量實驗。這也是我們在算力方面投入大量資金的原因。”
歡迎自動駕駛領域的各位有志之士加入NVIDIA Developer Program,復制鏈接“https://developer.nvidia.com/login”在瀏覽器中打開即可注冊(請在Industry Segment注冊選項中選擇Automotive)。
編輯:jq
-
gpu
+關注
關注
28文章
4775瀏覽量
129357 -
計算機視覺
+關注
關注
8文章
1700瀏覽量
46127 -
dnn
+關注
關注
0文章
60瀏覽量
9089
原文標題:最新發布 | 特斯拉推出搭載NVIDIA A100 GPU頂尖自動駕駛汽車訓練超級計算機
文章出處:【微信號:NVIDIA-Enterprise,微信公眾號:NVIDIA英偉達企業解決方案】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
相關推薦
NVIDIA推出個人AI超級計算機Project DIGITS
NVIDIA DRIVE技術推動自動駕駛發展
NVIDIA Colossus超級計算機集群突破10萬顆Hopper GPU
NVIDIA 以太網加速 xAI 構建的全球最大 AI 超級計算機
![<b class='flag-5'>NVIDIA</b> 以太網加速 xAI 構建的全球最大 AI <b class='flag-5'>超級</b><b class='flag-5'>計算機</b>](https://file1.elecfans.com/web2/M00/0A/7A/wKgZomchjR-AfeU7AAHSQG3Nhog495.png)
丹麥推出首臺AI超級計算機Gefion
NVIDIA助力丹麥發布首臺AI超級計算機
NVIDIA Research端到端自動駕駛模型引領國際挑戰賽
FPGA在自動駕駛領域有哪些應用?
借助NVIDIA超級計算機加速量子計算發展
NVIDIA和Recursion利用AI超級計算機加快新藥研發
![<b class='flag-5'>NVIDIA</b>和Recursion利用AI<b class='flag-5'>超級</b><b class='flag-5'>計算機</b>加快新藥研發](https://file1.elecfans.com/web2/M00/E6/CA/wKgaomZFZciAI3NlAABz2OXwBxk365.png)
進一步解讀英偉達 Blackwell 架構、NVlink及GB200 超級芯片
富士通使用富岳超級計算機訓練LLM
如何提高自動駕駛汽車感知模型的訓練效率和GPU利用率
![如何提高<b class='flag-5'>自動駕駛</b><b class='flag-5'>汽車</b>感知模型的<b class='flag-5'>訓練</b>效率和<b class='flag-5'>GPU</b>利用率](https://file1.elecfans.com/web2/M00/DF/2C/wKgaomYu9GmAAVsGAAAujVSqbtM462.png)
評論