今年GTC,英偉達將所有加速計算庫綁定到一個單一的品牌:CUDA-X AI庫;推出用于數據科學的“數據科學家工作站”;還發布了99美元的人工智能計算機Jetson Nano。英偉達的轉型路線也浮出水面。
GTC十年,英偉達開了一場“三無”發布會。
無新架構,無新GPU,無新戰略。
不過,這并不意味著英偉達CEO黃仁勛沒有對未來的思考。發布會上,英偉達將所有加速計算庫綁定到一個單一的品牌:CUDA-X AI庫;推出用于數據科學的“數據科學家工作站”;還發布了99美元的人工智能計算機Jetson Nano。
盡管發布會沒有出現外界期待的新架構,黃仁勛也沒有發布7納米GPU,但是整場發布會透露的關鍵詞正成為目前英偉達最重要、最急需的事情:新生態。
黃仁勛認為生態系統是GPU計算成功的關鍵,這種新生態系統需要幾個關鍵詞:
Domains(域)
Architecture(架構)
以下是黃仁勛的演講。
大秀英偉達顯卡特效,光線追蹤技術驚艷四射
黃仁勛的整場演講分三個章節:計算機圖形、AI和HPC、機器人。
在第一章之前,黃仁勛首先推出CUDA-X AI,這是加速數據科學的唯一端到端平臺。
CUDA-X AI能夠將機器學習和數據科學工作負載加速多達50倍,由十幾個專用加速庫組成。這些庫包括用于加速深度學習的cuDNN、用于加速數據科學工作流和機器學習算法的cuML、用于優化經過訓練的推理模型的TensorR、用于訪問數據科學API的cuDF、用于在graph上執行高性能分析的cuGraph,以及其他13個庫。
此外,軟件加速庫集成到所有深度學習框架中,包括TensorFlow,PyTorch和MXNet。
接下來正式進入第一章計算機圖形主題,黃仁勛不出所料的對英偉達的顯卡特效又大秀了一番。
現在實時播放Unity上運行的部分視頻,實時并不能提供足夠的空間分辨率。Unity的實驗包將于4月4日推出。
Unity增加了對Nvidia光線跟蹤技術的預覽支持,以推動游戲的真實性。
下圖的車燈照片,左右兩張幾乎一模一樣,你覺得哪張是假的呢?
答案是:右邊的車燈是假的。
黃仁勛說,這種逼真效果得益于英偉達圖靈RTX架構,畫面是實時渲染的。
Epic Games已經宣布了Unreal Engine 4.22對英偉達RTX光線追蹤的支持,Unity也只是時間問題,但現在這項技術正式進入了Unity的高清渲染管道(HDRP)預覽版。
這項技術的重點在于游戲如何更逼真地呈現照明,顯示光線如何與大氣及其撞擊物體的相互作用。這種技術已經在其他地方使用過,但所有這些都可能是資源密集型的,這使得過去幾年的進步將其作為一個實時系統如此引人矚目。
專注AI和HPC,收購Mellanox對抗英特爾
在演講了一個小時之后,黃仁勛終于開講第二章:AI和HPC。這部分主要由DGX和HGX組成。
數據科學是當今計算機科學領域不斷增長的領域,所有關于從數據中學習并從中做出預測的方法形成了AI。英偉達對待AI有了新的態度和行為:重新梳理數據科學領域和所有機器學習工具,從Hadoop到Spart再到TensorFlow。
英偉達擁有實現AI所有步驟和工具的庫,即黃仁勛之前強調的CUDA-X AI庫,而黃仁勛也在思考,如何把當前的這么龐大的生態系統以及硬件和軟件結合在一起。做法有二:
Tensor Cores Mixed Precision.已經添加到TensorFlow、PyTorch和MXNet中;
NVIDIA RAPIDS與Databricks的分析平臺集成。
目前,谷歌云和微軟云也添到RAPIDS中,TensorRT也已集成到Microsoft Onyx中。
除了集成和結合之外,英偉達還推出一款新的AI工具包,稱之為Clara,其核心是一系列預先訓練過的模型。
Clara是一個開放、可擴展的計算平臺,包含13個最先進的分類和分割AI的工具包,以及為放射科醫生構建的軟件工具,能夠讓開發人員將醫療成像應用程序構建和部署到混合(嵌入式、內部部署或云)計算環境中,以創建智能儀器和自動化醫療保健工作流程。
有了這些工具,英偉達在數據科學領域不斷突破。黃仁勛說,僅去年一年,英偉達的深度學習研究所通過各種形式培訓了10萬名數據科學家,基于此,英偉達決定為數據科學家提供一個定制的工作站。
這個工作站核心是GPU和CUDA-X AI庫,主打高性能計算和高速I/O。
黃仁勛認為,數據科學是新的HPC,超算和超大規模集群的區別在于,超算實際上做了很少的任務,而超大規模集群都是關于容量的,但是做了很多小工作。兩者需要不同的系統/集群架構。
而數據科學處于兩者中間位置,數據科學的任務比超大規模集群的任務更重,但比更少;比超級計算機更廣泛,這就是英偉達的DGX-2設備現在適用的地方。
在發布會現場,不久前被英偉達以69億美元收購的Mellanox公司CEO也上臺,闡述為什么Mellanox愿意賣身英偉達,以及他們如何看待網絡成為數據中心計算基礎設施的一部分。
英偉達的計算平臺和Mellanox的互聯網連接了全球250多臺TOP500超級計算機,并為每個主要的云服務提供商和計算機制造商提供服務。而隨著摩爾定律的結束,CPU性能的提升正在放緩,這導致大家會采用英偉達GPU和Mellanox智能網絡解決方案加速計算。滿足這種需求將需要整體架構,通過智能網絡結構連接大量快速計算節點,形成一個巨大的數據中心規模的計算引擎。
兩個小巨人聯手,英特爾在HPC領域的日子會難過嗎?
邊緣計算產品Jetson Nano:99美元的人工智能計算機
黃仁勛演講的第三章:機器人。為什么要為機器人提供邊緣算力?黃仁勛說,復雜的人工智能通常不適合自制設備,因為微型計算機很少能處理除了基本功能之外的東西。
因此,英偉達推出了入門級人工智能計算機Jetson Nano。
英偉達聲稱,Nano的128核基于maxwell的GPU和四核ARM A57處理器可以為神經網絡、高分辨率傳感器和其他機器人功能提供472GFLOPS的處理能力,同時只消耗很少的5W。
Jetson Nano關鍵特性:
GPU: 128-core NVIDIA Maxwell? architecture-based GPU
CPU: Quad-core ARM? A57
視頻: 4K @ 30 fps (H.264/H.265) / 4K @ 60 fps (H.264/H.265) 編碼&解碼
攝像頭: MIPI CSI-2 DPHY lanes, 12x (Module) and 1x (Developer Kit)
內存: 4 GB 64-bit LPDDR4; 25.6 gigabytes/second
Connectivity: Gigabit Ethernet
OS 支持: Linux for Tegra?
Module Size: 70mm x 45mm
Developer Kit Size: 100mm x 80mm
該套件可以直接運行Linux,并支持大量的AI框架(當然包括NVIDIA自己的框架)。 它配備了4GB的RAM,千兆以太網以及相機和其他附件所需的I/O。
雖然Nano的功能遠不如高端的Jetson強大,但目前個人版售價僅為99美元,面向企業的“production-ready”版售價為129美元。
未來的測試艦隊是虛擬的
黃仁勛在GTC大會上推出了NVIDIA DRIVE Constellation仿真平臺。
DRIVE Constellation是一個數據中心解決方案,包括兩個并排服務器:
第一臺服務器——DRIVE Constellation Simulator,從虛擬汽車生成傳感器輸出;
第二臺服務器——DRIVE Constellation Vehicle,包含DRIVE AGX Pegasus AI車載電腦。
DRIVE AGX Pegasus接收傳感器數據、做出決定,然后將車輛控制命令發送回模擬器。這種閉環過程可實現位精確,定時精確的硬件在環測試。
這個驗證過程是實時運行的,可以按比例執行,多個單元并行運行各種測試。
有了這樣的效率水平,DRIVE Constellation可以實現大量的駕駛體驗——3000個單元每年可以行駛超過10億英里。更重要的是,DRIVE Constellation中的每一英里都包含有趣的事件——包括罕見或危險的場景。
基于云的端到端工作流程
黃仁勛演示了DRIVE Constellation平臺如何執行駕駛測試并在無縫工作流程中提供結果。
DRIVE Constellation用戶可以通過云遠程訪問任何平臺。 開發人員可以提交一個特定的模擬場景——例如,在潮濕的道路上霧蒙蒙的夜晚,一輛自動駕駛汽車對另一輛汽車在交通繁忙時切入車道作出反應。
為了確定AV的性能,開發人員可以設置特定的評估程序,例如碰撞時間、跟隨距離和乘客舒適度,在運行時查看測試,并可視化結果。
具有特定變化的相同測試可突出極端和危險條件 - 如密集交通,惡劣天氣和低能見度 - 可以并行運行。 這種大規模的驗證功能就像運行大量的測試車輛虛擬車隊,在很短的時間內完成數月或數年的測試。
開放平臺
DRIVE Constellation是一個開放的平臺,這意味著它提供了一個編程接口,允許DRIVE Sim生態系統的合作伙伴集成他們的環境模型、車輛模型、傳感器模型和交通場景。通過合并各種合作伙伴,平臺可以生成全面、多樣和復雜的測試環境。
由以色列仿真公司Cognata開發的詳細流量和場景模型由DRIVE Constellation平臺提供支持。 該公司使用世界各地的交通攝像頭捕獲的真實數據來創建準確的大規模交通模型。
利用Cognata的流量模型,開發人員可以根據實際流量數據定義其他車輛和道路使用者的數量及其行為。
汽車仿真公司IPG Automotive也與DRIVE Constellation合作,提供高保真車型。 它使開發人員能夠準確地模擬車輛對各種DRIVE Sim命令的反應,例如轉向、制動和油門以及各種道路狀況。
為了準確模擬從攝像頭,雷達或激光雷達傳感器收集的數據如何送入車輛,DRIVE Constellation還可以支持傳感器模型,如攝像頭,激光雷達和雷達。 安森美半導體是半導體和傳感器供應商,正與DRIVE Constellation合作,提供高精度的相機型號。
同時,開放平臺也是第三方和監管自主車輛標準的關鍵組成部分。
數據中心+邊緣,英偉達轉型路線圖浮出水面
自從去年10月英偉達股價腰斬之后,就從AI芯片王座之上跌落,外界對于英偉達依賴游戲、挖礦等業務不看好,而英偉達在本月收購Mellanox,似乎也給外界回應:轉型路線圖浮出水面。
黃仁勛在收購Mellanox的新聞稿中說,“數據中心比以往任何時候都重要”。借助Mellanox,英偉達將優化整個計算、網絡和存儲堆棧中的數據中心規模工作負載,二者聯合形成一個巨大的數據中心規模的計算引擎,為各類計算源源不斷提供低成本算力。
另一方面,Jetson Nano為機器人和其他人工智能設備提供大腦,在邊緣計算中,英偉達也占有一席之地,從而建立起以GPU算力為核心,諸多設備為護城河的生態系統。
至于有沒有7納米GPU、有沒有新架構,這不是英偉達最緊急的事情。
-
英偉達
+關注
關注
22文章
3862瀏覽量
92262 -
深度學習
+關注
關注
73文章
5523瀏覽量
121718 -
光線追蹤
+關注
關注
0文章
183瀏覽量
21567
原文標題:99美元!黃仁勛發布人工智能計算機,GTC十周年沒有核彈
文章出處:【微信號:AI_era,微信公眾號:新智元】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
相關推薦
英偉達:全自動駕駛汽車至少需十年

AMD發布英偉達競品AI芯片,預期市場規模將大幅增長
使用三無安規電容有什么危險看看就知道

使用三無安規電容有什么危險看看就知道

英偉達GTC大會丨宇樹通用人形機器人H1與全球共同擁抱AI
英偉達超級AI芯片運算提速30倍!如何加快散熱來滿足其算力需求呢?

評論