本次 GTC 大會,來自阿里云機器學習平臺 PAI 的技術專家,將分享開源產品 DeepRec 的高性能 GPU 訓練推理優化,以及機器學習模型中訪存密集型計算 STITCH 融合優化技術。
長按掃描下方二維碼,或點擊閱讀原文,注冊 GTC 并提前收藏阿里云機器學習平臺 PAI 的精彩演講。
![0965371e-c663-11ed-bfe3-dac502259ad0.png](https://file1.elecfans.com//web2/M00/99/D6/wKgaomTneK2Ac9HnAAAGvTNVh_U736.png)
全球 AI 市場近年來保持了快速增長的趨勢,根據市場研究機構 IDC 的數據顯示,預計到 2025 年,全球 AI 市場規模將達到 1.25 萬億美元。同時,中國已成為全球最大的 AI 應用市場之一,據中國電子信息產業發展研究院發布的數據顯示,截至 2022 年底,國內 AI 產業規模達到 1204 億元人民幣,同比增長 59.5%。
并且隨著近階段 AIGC(AI generated content)概念的爆火,人工智能再次受到全球社會層面的廣泛關注。AIGC 能夠帶來更加創新的應用,包括坐席輔助、智能語音、自動駕駛、人臉識別、擴展現實、機器翻譯以及金融欺詐檢測等多個領域,潛力極大。
而在 AIGC 浪潮不斷帶來新驚喜的同時,今天 AI 開發門檻高仍然是亟待解決的問題。因硬件、框架和開發環境三者之間的適配度低,算法工程師們不得不關注底層基礎設施的調優和適配工作,無形中降低了工作效率。
阿里云機器學習 PAI 團隊致力于為企業和開發者們提供云原生、高性能的 AI 平臺服務。在計算性能方面,專注于 AI 訓練、AI 推理等方面的軟硬協同優化工作,開源了豐富的工具套件。在平臺能力方面,PAI 團隊推出覆蓋 AI 開發全鏈路的平臺產品,兼容各類底層計算硬件和 AI 框架,讓算法工程師們可以專注于 AI 開發的階段,實現云、端側、創新硬件等多種場景的創新。
以下為阿里云機器學習平臺 PAI 在本次 GTC 大會的演講簡介:
阿里云機器學習平臺 PAI 演講推薦
DeepRec: 面向推薦場景的
高性能深度學習框架
會議代碼:[S51544]
演講時間:3 月 23 日 3:00 PM
演講嘉賓:
![098271b2-c663-11ed-bfe3-dac502259ad0.png](https://file1.elecfans.com//web2/M00/99/D6/wKgaomTneK2AT3ejAAinIr8ezks949.png)
劉童璇,阿里巴巴高級技術專家
![0b518cda-c663-11ed-bfe3-dac502259ad0.png](https://file1.elecfans.com//web2/M00/99/D6/wKgaomTneK2AQCH9AA4SDinon9Q288.png)
劉仕杰,NVIDIA GPU 計算專家團隊工程師
演講概要:
DeepRec 支持了淘寶搜索、猜你喜歡、定向、直通車等核心業務,支撐著千億特征、萬億樣本超大規模的搜索、推薦、廣告場景的模型訓練和推理。自 DeepRec 開源以來,已有數十家互聯網公司將 DeepRec 應用在他們的搜推廣場景的業務中,取得了顯著的業務效果提升和性能提升。DeepRec 中提供的功能和性能優化主要分三個方面:1. 模型效果方面;2. 訓練和推理優化方面;3. 模型部署方面。
本次演講中,主要介紹 GPU 場景下,DeepRec 中多級 Embedding 混合存儲功能,圖感知的內存/顯存分配器,SessionGroup 中多 CUDA Stream 支持,基于 NVIDIA Merlin HugeCTR SOK(Sparse Operation Kit)的 GPU 同步訓練,以及Embedding 性能優化 Group Embedding。
您可以在 github 上體驗 DeepRec:
https://github.com/alibaba/DeepRec
機器學習模型中訪存
密集型計算 STITCH 融合優化技術
會議代碼:[SE51289]
演講時間:3 月 22 日2:00 PM
演講嘉賓:
![0d793724-c663-11ed-bfe3-dac502259ad0.png](https://file1.elecfans.com//web2/M00/99/D6/wKgaomTneK6AYlsEAA6J3Qt2EUs851.png)
鄭楨,阿里巴巴高級技術專家
演講概要:
近年來,訪存密集型計算日益成為影響機器學習模型性能的重要因素。由于機器學習模型計算圖日趨復雜,傳統的機器學習編譯器面對復雜的數據依賴關系時很難執行高效的計算融合優化。同時,動態張量形狀(dynamic tensor shape)的模型優化需求開始興起,缺失的張量形狀使得訪存密集型計算子圖的性能優化變得更加困難。
本次演講將講述阿里巴巴針對機器學習任務中訪存密集型計算性能優化的關鍵技術:STITCH 融合技術。該技術支持將任意類型及任何數量的機器學習訪存密集型算子進行融合,最終將大粒度的訪存密集型計算子圖轉化為單個的 GPU 核函數,以減少片外訪存、框架調度及 GPU 核函數調用開銷。
如何預約和注冊
在 GTC 大會官網(https://www.nvidia.cn/gtc-global/)搜索會議代碼找到該演講,點擊“Add to Schedule”或右上角五角星,提前預約或收藏。
如下圖 [S51544] 演講,點擊“Add to Schedule”或右上角五角星,即可添加至您的日程。
GTC 大會注冊流程請參看 GTC23 注冊教程,請在 3 月 26 日前完成在線注冊,免費觀看以及回看 GTC 2023 春季大會超過 650 場精彩內容!
掃描下方海報二維碼,鎖定 NVIDIA 創始人兼首席執行官黃仁勛的 GTC 主題演講!北京時間 3 月 21 日 23:00 全球首播,3 月 22 日 10:00 中國重播。深度解讀 NVIDIA 加速計算平臺如何推動人工智能、元宇宙、云技術和可持續計算的下一波浪潮。加入 GTC23,切勿錯過 AI 的決定性時刻!
原文標題:GTC23 | 阿里云機器學習平臺 PAI 精選演講推薦
文章出處:【微信公眾號:NVIDIA英偉達】歡迎添加關注!文章轉載請注明出處。
-
英偉達
+關注
關注
22文章
3833瀏覽量
91652
原文標題:GTC23 | 阿里云機器學習平臺 PAI 精選演講推薦
文章出處:【微信號:NVIDIA_China,微信公眾號:NVIDIA英偉達】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
相關推薦
Tuya物聯網平臺阿里云版:助力客戶打造融合開放的專屬物聯平臺
![Tuya物聯網<b class='flag-5'>平臺</b><b class='flag-5'>阿里</b><b class='flag-5'>云</b>版:助力客戶打造融合開放的專屬物聯<b class='flag-5'>平臺</b>](https://file.elecfans.com/web2/M00/40/04/pYYBAGJrTDSAYdI1AAASTiyZjeQ622.jpg)
如何選擇云原生機器學習平臺
阿里云代理有哪些?
阿里云PAI獲首個國際標準認證,領跑AI云平臺
esp8266連接阿里云平臺時mqtt連接超時
如何理解云計算?
通過鋇錸PLC轉MQTT網關實現PLC數據上傳至阿里云平臺
![通過鋇錸PLC轉MQTT網關實現PLC數據上傳至<b class='flag-5'>阿里</b><b class='flag-5'>云</b><b class='flag-5'>平臺</b>](https://file1.elecfans.com/web2/M00/FF/B6/wKgZomap_wSAbR7LAAJHL2UrwWQ408.png)
評論