NVIDIA 作為一家全棧式 AI 計算平臺的賦能者,致力于推動全球性的人工智能和科學(xué)計算的發(fā)展,通過推廣高性能技術(shù)應(yīng)用為社會發(fā)展做出積極貢獻。尤其在國內(nèi)高等教育領(lǐng)域,十多年來 NVIDIA 一直努力為眾多高校提供培養(yǎng)下一代加速計算技術(shù)人才的 CUDA 教學(xué)相關(guān)資源。CUDA 編程技術(shù)人員現(xiàn)在已經(jīng)成為業(yè)界在高性能計算及 AI 開發(fā)及應(yīng)用領(lǐng)域內(nèi)的主流技術(shù)支撐。
為了能夠讓與加速計算相關(guān)的高校學(xué)生能夠及時了解最新的 CUDA 編程技術(shù)的發(fā)展與變化,我們發(fā)起了 CUDA 線上訓(xùn)練營公益活動,以增加學(xué)生學(xué)習(xí)及體驗最新技術(shù)的機會,同時拉近教學(xué)與市場應(yīng)用的距離。幾年來的活動實施效果得到了業(yè)界的肯定與認可,CUDA 線上訓(xùn)練營的教材被應(yīng)用到了高校的教材里面,甚至被采納作為教學(xué)實驗課。
2023 NVIDIA &創(chuàng)樂博 CUDA 線上訓(xùn)練營由 NVIDIA 發(fā)起,由創(chuàng)樂博冠名贊助,旨在幫助初學(xué)者學(xué)習(xí)如何在 GPU 上快速加速代碼,掌握 CUDA 編程的基本概念和技能。
NVIDIA 工程師將通過為期 5 天的時間,系統(tǒng)性地介紹 ARM 嵌入式平臺的特色,以及在該平臺上如何實現(xiàn) CUDA 并行加速計算。通過四大模塊的學(xué)習(xí),并搭配豐富的線上實驗環(huán)節(jié),讓學(xué)生們掌握基于Arm 的 Jetson 開發(fā)環(huán)境和 GPU 異構(gòu)計算原理,了解 CUDA 編程模型,包括線程組織和 CUDA 存儲單元,以及如何利用共享存儲單元優(yōu)化應(yīng)用等。每次課程介紹完,會提供相應(yīng)的編程實例,讓學(xué)生在實際操作中理解概念。
訓(xùn)練營的最終目標(biāo)是幫助學(xué)習(xí)者建立對 GPU 編程的信心,為此,還將建立專門的 CUDA 學(xué)習(xí)線上微信群。邀請 CUDA 編程專家在線回答同學(xué)們的問題,輔導(dǎo)同學(xué)們進行線上實驗。
高效學(xué)習(xí) GPU 編程
職業(yè)生涯快人一步!

報名須知
報名時間:即日起– 7月23日
訓(xùn)練營時間:7月24日– 7月28日
線上結(jié)業(yè)考試時間:7月29日09:00 AM – 12:00 AM
報名鏈接:識別海報二維碼或點擊閱讀原文。
報名后請?zhí)砑游?a target="_blank">信號【社區(qū)助教】:gpusupport,確認報名費繳納事宜;同時助教會拉您進入相應(yīng)的微信群。

招生要求
?本課程需要學(xué)員具備一定的 C/C++ 程序設(shè)計基礎(chǔ)。
?收費班:
主辦方提供 Jetson 云平臺,參加者無需準(zhǔn)備開發(fā)環(huán)境,只需要通過自己普通電腦的瀏覽器遠程訪問 Jetson 計算平臺進行學(xué)習(xí)。為了確保學(xué)習(xí)效果,將對每位參加者收取 100 元的報名費。完成了每日的學(xué)習(xí)打卡任務(wù),將原路退回 100 元。
此班級只針對在校學(xué)生。
人數(shù)限制 100 名。
?旁聽班:自己準(zhǔn)備 GPU 電腦,自行安裝 CUDA 環(huán)境。
此班級面向所有開發(fā)者。
人數(shù)無上限。
?兩個班級都會安排上機考試,通過考試,可以獲得結(jié)業(yè)證書。

課程亮點
?介紹高性能計算基礎(chǔ)編程模型 CUDA 的基本編程原理。?在結(jié)合 Arm CPU 和 GPU 的實驗平臺上完成動手實踐。?內(nèi)容和應(yīng)用相結(jié)合,將介紹如何利用 CUDA 完成光影渲染、信號處理、深度學(xué)習(xí)的網(wǎng)絡(luò)搭建等熱門案例。?6次實驗課, 幾千行實驗代碼, 讓學(xué)生在動手實驗的過程中了解GPU加速的原理和方法。?完成課程結(jié)業(yè)測試,NVIDIA 企業(yè)開發(fā)者社區(qū)將頒發(fā)結(jié)業(yè)證書和紀(jì)念徽章。
指導(dǎo)老師

何琨(Ken He)
NVIDIA 企業(yè)級開發(fā)者社區(qū)高級經(jīng)理,擁有多年的 GPU 和人工智能開發(fā)經(jīng)驗。自 2017 年加入 NVIDIA 開發(fā)者社區(qū)以來,完成過上百場培訓(xùn),幫助上萬個開發(fā)者了解人工智能和 GPU 編程開發(fā)。在計算機視覺,高性能計算領(lǐng)域完成過多個獨立項目。并且,在機器人和無人機領(lǐng)域,有過豐富的研發(fā)經(jīng)驗。對于圖像識別,目標(biāo)的檢測與跟蹤完成過多種解決方案。曾經(jīng)參與 GPU 版氣象模式 GRAPES,是其主要研發(fā)者。

李奕澎
NVIDIA 企業(yè)開發(fā)者社區(qū)經(jīng)理,擁有 4 年數(shù)據(jù)分析建模開發(fā)經(jīng)驗,3 年人工智能自然語言處理開發(fā)經(jīng)驗。在自動語音識別、自然語言處理、自然語言理解等技術(shù)有著豐富的實戰(zhàn)經(jīng)驗與見解。

訓(xùn)練營日程安排

Day1 - 7月24日
910 開營
NVIDIAGPU 應(yīng)用市場總監(jiān)侯宇濤致辭
創(chuàng)樂博 介紹
1.Jetson 開發(fā)環(huán)境介紹,Linux 系統(tǒng)簡介(1.1 理論課+實驗課)
介紹實驗平臺,介紹 Linux 編譯的基本技巧,介紹基本的開發(fā)環(huán)境
實驗課:Makefile 文件編寫規(guī)范
2. GPU 架構(gòu)及異構(gòu)計算
介紹 GPU 架構(gòu)以及異構(gòu)計算的基本原理
介紹 GPU 硬件平臺
介紹基于 Jetson的嵌入式平臺 GPU 架構(gòu)和編程模型之間的關(guān)系
最新的 GPU 應(yīng)用領(lǐng)域,GPU 在現(xiàn)代計算機科學(xué)中的通用性
3. CUDA 編程模型 — 初識 CUDA
CUDA 程序的編譯
GPU 線程的調(diào)用
GPU和 CPU 的通訊
使用多個線程的核函數(shù)
使用線程索引
多維網(wǎng)絡(luò)
網(wǎng)格與線程塊
利用 NVProf 查看程序執(zhí)行情況
實驗課內(nèi)容:編寫程序 HelloCUDA,并且利用 NVCC 編譯。編寫 VectorAdd 多線程程序,和多維網(wǎng)絡(luò)線程程序,并用 nvprof 來測試不同設(shè)置情況下運行速度。

Day2- 7月25日
930(1100 午休)
4. CUDA 編程模型 — CUDA 存儲單元的使用與錯誤檢測
設(shè)備初始化
GPU 的存儲單元
GPU 存儲單元的分配與釋放
數(shù)據(jù)的傳輸
數(shù)據(jù)與線程之間的對應(yīng)關(guān)系
CUDA 應(yīng)用程序運行時的錯誤檢測
CUDA 中的事件
利用事件進行計時
實驗課內(nèi)容:編寫 MatrixMul 程序,體驗線程和數(shù)據(jù)的對應(yīng)關(guān)系
留課后作業(yè)
5. 多種 CUDA 儲存單元詳解
CUDA 中的存儲單元種類
CUDA 中的各種存儲單元的使用方法
CUDA中的各種存儲單元的適用條件
6. 利用共享存儲單元優(yōu)化應(yīng)用
共享存儲單元詳解
共享內(nèi)存的 Bankconflict
利用共享存儲單元進行矩陣轉(zhuǎn)置和矩陣乘積
實驗課內(nèi)容:編寫 Shared Memory 優(yōu)化過的矩陣乘法
介紹 sharedmemory 原理,介紹利用 sharedmemory優(yōu)化的多種案例
矩陣轉(zhuǎn)置

Day3- 7月26日
930(1100 午休)
7. CUDA 編程模型 — 原子操作
CUDA 中的原子操作
原子操作的適用場景
利用原子操作優(yōu)化程序
規(guī)越算法的實驗
8. 基于 ARM 平臺的 Jetson Nano存儲單元調(diào)用
基于 ARM 平臺的 Jetson Nano 的存儲單元特點
統(tǒng)一內(nèi)存的基本概念
如何更有效的利用 Jetson 的存儲單元
實驗課內(nèi)容:編寫 MatrixMul 程序,體驗統(tǒng)一內(nèi)存的使用方法
介紹基于 Jetson 平臺的共享存儲單元的特點,介紹 Jetson 平臺 SoC DRAM memory 的應(yīng)用

Day4- 7月27日
930(1100 午休)
9. CUDAstream
CUDA 流的基本概念
默認流與非默認流
利用 CUDA 流重疊計算和數(shù)據(jù)傳輸
實驗課內(nèi)容:體驗利用流來減少運行時間
介紹 CUDAstream,介紹利用 stream 分割處理的加速方案,介紹利用 stream 處理超大數(shù)據(jù)的加速方案
10. CUDA 加速庫介紹:Thrust,cuBLAS,cuFFT,CV-CUDA
cuBLAS 介紹
cuFFT 介紹
Thrust 介紹
CV-CUDA 介紹
完成多種庫(開源項目)的實例應(yīng)用

Day5 - 7月28日:線上答疑

Day6 - 7月29日:線上課程結(jié)業(yè)考試

關(guān)于考核
1. 完成所有的理論和上機實驗,并完成小程序打卡。
2. 完成課后線上答題。
3. 所有課程結(jié)束后完成三個考題,每個考題為完成一段程序,由易到難。
三組都完成的視為合格
考試時間:7月29日 09:00 Am—12:00 Am

教材資源
訓(xùn)練營教材:《CUDA ON ARM PLATFORM訓(xùn)練營》自編教材
參考書目:樊哲勇《 CUDA 編程:基礎(chǔ)與實踐》清華大學(xué)出版社出版時間:2020-10-01
NVIDIA 官方文檔:CUDA C++ Best Practices Guide
(https://docs.nvidia.com/cuda/cuda-c-best-practices-guide/index.html#abstract)
NVIDIA 官方文檔:CUDA Programming Guide(https://docs.nvidia.com/cuda/#programming-guides)
立即掃描下方二維碼報名,學(xué)生報名僅限 100 席,先到先得!

原文標(biāo)題:開發(fā)者活動 | 2023 NVIDIA & 創(chuàng)樂博 CUDA 線上訓(xùn)練營火熱報名中
文章出處:【微信公眾號:NVIDIA英偉達企業(yè)解決方案】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
-
英偉達
+關(guān)注
關(guān)注
22文章
3922瀏覽量
93132
原文標(biāo)題:開發(fā)者活動 | 2023 NVIDIA & 創(chuàng)樂博 CUDA 線上訓(xùn)練營火熱報名中
文章出處:【微信號:NVIDIA-Enterprise,微信公眾號:NVIDIA英偉達企業(yè)解決方案】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
鴻利智匯AI賦能多維提升訓(xùn)練營活動圓滿落幕
使用NVIDIA CUDA-X庫加速科學(xué)和工程發(fā)展
2025年星閃技術(shù)應(yīng)用巡回研討會-深圳站火熱報名中
活動回顧 | 芯星閃耀,智創(chuàng)未來

NVIDIA Jetson Orin Nano開發(fā)者套件的新功能

2024年度國內(nèi)活躍開源項目和開發(fā)者在武漢揭曉
NVIDIA發(fā)布小巧高性價比的Jetson Orin Nano Super開發(fā)者套件
云端AI開發(fā)者工具怎么用
Silicon Labs將舉辦WorksWith線上開發(fā)者大會
開源共生 商業(yè)共贏 | RT-Thread 2024開發(fā)者大會報名啟動!

冠軍說|第二屆OpenHarmony競賽訓(xùn)練營冠軍團隊專訪
NVIDIA Nemotron-4 340B模型幫助開發(fā)者生成合成訓(xùn)練數(shù)據(jù)

2024年上海海思MCU開發(fā)者體驗官招募,手機/MatePad大獎等你拿!
星閃開發(fā)者體驗官,沖刺終極大獎華為星閃手機Pure70

評論