在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

NVIDIA 招聘 | NVIDIA 最新熱招崗位!一起迎接未來加速計算!

NVIDIA英偉達 ? 來源:未知 ? 2023-06-14 18:35 ? 次閱讀

NVIDIA 計算架構團隊和NVIDIA 計算專家團隊正在熱招!

如果你對加速計算領域充滿熱情,并且希望與優秀的技術專家一起合作,那么這個機會將是你展現才華的優質平臺,快來加入

NVIDIA 計算架構團隊

熱門崗位:

簡歷請投遞至:

sh-recruitment@nvidia.com

Deep Learning Performance Architect - Triton / LLM - TensorRT

工作內容:圍繞深度學習端到端 AI 軟件全棧,包括但不限于:訓練框架、核心計算庫、推理優化工具(比如 TensorRT)、AI 編譯器、模型壓縮等全棧軟件棧,以及可以在 AI 軟件全棧基礎上影響到下一代甚至下兩代硬件架構的特性設計。

技能要求: 良好 C++ 編程,熟悉 AI 軟件棧底層或者計算機體系結構,熟悉上層算法Python 是加分項。

工作地點:北京 / 上海

Deep Learning Performance Architect - TensorRT

工作內容:NVIDIA 深度學習推理引擎 TensorRT 的設計、開發和維護工作(比如,TensorRT 模型導入的流程和相關工具,圖優化,算子的 CUDA 實現及代碼生成,算子性能優化等),以及對當前主流的深度學習模型使用 TensorRT 進行推理的性能進行分析和優化。同時,還將與 NVIDIA GPU 體系結構設計團隊合作,來推動 NVIDIA 深度學習解決方案的軟硬件協同設計和研發。

技能要求:熟練掌握 C++ 編程。


加分技能 / 經驗: 度學習框架 / 深度學習編譯器開發,性能分析 / 建模 / 優化相關的方法論 / 工具,計算機體系結構相關知識,CUDA kernel 開發 / 優化。

工作地點:上海 / 北京


Deep Learning Performance Architect - Operator

工作內容:針對不同 GPU 架構為 TensorRT、cuDNN、cuBLAS2、cuSPARSE 等深度學習算子庫提供高性能基礎算子以及算子融合實現,包含在線代碼生成,代碼融合等相關開發工作,以及根據當代 GPU 優化瓶頸影響后續硬件架構特征設計和驗證工作。

技能要求:良好 C++ 編程、熟悉計算機體系結構,有 TVM、MLIR 相關開發經驗是加分項。

工作地點:上海 / 北京

Deep Learning Performance Architect

工作內容:圍繞運算架構的全棧優化,包括但不限于:深度學習模型分析與預測、架構的性能分析、編譯器性能分析,以及對主流運算架構和軟件生態的分析。使 NVIDIA 軟件生態與計算架構更好的支持主流應用。

技能要求:良好 C++ / Python 編程,熟悉 AI 軟件或者計算機體系結構。

工作地點:上海

上下滑動查看更多職位詳情

團隊介紹

算力是 AI 時代的基礎設施,而“后摩爾定律時代”,軟硬件協同設計,才是加速計算的未來!

NVIDIA 計算架構團隊歷經 CUDA 并行編程模型從起步至今的所有階段,其間參與了數代通用 GPU 計算架構及之上的包括 cuDNN、TensorRT、底層高性能算子、并行編程語言在內的加速軟件棧的研發工作。該團隊同時參與關鍵機器學習模型的算法及框架優化。

目前,該團隊開放多個職位等你的加入!與我們共同書寫下一代 AI 計算架構的未來!

NVIDIA 計算架構團隊旨在推動算法、并行編程模型、核心加速軟件庫及 GPU 體系結構的協同設計和演化,在高速發展的深度學習算法與 GPU 硬件體系結構之間建立橋梁,并研發先進的軟硬件協同的加速計算解決方案。

該團隊從高性能計算、深度學習、自動駕駛等計算應用領域出發,跟蹤學界、工業界前沿算法,并掌握其發展方向;通過對前沿算法(比如:神經網絡結構)的深入理解,分析并提出芯片架構的需求,包含指令集、編程模型、計算能力、訪存帶寬、片上存儲、片上網絡及網絡互聯等。

同時,承擔基于架構的計算加速軟件棧的開發及產品化工作。自底層加速核心算子開發及優化,基于硬件加速的并行編程模型的研發和編譯,TensorRT、cuDNN 等核心加速庫,直到上層訓練框架、編譯優化。以及,針對模型的混合精度、稀疏矩陣訓練及量化方法開發。

上下滑動查看更多詳情

團隊發展

該團隊基于硬件架構開發軟件、編程模型、算法實現,通過算法、軟件開發實踐反饋并推動硬件架構優化,形成閉環,最終實現軟件、編程模型及硬件架構的協同演化和迭代,達到極致計算加速的目標:

  • 建立下一代芯片性能模型、搭建芯片性能分析平臺、調研下一代芯片新特性

  • 研發及設計新的加速指令、開發原型代碼及編程模型、迭代優化下一代芯片架構

  • 跟蹤下一代芯片新特性在應用中的落地實現(算子實現、編譯等)

  • 開發集成最終軟件產品庫 - TensorRT,cuDNN

  • 優化訓練框架(MLPerf 各項優化)

  • 開發混合精度、稀疏矩陣及量化方法

上下滑動查看更多詳情

NVIDIA 計算專家團隊

熱門崗位:

簡歷請投遞至:

sh-recruitment@nvidia.com

Developer Technology Engineer

工作內容:

  • 包括大語言模型、生成式 AI、推薦系統在內的深度學習、機器學習、數據分析領域新技術,以及編程實現、優化、模型、算法等方面的研究和開發;

  • 工業界實際應用的深度分析和優化,以保證該類應用在當前和未來的 NVIDIA 架構上都能保持卓越性能;

  • 為關鍵客戶(業界頭部公司)提供合適的 AI 解決方案;

  • 和 GPU / CPU / DPU 架構團隊、研究團隊、應用庫和開發工具團隊、系統軟件團隊等緊密合作來影響下一代產品架構、軟件平臺和編程模式的設計與開發;

  • 與世界各地的優秀同事一起助力深度學習技術在互聯網、交通、金融、醫療等各領域的落地。

基本要求:

  • 計算機科學相關專業優秀碩士、博士畢業生;

  • 擁有良好的 C / C++ / Python 編程能力,良好的軟件設計和開發能力;

  • (二選一)有并行計算編程基礎,有 CUDA / C / C++ / Python 編程經驗;

  • (二選一)擁有深度學習,機器學習領域的扎實理論基礎,熟悉常見的深度學習網絡或機器學習算法;

  • 良好的溝通能力、解決問題能力、時間管理能力和任務優先級管理能力;

  • 良好的英文技術文檔讀寫能力和日常聽說溝通能力。

工作地點:北京 / 上海 / 深圳 / 臺北

上下滑動查看更多職位詳情

團隊介紹

NVIDIA 計算專家團隊(DevTech)專注于各種深度學習算法、科學計算、數據分析和云端應用;在 NVIDIA 平臺上進行性能分析以及優化,以充分發揮 NVIDIA GPU / CPU / DPU,集群和數據中心強大的算力,使其達到,或者接近“光速”(SOL)水平的高級技術團隊。

該團隊與世界上技術領先的企業、高校、研究院所合作,共同推動和加速各項 AI 應用的落地。通過與用戶深度緊密的合作,在大語言模型、生成式 AI、推薦系統、自動駕駛、自然語言處理、視頻和圖像理解、語音識別與合成,游戲等領域取得了累累碩果。該團隊成為幫助客戶發揮硬件平臺和軟件棧綜合算力的中堅力量,能夠為產品研發團隊提供性能優化、設計原型和行業應用案例。

團隊目標:在 NVIDIA 系統上,將各類應用優化到性能極致!

以打造大語言模型(LLM)應用為例,既可以直接使用 NVAIE / NVIDIA Nemo Service,也可以使用應用框架(Nemo FW、Triton+TensorRT、FT等)來訓練和部署模型,也可以基于 cuDNN / TensorRT 等軟件庫自己開發自己的框架,還可以基于 CUDA 來完全定制化自己的 pipeline,或者也可以混合采用這些方法。

如何選擇一種合適的方法,其關鍵在于取得應用場景、性能要求、平臺靈活性、時間成本、技術成本之間的平衡。NVIDIA 計算專家團隊就是幫助客戶和 NVIDIA 解決這個問題的。

上下滑動查看更多詳情

團隊發展

團隊成員主要來自北京、上海、深圳、臺北、首爾等地。

科學計算時代,當整個市場都還只關注于不斷擴大通用硬件的規模時,NVIDIA 推出了加速計算 GPGPU 和 CUDA 編程模型。GPU 和 CUDA 這一全新的加速計算范式,為業界帶來了源源不斷的加速,但是也對應用的開發和優化提出了挑戰。

在不斷改進基礎庫性能的同時,NVIDIA 組建了一支特別團隊,關注更為具體的應用。團隊成員們不僅有深厚的計算機功底(從計算機體系結構、CUDA 編程,到編譯原理、網絡互連),還擁有各個領域的專業知識。這支團隊不但可以從 GPU 編程方面對程序進行優化,更能從算法、模型方面提出改進建議,這使得 NVIDIA GPU 從科學計算領域脫穎而出。

隨著深度學習的高速發展,該團隊也在續寫著相同的故事。對于 AI 中的神經網絡,從代碼和算法兩個方面對其進行優化。代碼方面涉及 CUDA、GPU 庫,多機多卡網絡互連等各個領域;而算法包括了模型壓縮、量化、剪枝、混合精度訓練、梯度壓縮等,其最終目標都是在模型精度沒有損失,或者損失不大的情況下,提高訓練和預測的速度。

對于一個基于 AI 的實際工業項目,除了神經網絡以外,系統內還包括了很多其他模塊,神經網絡在其中耗時只占 1/3 - 1/2。以互聯網核心的推薦系統為例,其包括了召回、過濾、粗排、精排、離線訓練、在線訓練、ETL、特征工程等模塊和流程。該團隊致力于提供全流程的參考解決方案,讓盡可能多的模塊運行在 GPU 上,進而為應用帶來顯著加速。

上下滑動查看更多詳情

點擊“閱讀原文”,或掃描下方海報二維碼觀看 NVIDIA 創始人兼 CEO 黃仁勛在 COMPUTEX 2023 的主題演講直播回放,主題演講中文字幕版已上線,了解 AI、圖形及其他領域的最新進展!


原文標題:NVIDIA 招聘 | NVIDIA 最新熱招崗位!一起迎接未來加速計算!

文章出處:【微信公眾號:NVIDIA英偉達】歡迎添加關注!文章轉載請注明出處。


聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 英偉達
    +關注

    關注

    22

    文章

    3854

    瀏覽量

    92076

原文標題:NVIDIA 招聘 | NVIDIA 最新熱招崗位!一起迎接未來加速計算!

文章出處:【微信號:NVIDIA_China,微信公眾號:NVIDIA英偉達】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    利用NVIDIA DPF引領DPU加速計算未來

    越來越多的企業開始采用加速計算,從而滿足生成式 AI、5G 電信和主權云的需求。NVIDIA 推出了 DOCA 平臺框架(DPF),該框架提供了基礎構建模塊來釋放 NVIDIA Blu
    的頭像 發表于 01-24 09:29 ?233次閱讀
    利用<b class='flag-5'>NVIDIA</b> DPF引領DPU<b class='flag-5'>加速</b>云<b class='flag-5'>計算</b>的<b class='flag-5'>未來</b>

    盤點NVIDIA 2024年的創新成果

    在2024年,AI 的影響力已經擴展到加速計算和數據科學等多個關鍵領域,成為驅動各行各業技術革新和產業升級的關鍵因素。在這年里,NVIDIA 又帶來了哪些創新成果,實現了哪些突破?跟
    的頭像 發表于 01-02 14:32 ?261次閱讀

    《CST Studio Suite 2024 GPU加速計算指南》

    許可證模型的加速令牌或SIMULIA統許可證模型的SimUnit令牌或積分授權。 4. GPU計算的啟用 - 交互式模擬:通過加速對話框啟用,打開求解器對話框,點擊“
    發表于 12-16 14:25

    NVIDIA加速全球大多數超級計算機推動科技進步

    HPCwire 讀者和編輯選擇獎。 自 2006 年發布 CUDA 以來,NVIDIA 不斷推動 AI 和加速計算的進步,最新發布的全球最強超級計算機 TOP500 榜單突顯了該公司
    的頭像 發表于 11-24 14:38 ?392次閱讀
    <b class='flag-5'>NVIDIA</b><b class='flag-5'>加速</b>全球大多數超級<b class='flag-5'>計算</b>機推動科技進步

    NVIDIA加速計算如何推動醫療健康

    近日,NVIDIA 企業平臺副總裁 Bob Pette 在 AI Summit 場演講中重點談論了 NVIDIA 加速計算如何推動醫療健康
    的頭像 發表于 11-20 09:10 ?360次閱讀

    NVIDIA向開放計算項目捐贈Blackwell平臺設計

    近日,在美國加利福尼亞州舉行的 OCP 全球峰會上,NVIDIA 宣布已把 NVIDIA Blackwell 加速計算平臺的些基礎元素捐贈
    的頭像 發表于 11-19 15:30 ?278次閱讀

    日本企業借助NVIDIA產品加速AI創新

    日本領先企業和大學正在使用 NVIDIA NeMo、NIM 微服務和 NVIDIA Isaac 加速 AI 創新。
    的頭像 發表于 11-19 14:34 ?417次閱讀

    利用NVIDIA RAPIDS加速DolphinDB Shark平臺提升計算性能

    DolphinDB 是家高性能數據庫研發企業,也是 NVIDIA 初創加速計劃成員,其開發的產品基于高性能分布式時序數據庫,是支持復雜計算和流數據分析的實時
    的頭像 發表于 09-09 09:57 ?541次閱讀
    利用<b class='flag-5'>NVIDIA</b> RAPIDS<b class='flag-5'>加速</b>DolphinDB Shark平臺提升<b class='flag-5'>計算</b>性能

    NVIDIA加速計算和生成式AI領域的創新

    在最新發布的公司 2024 財年可持續發展報告開篇的封信中,NVIDIA 創始人兼首席執行官黃仁勛介紹了 NVIDIA加速計算和生成式
    的頭像 發表于 09-09 09:18 ?664次閱讀

    借助NVIDIA超級計算加速量子計算發展

    科學期刊《自然》(Nature)本月早些時候發表了項研究,通過使用 NVIDIA 驅動的超級計算機,驗證了量子計算的商業化途徑。
    的頭像 發表于 07-25 09:55 ?585次閱讀

    英偉達推出全新NVIDIA AI Foundry服務和NVIDIA NIM推理微服務

    NVIDIA 宣布推出全新 NVIDIA AI Foundry 服務和 NVIDIA NIM 推理微服務,與同樣剛推出的 Llama 3.1 系列開源模型一起,為全球企業的生成式 AI
    的頭像 發表于 07-25 09:48 ?797次閱讀

    HPE 攜手 NVIDIA 推出 NVIDIA AI Computing by HPE,加速生成式 AI 變革

    by HPE 包含了可持續的加速計算產品組合以及全生命周期服務,將簡化 AI 創造價值的過程,加速生成式 AI 的發展步伐。 NVIDIA AI Computing by HPE 由
    的頭像 發表于 06-21 14:39 ?430次閱讀

    NVIDIA推出NVIDIA AI Computing by HPE加速生成式 AI 變革

    作為極具開創性的站式“交鑰匙”私有云人工智能(private-cloud AI)解決方案,NVIDIA AI Computing by HPE 包含了可持續的加速計算產品組合以及全生
    的頭像 發表于 06-20 17:36 ?790次閱讀

    NVIDIA 通過 CUDA-Q 平臺為全球各地的量子計算中心提供加速

    德國、日本和波蘭的超級計算機利用 Grace-Hopper 和量子-經典加速超算平臺推進量子計算研究 ? ? 德國漢堡 —— 國際超算大會(ISC)—— 2024 年 5 月 13 日
    發表于 05-13 15:21 ?228次閱讀
    <b class='flag-5'>NVIDIA</b> 通過 CUDA-Q 平臺為全球各地的量子<b class='flag-5'>計算</b>中心提供<b class='flag-5'>加速</b>

    2024春季招聘,最熱門的崗位是……?鴻蒙

    。根據智聯招聘發布的《2024年春市場行情周報》顯示,就業市場回暖復蘇, 鴻蒙相關崗位成為招聘亮點 。 鴻蒙市場如火如荼 根據智聯招聘數據
    的頭像 發表于 02-28 22:07 ?630次閱讀
    2024春季<b class='flag-5'>招聘</b>,最熱門的<b class='flag-5'>崗位</b>是……?鴻蒙
    主站蜘蛛池模板: 国产一区二区高清 | 色多多视频官网 | 亚洲国产成人久久笫一页 | 成年片色大黄全免费 | hs视频在线观看 | 成人性视频网站 | 日日艹| 日日拍拍 | 国产超爽人人爽人人做 | 天天干夜夜爽天天操夜夜爽视频 | 手机福利片 | 四虎成人免费网站在线 | 日本写真高清视频免费网站网 | 美国色网站 | 日本三级s级在线播放 | 殴美一级 | 黄色大片视频 | 午夜精品视频在线观看 | 手机看片自拍自自拍日韩免费 | 黄色美女免费网站 | 亚洲dv| 劳拉淫欲护士bd字幕 | 奇米社区 | 国内精品久久久久影院男同志 | 69性xxxxfreexxxx| 免费黄色在线观看 | 91学院派女神 | semm亚洲欧美在线高清 | 日本xxwwwxxxx网站 | 国产一级影院 | 中文字幕一区在线观看视频 | 俄罗斯美女在线观看一区 | 性色aⅴ闺蜜一区二区三区 性色成人网 | 男女爱爱视频免费看 | 日本福利网址 | 久久99操 | 四虎新地址4hu 你懂的 | 色老久久精品偷偷鲁一区 | 男女交性视频免费播放 | 在线成人精品国产区免费 | 色综合天天综合网国产国产人 |