在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

加速計算25年,英偉達GPU帝國的三塊新版圖

jf_1689824270.4192 ? 來源:電子發燒友網 ? 作者:jf_1689824270.4192 ? 2019-12-19 13:47 ? 次閱讀

加速計算領域25年,英偉達用15億塊GPU的出貨量交上了一份學霸成績單。

這每一塊GPU都兼容CUDA,都采用同一個架構——這是黃仁勛的GPU帝國中最可圈可點的一筆。統一的架構,可以用于各種工作負載去實現加速計算;在芯片起點之上,通過完整的堆棧工程可進一步實現加速。

CUDA平臺具有豐富的庫、工具和應用程序,僅去年就發布了500多個SDK和庫,其中既有全新內容,也有更新版本。通過不斷優化,深度學習訓練在3年內提升了4倍、深度學習推理在1年內提高了2倍。

過去幾年內,AI取得了巨大的進展,開始逐步改變各個行業。從圖象識別、圖象分類到識別不同的物體等,甚至能夠識別圖象中的每一個像素。這背后,深度學習的驅動力量是巨大的。在今年的GTC上,黃仁勛也重點介紹了英偉達在推薦系統和會話式AI二大方向的重大進展。

在線推薦系統為“雙11”提速

推薦系統已經成為互聯網的重要引擎。我們在線購物時有數十億的產品有待選擇,上萬億的網頁可供瀏覽、上百萬的視頻以及應用……如何將合適的內容、產品在合適的時間推送給用戶?這是所有電商平臺、社交媒體等面臨的最大痛點。

這背后需要非常深入地理解每一個用戶的偏好、歷史行為等,以及每一個產品多種多樣的特性,這幾乎形成了一個TB級的數據集。

而一個最為生動的案例就是阿里巴巴的年度購物節“雙11”。今年“雙11”,阿里巴巴創造了380億美元的銷售額,相比于去年的310億美元,增長了近四分之一,是“黑色星期五”和“網購星期一”的網購銷售額總和的兩倍多。

對于阿里巴巴來說,推薦系統是一個至關重要的應用程序。該系統可以向用戶展示與其喜好相匹配的商品,從而提高點擊率。而點擊率在電商行業一直都是提高銷售量的重要驅動力。點擊率的每一次小幅提高都會直接影響用戶的體驗和商家的營收。

阿里巴巴使用NVIDIA GPU支持資源分配、模型量化和圖變換三項優化策略,從而提高吞吐量和響應性。通過NVIDIA T4 GPU,能夠為推薦模型提供加速,實現每秒處理780個查詢,遠遠領先于基于CPU每秒3個查詢的推理。

英偉達加速計算產品管理總監Paresh Kharya表示,推薦系統所面臨的挑戰是巨大的,主要體現在兩方面:第一,這些模型極其復雜,因為需要處理的數據量是海量的。為了提升推薦的相關度,必須要對所有參數來進行建模。比如:用戶的一些購買記錄、瀏覽記錄等,要處理的參數非常多。第二,這些模型要做出實時的計算,因為用戶在瀏覽時需要立刻看到推薦結果,不可能等待很長時間。

這兩大挑戰都需要以非??斓乃俣韧瓿捎嬎悖⒗锇桶蛷腃PU轉移到GPU的使用后,點擊通過率提升了10%。而事實上,這樣的“點擊率”每提升一點點都是非常困難的,GPU由于其實時性、大規模運行的特性能夠用于這一系統中。

而不僅僅是電子商務領域,只要是需要將產品與人之間進行匹配都需要用到這樣的推薦系統。百度、快手、美團、微軟必應,甚至一些傳統企業如:沃爾瑪、美國郵政等等,都在其推薦系統中采用了英偉達的GPU平臺。

值得一提的是,其他的處理器FPGA目前也在發力推薦系統這一領域。Paresh Kharya表示,AI的更新迭代非??欤P偷囊幠7浅4螅扛魩追昼娋驮谶M行更新,整個推理過程不斷在變化,因此需要不斷對這些模型進行訓練,才可以進行有效的推薦,這需要大量的算力。GPU可以說是AI領域的專用芯片,有指令集優勢、全可編程、并且是軟件定義的。此外,架構也是向前兼容的,整個硬件架構可以隨著軟件不斷更新,而且是在軟件庫就可以直接更新。

不光是GPU能提供的算力,英偉達也在通過工具和軟件來提供支持。比如通過最新的TensorRT來支持模型在各種情景下的部署,并且支持上百萬用戶在每秒內做數十億的搜索。

會話式AI通往真正的人工智能人機交互

在會話式AI方面,黃仁勛宣布了最新版本的推理軟件NVIDIA Tensor RT7,它能夠實現更智能的AI人機交互,可實現與語音代理、聊天機器人和推薦引擎等應用進行實時互動。

實現會話式AI的難點主要在于什么?Paresh Kharya表示,要實現會話式AI,首先,需要理解用戶到底在說什么,然后將他所說的語音轉化成文字,然后理解文字的意思,再把它轉化成語言,所以涉及很多模型同時發揮作用,需要多種多樣的神經網絡提供支持。第二,所有這個復雜計算的過程必須要在300毫秒之內完成,假設如果需要幾秒鐘的話,這在實際的對話中是無法容忍的時延,會話式AI也就失去了意義。

TensorRT 7內置新型深度學習編譯器。該編譯器能夠自動優化和加速遞歸神經網絡與基于轉換器的神經網絡。與在CPU上運行時相比,會話式AI組件速度提高了10倍以上,從而得以實現所需的300毫秒閾值以下。

對于在會話式AI領域的投入,黃仁勛表示:“我們已進入了一個機器可以實時理解人類語言的AI新時代。TensorRT 7使這成為可能,為世界各地的開發者提供工具,使他們能夠構建和部署更快、更智能的會話式AI服務,實現更自然的AI人機交互?!?/p>

TensorRT是英偉達的推理優化軟件。英偉達的GPU不論是用在自動駕駛、數據中心,還是嵌入式設備等領域,都需要運行在PyTorch、TensorFlow等多個框架中訓練自我優化的AI模型,TensorRT能夠提供這種優化的模型。

由于AI有多種多樣的使用場景,不同場景由不同的神經網絡提供支持。而為了優化AI性能,也需要優化各種各樣的神經網絡。TensorRT 7的推出算是跨出了巨大的一步,Transformer和RNN這些模型,都可以用TensorRT 7來進行優化。其中,Transformer典型的模型是BERT,有很多非常先進的自然語言理解的功能;RNN的典型例子就是語音識別或者將文本轉化成語音。

英偉達對TensorRT 7也進行了大量的優化,例如很多數學的運算,確保能夠更加高效、并且減少使用的內存。另外,TensorRT 7中引入了內核生成的功能,用任何RNN都可以生成一個優化的內核。對比TensorRT 5僅能支持種類很少的幾個神經網絡,TensorRT 7基本上可以支持各大類神經網絡,這些模型對于“會話式AI”是至關重要的。

首次兼容arm架構做加速計算

在GTC上,英偉達還釋放出了一個很值得玩味的信息:宣布推出基于arm的首個參考架構——NVIDIA HPC for arm.雙方這一合作,究竟是英偉達加入arm的生態,還是arm擁抱英偉達的江湖?

英偉達方面只是淡淡一句:希望不論是數據中心還是邊緣計算,不論是AI還是高性能計算,都能給客戶更多選擇。之前arm不支持CUDA,客戶已反復要求我們使用CUDA加速arm,并將arm服務器打造成HPC和AI的理想選擇。

全球有1500億臺基于arm架構的設備,為客戶想實現的創新提供多種功能:包括互聯、內存、CPU內核、計算能力等多元化的支持。

在邊緣計算領域,英偉達已有arm架構許可;超算領域,雙方于今年6月宣布了合作。兩個強大平臺和生態的握手,也并不意外。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • NVIDIA
    +關注

    關注

    14

    文章

    5274

    瀏覽量

    105934
  • gpu
    gpu
    +關注

    關注

    28

    文章

    4921

    瀏覽量

    130813
  • 英偉達
    +關注

    關注

    22

    文章

    3927

    瀏覽量

    93276
收藏 人收藏

    評論

    相關推薦
    熱點推薦

    新思科技攜手英偉加速芯片設計,提升芯片電子設計自動化效率

    解決方案在英偉 GPU英偉 CUDA-X庫上所實現的加速 基于
    發表于 03-19 17:59 ?248次閱讀

    《CST Studio Suite 2024 GPU加速計算指南》

    許可證模型的加速令牌或SIMULIA統一許可證模型的SimUnit令牌或積分授權。 4. GPU計算的啟用 - 交互式模擬:通過加速對話框啟用,打開求解器對話框,點擊“
    發表于 12-16 14:25

    英偉加速認證星AI內存芯片

    近日,英偉公司正在積極推進對星AI內存芯片的認證工作。據英偉CEO透露,他們正在不遺余力地加速
    的頭像 發表于 11-25 14:34 ?551次閱讀

    英偉與谷歌聯手加速量子計算設備設計

    近日,據外媒最新報道,英偉與谷歌兩大科技巨頭宣布攜手合作,共同加速下一代量子計算設備的設計進程。 雙方在一份聯合聲明中透露,谷歌的量子人工智能部門將充分利用
    的頭像 發表于 11-21 11:08 ?714次閱讀

    英偉與谷歌攜手加速量子計算設備設計

    英偉近日宣布,將與谷歌量子AI團隊展開合作,共同推進量子計算軟硬件工具的研發。雙方將利用英偉CUDA-Q平臺提供的模擬支持,加快設計谷歌
    的頭像 發表于 11-19 16:21 ?492次閱讀

    軟銀升級人工智能計算平臺,安裝4000顆英偉Hopper GPU

    軟銀公司宣布,其正在擴展的日本頂級人工智能計算平臺已安裝了約4000顆英偉Hopper GPU。這一舉措顯著提升了平臺的計算能力。據悉,該
    的頭像 發表于 11-04 16:18 ?782次閱讀

    GPU加速計算平臺是什么

    GPU加速計算平臺,簡而言之,是利用圖形處理器(GPU)的強大并行計算能力來加速科學
    的頭像 發表于 10-25 09:23 ?556次閱讀

    英偉Blackwell GPU未來一訂單爆滿

    據摩根士丹利(大摩)透露,人工智能(AI)芯片領域的領軍企業英偉(NVIDIA)的管理層在近期的一系列與投資人的會議中,分享了關于其下一代繪圖處理器(GPU)Blackwell的強勁市場需求情況。
    的頭像 發表于 10-17 16:52 ?844次閱讀

    英偉股價一個月內上漲25%

    統計數據顯示,在過去一個月中,英偉公司的股價上漲了 25%,股價目前已經接近了歷史高位,英偉公司的市值已超越微軟公司,成為市值第二高的公
    的頭像 發表于 10-11 15:23 ?805次閱讀

    Inflection AI轉向英特爾Gaudi 3,放棄英偉GPU

    近日,人工智能技術公司Inflection AI宣布了一項重要決策,其最新的企業平臺將放棄采用英偉(Nvidia)的GPU,轉而選擇英特爾的Gaudi 3加速器。
    的頭像 發表于 10-10 17:21 ?725次閱讀

    英偉Blackwell GPU量產加速,Q4營收沖刺百億美元大關

    近日,全球領先的圖形處理單元(GPU)及人工智能芯片制造商英偉傳來重大利好消息。據摩根士丹利最新發布的行業分析報告指出,英偉基于Blac
    的頭像 發表于 09-26 15:58 ?594次閱讀

    星電子HBM3E內存獲英偉認證,加速AI GPU市場布局

    近日,知名市場研究機構TrendForce在最新發布的報告中宣布了一項重要進展:星電子的HBM3E內存產品已成功通過英偉驗證,并正式開啟出貨流程。具體而言,星的HBM3E 8Hi
    的頭像 發表于 09-05 17:15 ?990次閱讀

    英偉發布新版NVIDIAApp

    英偉推出了 NVIDIA App 測試版?10.0.2 版本,?NVIDIA App新版本新增功能包括顯示設置、RTX 視頻增強控制、應用排序,以及面向其他國家 / 地區用戶的應用翻譯功能等。
    的頭像 發表于 08-07 16:16 ?1108次閱讀

    英偉將全面轉向開源GPU內核模塊

    英偉公司近期宣布了一項重大決策,即全面轉向開源GPU內核模塊,并計劃最終以此取代閉源驅動程序。這一戰略轉變標志著英偉在開源領域邁出了重要
    的頭像 發表于 07-19 15:26 ?824次閱讀
    主站蜘蛛池模板: 国产午夜精品理论片免费观看 | 欧美另类xx | 日本三级在线观看免费 | 在线 色| 国产成人精品三级 | xxx日本69| 你懂的福利 | 欧美人成绝费网站色www吃脚 | 色综合天天综合给合国产 | 伊人网综合视频 | 黄色免费三级 | 九九热九九 | 性过程很黄的小说男男 | 四虎永久免费最新在线 | 久久夜夜肉肉热热日日 | 男女在线观看视频 | 91福利专区 | 成熟女人免费一级毛片 | 中文字幕v视界影院 | 最新欧美精品一区二区三区 | 亚洲线精品一区二区三区 | 1024国产看片在线观看 | 在线视频影院 | 日韩毛片在线影视 | 婷婷国产在线 | 一级一级毛片免费播放 | 男校霸把男校草玩出水男男 | 不卡一区在线观看 | 91精品国产免费久久久久久青草 | 一级aa 毛片高清免费看 | 亚洲一二三区视频 | 亚洲欧美啪啪 | 国产精品久久精品福利网站 | 亚洲国产婷婷香蕉久久久久久 | 色香蕉色香蕉在线视频 | 影音先锋色偷偷米奇四色 | 在线黄色免费网站 | 五月激情片 | 天堂bt种子资源地址在线 | 久久婷婷色一区二区三区 | 澳门久久 |