91在线观看视频-91在线观看视频-91在线观看免费视频-91在线观看免费-欧美第二页-欧美第1页

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

大模型快速發展,GPU IP有何作用

Carol Li ? 來源:電子發燒友 ? 作者:李彎彎 ? 2024-05-29 00:05 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群


電子發燒友網報道(文/李彎彎)隨著人工智能技術的快速發展,GPU作為重要的算力支撐時常被提及。國內外重要的GPU芯片公司也為人熟知,包括英偉達、AMD英特爾,景嘉微、海光信息、天數智芯、摩爾線程等。

事實上,除此之外還有一些GPU IP公司也為GPU產業發展做出很大貢獻,包括Imagination、Arm、芯原科技等。在當前備受關注的大模型方面,這些公司的產品也起到一定支持作用。

Imagination

Imagination的GPU IP產品包括IMG A系列、IMG CXT、IMG DXT等多個系列,每個系列有不同的特點和應用場景。IMG A系列,是Imagination有史以來性能最強大GPU IP產品,IMG A系列被設計為可應用于與各種場景的GPU,是多種垂直應用領域的終極解決方案。

該系列產品覆蓋從入門級市場的每時鐘周期處理1個像素(1 PPC)的組件,到高性能設備的速度高達每秒2萬億次浮點運算(2 TFLOP)的內核,以及針對云應用的、速度超越該數值的多核解決方案。

IMG CXT,搭載首個針對移動端優化的PowerVR Photon光線追蹤架構,為移動端游戲玩家和開發者提供桌面級光線追蹤功能的體驗。實現了光線追蹤性能的大幅提升,支持在移動設備中以高幀率實現逼真的光線追蹤陰影、反射、全局照明和環境遮蔽等效果。

IMG DXT是新一代面向移動端的高性能GPU IP,為移動設備用戶帶來先進的圖形技術。提供三款配置,包括DXT-8-256、DXT-48-1536和DXT-72-2304,分別針對主流、高端和旗艦移動設備。旗艦產品DXT-72-2304具有72 GTexels/s和2.5 TFLOP FP32算力,與上一代產品相比,其最大單核性能提升了50%。

Imagination的GPU IP產品廣泛應用于移動設備、汽車、數據中心、桌面和云游戲等多個領域。通過提供高性能的圖形渲染和數據處理能力,為各種應用場景提供了強大的支持。

Imagination的GPU IP高性能、可擴展性和低功耗的特性,使得在支持大模型的應用上具有優勢。如IMG DXD,其多核配置提供了強大的計算能力,5 TFLOPS FP32和144 GTexel/s,能夠在大模型的應用上起到支持作用。

Arm

Arm的GPU IP產品系列主要包括Mali系列和Immortalis系列。Mali系列GPU IP是Arm的長期主力產品,擁有從入門級到旗艦級的完整產品線。Mali系列包括Mali-G710、Mali-G610、Mali-G510、Mali-G310等多個型號,分別定位于不同性能和價格的市場段。

Mali系列GPU基于Valhall GPU架構,并持續優化和提升性能。例如,Mali-G710號稱綜合性能提升20%、機器學習性能提升35%、紋理性能提升50%、能效提升20%。

Immortalis系列是Arm在2022年推出的全新旗艦級GPU IP產品,旨在提供終極的移動3D體驗。Immortalis GPU基于Mali設計,并引入了硬件光線追蹤功能,這是首款在移動端支持此功能的GPU。

Immortalis GPU采用10-16核設計,性能比上一代Mali GPU高15%。其光線追蹤單元旨在提高效率,只占用約4%的著色器核心面積,卻能帶來300%的性能提升。

目前,Immortalis系列已經推出了Immortalis-G715和Immortalis-G720等型號。Immortalis-G720是Arm目前性能和能效表現最為出色的GPU,與上一代產品相比,其性能和能效分別提高了15%,系統級效率更躍升了40%。

Arm的GPU IP產品廣泛應用于移動設備、汽車、數據中心、桌面和云游戲等多個領域。它們能夠支持各種計算任務,如圖形渲染、物理模擬、圖像處理、機器學習和人工智能等。

Arm的GPU IP高性能計算、能效優化和生態系統支持方面特點,使其在大模型的應用方面具有優勢。Arm的GPU IP,如Mali系列和Ethos系列,已被多家公司采用,并成功應用于大模型訓練和推理中。

在大模型訓練方面,Arm的GPU IP被廣泛應用于深度學習、自然語言處理等領域。通過與合作伙伴共同開發定制化的解決方案,Arm GPU IP為這些領域的研究者和開發者提供了強大的計算能力支持。

在云端推理方面,Arm的GPU IP同樣發揮了重要作用。通過提供高性能的云端計算資源,Arm GPU IP支持了多種大模型應用的實時推理需求。

芯原股份

芯原股份的GPU IP系列產品,以其高性能、靈活性和廣泛的應用范圍,成為市場上備受矚目的產品。芯原可擴展的Vivante圖形處理器(GPU)IP系列應用廣泛,包括從低功耗的小型物聯網MCU到面向汽車和計算機應用的功能強大的SoC。設計可滿足各種芯片尺寸和功耗預算,是具成本效益的優質圖形處理器解決方案。

芯原科技此前還詳細介紹了其GPGPU-AI IP為核心的AI芯片定制解決方案。其以Tensor Core和GPGPU/GPU為主,提供了一個靈活的架構。

芯原GPGPU-AI處理器上有芯原通用的軟件棧,在上層可以支持標準的應用接口,下層可以適配芯原各種各樣的算力IP,算力IP有圖形處理器、并行計算處理器、神經網絡處理器。芯原GPGPU-AI分幾個層次擴展的算力,可以支持異構計算,包括矢量計算、標量計算和張量處理單元,還可以支持大模型,高帶寬計算需求,同時基于在AI領域有多年的積累,可對數據組織、數據搬移和計算有針對性的優化,另外還有專門針對大模型的帶寬壓縮技術。

芯原的GPU IP已被廣泛應用于桌面顯卡、車載信息娛樂、工業顯示、物聯網及可穿戴設備、大規模并行計算等領域。

寫在最后


可以看到,GPU IP在多個領域都有廣泛應用,包括科學計算、大數據分析、深度學習和人工智能、游戲服務器、圖像處理、圖形渲染和動畫制作、視頻處理和圖像識別等。

當然,GPU IP也在不斷發展和演進中,未來,專用加速IP與通用GPU的融合或許是GPU技術未來發展的一個亮點,這種融合將使GPU更具多功能性,更好地處理特定工作負載。高速DRAM和緩存技術的不斷演進也將推動GPU的性能提升,使其能夠更有效地處理復雜的計算任務,如支持大模型的訓練和部署。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • gpu
    gpu
    +關注

    關注

    28

    文章

    4949

    瀏覽量

    131291
  • IP
    IP
    +關注

    關注

    5

    文章

    1805

    瀏覽量

    152631
  • 大模型
    +關注

    關注

    2

    文章

    3147

    瀏覽量

    4085
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    搭建萬卡GPU集群,小米AI大模型即將全力啟動

    董事長雷軍在該團隊扮演重要的領導角色。 ? 高性能計算是大模型發展的基礎,而GPU在其中扮演重要作用。隨著AI在如今社會中發揮著越來越重要的作用
    的頭像 發表于 12-29 00:02 ?2937次閱讀
    搭建萬卡<b class='flag-5'>GPU</b>集群,小米AI大<b class='flag-5'>模型</b>即將全力啟動

    【VisionFive 2單板計算機試用體驗】1、開箱初體驗(刷系統+靜態IP設置+GPU跑分測評)

    文件:注意:balenaEtcher這個軟件表面上可以選擇bz2文件,但是在軟件內解壓的話會卡在73%的進度。所以,bz2文件要先解壓,再用balenaEtcher燒錄鏡像到TF卡。 開機設置靜態IP
    發表于 07-09 21:50

    為什么無法在GPU上使用INT8 和 INT4量化模型獲得輸出?

    安裝OpenVINO? 2024.0 版本。 使用 optimum-intel 程序包將 whisper-large-v3 模型轉換為 int 4 和 int8,并在 GPU 上使用 OpenVINO? 運行推理。 沒有可用的輸出。
    發表于 06-23 07:11

    摩爾線程GPU率先支持Qwen3全系列模型

    近日,阿里云正式發布Qwen3系列的8款開源混合推理模型。摩爾線程團隊在模型發布當天,率先完成了Qwen3全系列模型在全功能GPU上的高效支持。這一成果充分展現了MUSA架構及全功能
    的頭像 發表于 05-07 15:24 ?488次閱讀

    無法在GPU上運行ONNX模型的Benchmark_app怎么解決?

    在 CPU 和 GPU 上運行OpenVINO? 2023.0 Benchmark_app推斷的 ONNX 模型。 在 CPU 上推理成功,但在 GPU 上失敗。
    發表于 03-06 08:02

    語言模型管理的作用

    要充分發揮語言模型的潛力,有效的語言模型管理非常重要。以下,是對語言模型管理作用的分析,由AI部落小編整理。
    的頭像 發表于 01-02 11:06 ?390次閱讀

    小米加速布局AI大模型,搭建GPU萬卡集群

    近日,消息稱小米正在緊鑼密鼓地搭建自己的GPU萬卡集群,旨在加大對AI大模型的投入力度。據悉,小米的大模型團隊在成立之初就已經擁有了6500張GP
    的頭像 發表于 12-28 14:25 ?529次閱讀

    GPU是如何訓練AI大模型

    在AI模型的訓練過程中,大量的計算工作集中在矩陣乘法、向量加法和激活函數等運算上。這些運算正是GPU所擅長的。接下來,AI部落小編帶您了解GPU是如何訓練AI大模型的。
    的頭像 發表于 12-19 17:54 ?753次閱讀

    《CST Studio Suite 2024 GPU加速計算指南》

    和不支持的NVIDIA GPU硬件,如支持的L40S、RTX 5000 Ada Gen等,不支持的如Kepler和Maxwell部分型號被標記為棄用。同時提到GPU計算要求64位計算機架構,不同代
    發表于 12-16 14:25

    IP定位離線庫的特點以及作用

    很多人知道IP定位,但是對離線庫不是很理解。這篇文章會和大家闡述離線庫的概念、特點以及具體什么作用。 IP定位路徑https://www.ipdatacloud.com/?utm-s
    的頭像 發表于 12-06 09:56 ?571次閱讀

    TPA3123 demo原理圖中,輸出LC濾波器個對地的電阻,請問作用?量產時能否去掉?

    您好,TI的TPA3123 demo原理圖中,輸出LC濾波器個對地的電阻,請問作用?量產時能否去掉? 見下圖中圈起部分。
    發表于 11-08 06:02

    PyTorch GPU 加速訓練模型方法

    在深度學習領域,GPU加速訓練模型已經成為提高訓練效率和縮短訓練時間的重要手段。PyTorch作為一個流行的深度學習框架,提供了豐富的工具和方法來利用GPU進行模型訓練。 1. 了解
    的頭像 發表于 11-05 17:43 ?1417次閱讀

    GPU市場趨勢與未來發展

    隨著科技的飛速發展,圖形處理單元(GPU)已經成為現代計算領域不可或缺的一部分。從游戲到專業圖形設計,再到人工智能和深度學習,GPU在各個領域都發揮著重要作用
    的頭像 發表于 10-27 14:14 ?1373次閱讀

    GPU深度學習應用案例

    GPU在深度學習中的應用廣泛且重要,以下是一些GPU深度學習應用案例: 一、圖像識別 圖像識別是深度學習的核心應用領域之一,GPU在加速圖像識別模型訓練方面發揮著關鍵
    的頭像 發表于 10-27 11:13 ?1389次閱讀

    為什么ai模型訓練要用gpu

    GPU憑借其強大的并行處理能力和高效的內存系統,已成為AI模型訓練不可或缺的重要工具。
    的頭像 發表于 10-24 09:39 ?982次閱讀
    主站蜘蛛池模板: 日本理论在线观看被窝网 | 亚洲免费黄色网 | 国产人成高清视频观看 | 黄色一级毛片看一级毛片 | 中文天堂在线最新2022更新 | 圆胖肥女人性视频 | 日本巨黄视频 | 欧美一级在线免费观看 | 69pao强力打造免费高速 | 超级黄色毛片 | 国产免费一级在线观看 | 久久福利青草精品资源站免费 | 4438x成人全国 | 亚洲男女免费视频 | 天天弄 | 在线伊人网| 五月情视频在线观看 | 亚洲国产精品自在现线让你爽 | a成人在线 | 一级特黄a 大片免费 | 4438x五月天| 性国产精品 | 欧美亚洲天堂网 | 欧美一级特黄视频 | 中文字幕一区二区三区四区五区 | 久久精品国产乱子伦多人 | 午夜欧美精品久久久久久久 | 黄色香蕉网站 | 男女交性视频免费播放视频 | 成人久久久精品乱码一区二区三区 | 国产99热| 特级片网站 | 高清成年美女黄网站色大 | 国产一级特黄特色aa毛片 | 天天夜约 | 亚洲成a人片77777潘金莲 | 国产3p在线播放 | 天天爽夜夜爽人人爽一区二区 | 三级网站免费 | 亚洲综合激情六月婷婷在线观看 | 天堂-bt种子 |