91在线观看视频-91在线观看视频-91在线观看免费视频-91在线观看免费-欧美第二页-欧美第1页

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

澎峰科技高性能大模型推理引擎PerfXLM解析

perfxlab ? 來源:perfxlab ? 2024-09-29 10:14 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

自ChatGPT問世以來,大模型遍地開花,承載大模型應用的高性能推理框架也不斷推出,大有百家爭鳴之勢。在這種情況下,澎峰科技作為全球領先的智能計算服務提供商,在2023年11月25日發布了針對大語言模型的高性能推理框架,并受到廣泛關注。在歷經數月的迭代開發后,澎峰科技重磅發布升級版本,推出全新的高性能大模型推理引擎:PerfXLM。

PerfXLM采用了云端一體架構,支持云端推理和本地推理兩種模式。在硬件支持上,PerfXLM適配了包含多種國產處理器在內的不同硬件,并針對硬件體系結構特征進行了深入性能優化,大幅提升了大模型推理性能。

一、PerfXLM整體架構

wKgZomb4uDOATSGEAAGRHaV4N2Q254.png

圖1.PerfXLM整體架構

如圖1所示,PerfXLM整體架構分為三層:

1.模型轉換層。將Torch或者Huggingface格式的大模型轉化為統一的內部模型結構,并最終統一表達為ONNX圖。

2.推理引擎層。實現了ONNX圖解析、算子調度、統一內存管理等功能,大幅提升硬件資源利用率;同時,也提供了針對云端推理的專用Serving模塊,以獲得更高的硬件利用率和QPS響應。

3.性能層。提供了針對大模型推理的高性能算子庫,并針對各種主流硬件進行了適配和優化。

PerfXLM具有的三大特點:

1.云端一體,同時支持云側和端側大模型推理,能夠讓大模型適用于各種應用場景之中。

2.支持多異構平臺,支持了包括NVIDIA GPU、海光DCU、高通Adreno GPU、Intel iGPU、某國產GPU在內的多種硬件設備

3.高性能定制優化算子,實現了結合體系結構特征和大模型推理應用特征的定制優化。

二、大模型推理中的MxN問題

PerfXLM向上對接各種模型網絡,向下適配各種硬件架構。這就存在著一個組合問題:假設需要支持M個模型和N種硬件,那么一共有MxN種組合方式。PerfXLM需要實現對主流模型的支持,目前主流模型大概有幾十種,國內甚至一度“千模大戰”。同時,PerfXLM也需要實現對主流硬件的支持,包括NVIDIA GPU、AMD GPU、海光DCU、沐曦GPU等通用GPU架構;X86、ARMRISC-V等通用CPU架構;高通Adreno GPU、ARM MALI GPU等移動GPU架構;華為昇騰、寒武紀MLU、燧原等專用處理器架構等。考慮到模型和硬件的迅猛發展,這個組合數大概有上千種,這就對大模型推理框架提出了很高的兼容性要求。

面對這樣的一個復雜問題,PerfXLM提出了一套解決方案:通過統一的模型表達,實現了對不同大模型的快速支持;通過統一算子API的定義,實現了對大模型圖的快速算子構建;通過融合體系結構特征和應用特征的算子庫的構建,實現了對不同硬件的快速適配。

同時,為了便于用戶使用,PerfXLM上層采用了與vllm一致的頂層API接口。用戶只需要在導入python模塊時,簡單地將vllm修改成perfxlm就能夠將原有的代碼運行起來并且獲得更高的性能表現。具體的使用示例如下圖。

wKgZomb4uD-Adc2eAAJc5XOMSy4470.png

圖2. PerfXLM API接口

通過這樣的一套架構體系,PerfXLM可以快速地支持新的模型和新的硬件。以近日Meta開源的LLaMA3為例,假設算子完備的情況下,只需幾個小時的時間,就能夠將該最新模型運行在各種主流硬件設備上。

三、PerfXLM性能

云側和端側的應用場景不同:云上側重于多用戶服務,關注的是整體吞吐;端側側重于單用戶的使用體驗,關注的是在低算力硬件上的響應速度和延遲。下面講描述PerfXLM在單Batch和多Batch下的性能。

1)PerXLM在NVIDIA GPU上的性能

wKgZomb4uEyAYA7yAAFPSvcTt64452.png

圖3. PerfXLM與vllm在A40上FP16的llama2性能對比

wKgZomb4uFeAKe8_AAFmM0A6MOo396.png

圖4. PerfXLM與vllm在4090上FP16的llama2性能對比

wKgaomb4uGOAezZcAAFj5n8whQM162.png

圖5.PerfXLM與vllm在A40上FP16的llama3性能對比

wKgZomb4uG2AHqYIAAFisDWGRBI637.png

圖6.PerfXLM與vllm在4090上FP16的llama3性能對比

2)PerfXLM在海光DCU上的性能

wKgaomb4uHeATR0GAAG5vAuXWHk595.png

圖7 PerfXLM與vllm在DCU Z100SM上的llama2性能對比

wKgaomb4uIKAbw6KAAGnzfy687A508.png

圖8 PerfXLM與vllm在DCU Z100SM上的llama3性能對比

3)PerfXLM在國產某GPU上的性能

wKgZomb4uIyADm2LAAEtoH1PkrM646.png

圖9 PerfXLM在某國產GPU上的性能

4)PerfXLM在高通Adreno GPU上的性能

wKgaomb4uJaAcdvlAADOB-FQEXM999.png

圖10 PerfXLM在高通Adreno的性能(單batch)

5)PerfXLM在Intel iGPU上的性能

wKgaomb4uKCARmNDAAFwkUzpcgk783.png

圖11 PerfXLM在Intel iGPU上的性能(單batch)

未來,PerfXLM將繼續支持"更多的硬件 x更多的模型"。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 澎峰科技
    +關注

    關注

    0

    文章

    71

    瀏覽量

    3392
  • 大模型
    +關注

    關注

    2

    文章

    3147

    瀏覽量

    4085

原文標題:爆款·大模型推理引擎PerfXLM發布

文章出處:【微信號:perfxlab,微信公眾號:perfxlab】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    信而泰×DeepSeek:AI推理引擎驅動網絡智能診斷邁向 “自愈”時代

    網絡智能診斷平臺。通過對私有化網絡數據的定向訓練,信而泰打造了高性能、高可靠性的網絡診斷模型,顯著提升了AI輔助診斷的精準度與實用性。該方案實現了網絡全流量深度解析能力與AI智能推理
    發表于 07-16 15:29

    2023RISC-V中國峰會,科技成果發布搶先看!

    高性能計算領域設計的計算型服務器。衡山系列預裝自研的高性能計算行業解決方案HPC SDK:數學計算庫PerfMPL、異構計算框架PerfXAPI、科學計算軟件PerfXPy等,使能
    發表于 08-15 18:28

    HarmonyOS:使用MindSpore Lite引擎進行模型推理

    場景介紹 MindSpore Lite 是一款 AI 引擎,它提供了面向不同硬件設備 AI 模型推理的功能,目前已經在圖像分類、目標識別、人臉識別、文字識別等應用中廣泛使用。 本文介紹
    發表于 12-14 11:41

    科技發布大模型推理引擎PerfXLLM

    要的巨額開銷也引發了相關研究者的關注。如何高效地進行推理,并盡可能地減少成本,從而促進大模型應用的落地成為了目前的關鍵問題。 于是,科技研發了一款 大
    的頭像 發表于 11-25 15:35 ?1898次閱讀
    <b class='flag-5'>澎</b><b class='flag-5'>峰</b>科技發布大<b class='flag-5'>模型</b><b class='flag-5'>推理</b><b class='flag-5'>引擎</b>PerfXLLM

    科技與并行科技共拓AI大模型技術創新應用服務

    4月17日,(北京)科技有限公司(以下簡稱“科技”)與北京并行科技股份有限公司(以下簡稱“并行科技”)簽署戰略合作協議。
    的頭像 發表于 04-23 09:54 ?767次閱讀
    <b class='flag-5'>澎</b><b class='flag-5'>峰</b>科技與并行科技共拓AI大<b class='flag-5'>模型</b>技術創新應用服務

    科技CA100智能計算一體機核心優勢解讀

    科技PerfXLM Solution完整軟件生態,自研異構計算軟件棧PerfXAPI,PerfMPL高性能數學庫、算子庫、領域加速包,
    的頭像 發表于 07-08 10:59 ?1379次閱讀
    <b class='flag-5'>澎</b><b class='flag-5'>峰</b>科技CA100智能計算一體機核心優勢解讀

    科技受聘為“主權級大模型”創新聯合體學術委員會委員

    日前,“主權級大模型“創新聯合體揭牌,科技CEO受聘為”主權級大模型“創新聯合體學術委員會委員。
    的頭像 發表于 09-02 17:37 ?1179次閱讀

    科技受邀參加全球AI芯片峰會,探討大模型推理引擎PerfXLM面向RISC-V的移植和優化

    最高、影響力最強的產業峰會之一。 本屆峰會由芯東西與智猩猩共同主辦,以 「智算紀元 共筑芯路」 為主題。峰會采用“主會議+技術論壇+展覽展示”的全新形式。科技創始人&CEO張先軼博士受邀參加于9月7日下午舉辦的中國RISC-V計算創新論壇,屆時將與大家分享 「 面向R
    的頭像 發表于 09-05 16:22 ?616次閱讀
    <b class='flag-5'>澎</b><b class='flag-5'>峰</b>科技受邀參加全球AI芯片峰會,探討大<b class='flag-5'>模型</b><b class='flag-5'>推理</b><b class='flag-5'>引擎</b><b class='flag-5'>PerfXLM</b>面向RISC-V的移植和優化

    科技“云”校園行活動回顧

    在金秋十月的尾巴,科技的“云”校園行活動來到了湖南科技職業學院·軟件學院。科技為師生
    的頭像 發表于 10-24 11:22 ?783次閱讀

    云”校園行:湖南科技職業學院站,共啟校園創新之旅!

    活動回顧 在金秋十月的尾巴,科技的“云”校園行活動來到了 湖南科技職業學院·軟件學院 。
    的頭像 發表于 10-24 11:41 ?534次閱讀
    “<b class='flag-5'>澎</b><b class='flag-5'>峰</b>云”校園行:湖南科技職業學院站,共啟校園創新之旅!

    第一屆“云?大模型AI校園應用創新賽完美結束

    在大模型人工智能的浪潮中,科技與中科曙光強強聯合,共同打造了一場大模型AI創新應用盛宴——第一屆“
    的頭像 發表于 11-11 10:59 ?704次閱讀

    科技PerfXCloud平臺獲海光DCU生態兼容性認證

    PerfXCloud是由科技自主研發的大模型開發與服務云平臺,是主要面向教育、文旅、企業、政府等行業打造的一站式大模型微調推理應用服務的
    的頭像 發表于 12-13 14:44 ?697次閱讀

    科技攜手湖南第一師范,開啟大模型AI學習新模式

    科技 作為國內領先的AI Infra企業,始終致力于推動AI技術的普及與教育。近日, 科技 與 湖南第一師范 的師生們一起探索推進了一場知識的盛宴—— 大
    的頭像 發表于 12-17 18:16 ?694次閱讀
    <b class='flag-5'>澎</b><b class='flag-5'>峰</b>科技攜手湖南第一師范,開啟大<b class='flag-5'>模型</b>AI學習新模式

    科技計算軟件棧與沐曦GPU完成適配和互認證

    ?近期,科技與沐曦完成了對PerfXLM推理引擎)、PerfXCloud(大模型服務平臺)
    的頭像 發表于 01-21 09:51 ?631次閱讀

    科技與沐曦完成聯合測試,實現全面兼容

    近日,科技與沐曦科技宣布,雙方已完成對PerfXLM推理引擎、PerfXCloud大模型服務
    的頭像 發表于 01-21 15:20 ?640次閱讀
    主站蜘蛛池模板: 狠狠干狠狠操视频 | 天天操天天干天天插 | 国产大乳孕妇喷奶水在线观看 | 操人视频网站 | 成人免费无毒在线观看网站 | 国产色噜噜| 久久精品国产免费 | 91网站在线播放 | 拍拍拍拍拍拍拍无挡大全免费 | 国产一级特黄在线视频 | bt磁力在线搜索 | 色综合久久一区二区三区 | 天天操夜夜操狠狠操 | 伊人成伊人成综合网2222 | 日本黄色片视频 | 日韩一级在线 | 天天射干 | 婷婷五月小说 | 高清不卡毛片免费观看 | 成人五级毛片免费播放 | 夜夜嘿视频免费看 | 日本高清视频色www在线观看 | 日本一本高清视频 | 日日操免费视频 | 最近最新中文字幕6页 | 免费视频播放 | 精品国产自在在线在线观看 | 久久久亚洲欧美综合 | 天堂网在线www资源在线 | 中文免费观看视频网站 | h版欧美一区二区三区四区 h网站亚洲 | 亚洲国产午夜精品理论片的软件 | 国产牛牛 | 亚洲成人三级电影 | 丁香花的视频免费观看 | 综合五月激情 | 666精品国产精品亚洲 | 劳拉淫欲护士bd字幕 | 伊人网大香 | 亚洲精品亚洲人成人网 | 人人人草 |