在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

大模型端側部署加速,都有哪些芯片可支持?

Carol Li ? 來源:電子發燒友 ? 作者:李彎彎 ? 2024-05-24 00:14 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

電子發燒友網報道(文/李彎彎)大模型在端側部署是指將大型神經網絡模型部署在移動終端設備上,使這些設備能夠直接運行這些模型,從而執行各種人工智能任務,如圖像識別、語音識別、自然語言處理等。隨著大模型小型化、場景化需求的增加,推理逐步從云端擴展向端側。這種趨勢在PC和手機等終端產品上尤為明顯。

大模型在端側部署加速

大模型在端側部署的過程通常包括幾個階段,首先是模型訓練階段,在這個階段,使用大量的標注數據訓練出對應的模型文件。訓練時需要考慮模型的大小和計算量,以便適應端側設備的硬件條件。

接著是模型壓縮,為了降低模型在端側設備上的存儲和運行壓力,通常需要對模型進行壓縮。這可以通過剪枝、量化等手段來實現,以減小模型的大小和降低計算復雜度。

再就是模型部署,在這個階段,將壓縮后的模型部署到端側設備上。這包括將模型文件傳輸到設備上,在設備上安裝必要的推理引擎和運行時環境等步驟。

最后,在模型部署完成后,端側設備就可以使用這些模型進行推理計算了。這通常包括加載模型、輸入數據預處理、模型計算、結果輸出等步驟。

在大模型端側部署過程中,需要考慮一些技術挑戰和限制。例如,端側設備的硬件條件通常比云端服務器要差很多,因此需要在模型設計和壓縮階段充分考慮這些因素。此外,端側設備的網絡帶寬和延遲也可能對模型推理的實時性和準確性產生影響。

為了克服這些挑戰和限制,一些技術工具和平臺被開發出來,如MLflow、Ray Serve、Kubeflow、Seldon Core、BentoML和ONNX Runtime等。這些工具可以幫助用戶更方便地構建、部署和管理機器學習模型,從而提高模型在端側設備上的性能和可用性。

現如今,大模型在端側的部署正在加速。在PC領域,繼英特爾推出首個AI PC處理器后,聯想集團、惠普、宏碁等廠商相繼發布多款AI PC新品。據報道,已有超過10款筆記本可以本地運行AI大模型,并且還有一批新品將陸續上市。

在手機領域,從2023年下半年開始,小米、OPPO、vivo等手機廠商紛紛在新系統中增加大模型能力。到2024年1月,中國手機市場Top5中,除蘋果之外,已經全數發布自有端側大模型產品。

大模型在端側部署的優勢也日益凸顯。一方面,端側部署可以降低數據傳輸延遲和帶寬限制,提高實時性和響應速度。另一方面,端側部署可以更好地保護用戶隱私和數據安全,因為數據可以在本地進行處理,而無需傳輸到云端。

國內外廠商推出支持大模型端側部署芯片

大模型要在端側部署離不開芯片的支持,英特爾、高通聯發科等都推出了針對大模型在PC、手機等移動端部署所需的芯片。英特爾推出了首款基于Intel 4制程的酷睿Ultra系列處理器第一代產品Meteor Lake,這款處理器首次在客戶端CPU中采用了Chiplet(芯粒)設計和自家的Foveros先進封裝技術,集成了NPU(神經網絡處理單元),可以本地運行200億參數大模型,無需聯網即可秒級生成高質量多模態數據。

高通發布的第三代驍龍8移動平臺,是其首個專為生成式AI打造的移動平臺。該平臺支持在終端側運行100億參數的模型,并面向70億參數大預言模型每秒生成高達20個token,且能夠在終端側通過Stable Diffusion生成圖片。

此外,高通還推出了AI Hub,這是一個為開發者提供的AI模型庫,包括傳統AI模型和生成式AI模型,能夠支持在驍龍和高通平臺上進行部署。這個模型庫支持超過75個AI模型,如Whisper、ControlNet、Stable Diffusion和Baichuan-7B等,開發者可以輕松地獲取這些模型并將其集成到應用程序中。

聯發科與阿里云展開深度合作,在天璣9300和天璣8300移動平臺上實現了通義千問大模型的端側部署。聯發科的天璣系列移動芯片,如天璣9300和天璣8300,都是高性能、高能效的移動計算平臺。這些芯片不僅具有強大的處理能力,還支持先進的5G技術和生成式AI技術,為端側大模型部署提供了堅實的基礎。

另外,國內的愛芯元智、芯動力科技等公司也針對大模型在端側的部署優化產品。愛芯元智的AX650N芯片在大模型端側部署方面就展現出了顯著的優勢。

具體來說,AX650N在部署Swin Transformer這類大型視覺模型時,能夠保持高精度和高效率。由于大部分端側AI芯片在架構上對于MHA(Multi-Head Attention)結構沒有過多優化,因此部署大型模型時往往需要進行網絡結構的修改,這可能導致精度下降和重訓的麻煩。然而,AX650N通過其獨特的架構和優化,能夠直接支持原版Swin Transformer的部署,從測試板到demo復現只需要5分鐘,私有模型在私有環境中運行也僅需1小時。

此外,AX650N還具備32路視頻解碼/視頻結構化處理、被動散熱、支持低延時編解碼、HDMI輸出和USB 3.0等特性,這些特性使得它非常適合用于各種視覺感知和邊緣計算的應用場景。在大模型端側部署方面,AX650N不僅提供了強大的計算能力,還通過其易部署和低功耗的特點,為實際應用落地提供了更多的可能性。

芯動力科技是一家清華系的AI芯片創企,他們面向大模型推出了AzureBlade L系列M.2加速卡。這款加速卡具有強大的性能,能夠順利運行大模型系統,并且其大小僅為80mm(長)x22mm(寬),非常適合在PC等端側設備上部署。

AzureBlade L系列M.2加速卡已經實現了與Llama 2、Stable Diffusion等模型的適配,成為助推大模型在端側設備上部署的加速器。這種具備體積小、性能強,且有通用接口的M.2加速卡,能夠突破端側設備有限的計算和存儲能力,為大模型在端側的落地提供了機會。

寫在最后

大模型在端側部署是一個復雜的過程,需要考慮多種因素和技術挑戰。但是通過合理的模型設計、壓縮和優化以及使用適當的工具和平臺,就可以讓端側設備具備更強的人工智能能力。如今,在產業鏈各環節的努力下,大模型在端側部署的現狀呈現出加速的趨勢,預計,未來隨著技術的不斷進步和優化,大模型在端側部署的應用將會越來越廣泛。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 神經網絡
    +關注

    關注

    42

    文章

    4812

    瀏覽量

    103125
  • 大模型
    +關注

    關注

    2

    文章

    3072

    瀏覽量

    3948
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    如何使用Docker部署模型

    隨著深度學習和大模型的快速發展,如何高效地部署這些模型成為了一個重要的挑戰。Docker 作為一種輕量級的容器化技術,能夠將模型及其依賴環境打包成一個
    的頭像 發表于 05-24 16:39 ?232次閱讀

    MediaTek天璣9400率先完成阿里Qwen3模型部署

    通義大模型團隊在天璣 9400 旗艦移動平臺上率先完成 Qwen3(千問 3)的側部署。未來,搭載天璣 9400 移動平臺的設備充分發揮
    的頭像 發表于 05-08 10:11 ?408次閱讀

    AI側部署案例(SC171開發套件V3)

    AI側部署案例(SC171開發套件V3) 序列 課程名稱 視頻課程時長 視頻課程鏈接 課件鏈接 工程源碼 1 初學者入門手寫數字識別案例 20分02秒 https://t.elecfans.com
    發表于 04-16 18:33

    AI側部署開發(SC171開發套件V3)

    AI側部署開發(SC171開發套件V3) 序列 課程名稱 視頻課程時長 視頻課程鏈接 課件鏈接 工程源碼 1 Fibo AI Stack模型轉化指南------Docker Desktop環境操作
    發表于 04-16 18:30

    首創開源架構,天璣AI開發套件讓側AI模型接入得心應手

    模型庫的限制,聯發科還首發了開源彈性架構。區別于過往的開放接口,只能部署特定架構模型,開放彈性架構允許開發者直接調整平臺源代碼,無需等待芯片廠商的
    發表于 04-13 19:52

    AI大模型側部署正當時:移遠端側AI大模型解決方案,激活場景智能新范式

    在AI技術飛速發展的當下,AI大模型的應用正從云端向加速滲透。 作為全球領先的物聯網整體解決方案供應商,移遠通信憑借深厚的技術積累與前瞻性的戰略布局,在AI大模型
    發表于 03-27 11:26 ?216次閱讀
    AI大<b class='flag-5'>模型</b><b class='flag-5'>端</b><b class='flag-5'>側部署</b>正當時:移遠端側AI大<b class='flag-5'>模型</b>解決方案,激活場景智能新范式

    AI大模型側部署正當時:移遠端側AI大模型解決方案,激活場景智能新范式

    在AI技術飛速發展的當下,AI大模型的應用正從云端向加速滲透。作為全球領先的物聯網整體解決方案供應商,移遠通信憑借深厚的技術積累與前瞻性的戰略布局,在AI大模型
    的頭像 發表于 03-26 19:05 ?419次閱讀
    AI大<b class='flag-5'>模型</b><b class='flag-5'>端</b><b class='flag-5'>側部署</b>正當時:移遠端側AI大<b class='flag-5'>模型</b>解決方案,激活場景智能新范式

    暢享DeepSeek自由,憶聯高性能CSSD為側大模型加速

    解決。然而,隨著用戶訪問量的激增,服務器無響應、等待時間長等問題也屢見不鮮。一時間,能夠離線運行,且更具隱私性的DeepSeek側部署也成為新風向。 本地部署雖具備諸多優點,但對電腦的硬件配置卻有一定的要求。大
    的頭像 發表于 03-13 15:35 ?223次閱讀
    暢享DeepSeek自由,憶聯高性能CSSD為<b class='flag-5'>端</b>側大<b class='flag-5'>模型</b><b class='flag-5'>加速</b>

    暢享DeepSeek自由!憶聯高性能CSSD為側大模型加速

    響應、等待時間長等問題也屢見不鮮。一時間,能夠離線運行,且更具隱私性的DeepSeek側部署也成為新風向。 本地部署雖具備諸多優點,但對電腦的硬件配置卻有一定的要求。大模型包含大量參
    的頭像 發表于 03-13 10:18 ?337次閱讀
    暢享DeepSeek自由!憶聯高性能CSSD為<b class='flag-5'>端</b>側大<b class='flag-5'>模型</b><b class='flag-5'>加速</b>

    添越智創基于 RK3588 開發板部署測試 DeepSeek 模型全攻略

    方法的優缺點與操作要點。 01-使用Ollama工具部署-便捷但有短板 Ollama 是一個開源的大模型服務工具,可以支持最新的deepseek模型,以及Llama 3,Phi 3,M
    發表于 02-14 17:42

    黑芝麻智能芯片全面兼容DeepSeek模型推理

    目前,黑芝麻智能武當C1200家族芯片已經完成DeepSeek模型部署,A2000也將全面支持基于DeepSeek的多模態大模型。 伴隨D
    的頭像 發表于 02-14 11:27 ?517次閱讀

    側AI元年爆發!廣和通AI模組及解決方案全面支持DeepSeek-R1蒸餾模型

    近期,國產大模型DeepSeek憑借開放性、更低訓練成本、側部署等優勢,迅速成為增速最快的AI應用之一,推動AI普惠化。目前,廣和通高算力AI模組及解決方案全面支持小尺寸的DeepS
    的頭像 發表于 02-11 18:08 ?493次閱讀
    <b class='flag-5'>端</b>側AI元年爆發!廣和通AI模組及解決方案全面<b class='flag-5'>支持</b>DeepSeek-R1蒸餾<b class='flag-5'>模型</b>

    廣和通支持DeepSeek-R1蒸餾模型

    近期,國產大模型DeepSeek憑借開放性、更低訓練成本、側部署等優勢,迅速成為增速最快的AI應用之一,推動AI普惠化。目前,廣和通高算力AI模組及解決方案全面支持小尺寸的DeepS
    的頭像 發表于 02-11 09:41 ?548次閱讀

    AI模型部署邊緣設備的奇妙之旅:目標檢測模型

    以及邊緣計算能力的增強,越來越多的目標檢測應用開始直接在靠近數據源的邊緣設備上運行。這不僅減少了數據傳輸延遲,保護了用戶隱私,同時也減輕了云端服務器的壓力。然而,在邊緣部署高效且準確的目標檢測模型
    發表于 12-19 14:33

    基于AX650N/AX630C部署側大語言模型Qwen2

    本文將分享如何將最新的側大語言模型部署到超高性價比SoC上,向業界對側大模型部署的開發者提供
    的頭像 發表于 07-06 17:43 ?4507次閱讀
    基于AX650N/AX630C<b class='flag-5'>部署</b><b class='flag-5'>端</b>側大語言<b class='flag-5'>模型</b>Qwen2
    主站蜘蛛池模板: 欧美zoozzooz在线观看 | 色狠狠狠狠综合影视 | 在线免费观看一级片 | h在线观看网站 | 色综合精品 | sihu国产午夜精品一区二区三区 | 性欧美大胆高清视频 | 99久久香蕉国产综合影院 | 成 人 在 线 免费 8888 www | 黄色片网站日本 | 一区二区手机视频 | 欧美一区福利 | 久久婷五月综合 | 色之综合天天综合色天天棕色 | 手机在线看片国产日韩生活片 | 欧美zo| 人成xxxwww免费视频 | 午夜视频观看 | 天天综合网天天综合色 | 亚洲美女视频在线观看 | 久热操| 天堂网www在线观看 天堂网www在线资源中文 | 三级网站免费 | 亚洲男人天堂2020 | 国产精品美女一区二区三区 | 人与牲动交xxxxbbbb高清 | 国产香蕉在线精彩视频 | 777色淫网站女女免费 | 丁香婷婷在线 | 两人性世界| 澳门久久 | 美女操出水 | 男女视频在线看 | 亚洲欧美一区二区久久香蕉 | 亚洲另类电击调教在线观看 | 亚洲人成网i8禁止 | 三级国产在线观看 | 午夜寂寞影 | 奇米欧美 | 波多野结衣一级毛片 | 五月天婷婷网站 |