在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

Arm Neoverse N2平臺實現(xiàn)DeepSeek-R1滿血版部署

Arm社區(qū) ? 來源:Arm社區(qū) ? 2025-07-03 14:37 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

今年年初,開源大語言模型 (LLM) DeepSeek 在國內(nèi)外人工智能 (AI) LLM 領(lǐng)域掀起熱議。它在模型架構(gòu)和訓練、推理方法上實現(xiàn)創(chuàng)新,在性能和工程效率上帶來了顯著提升,并在成本效率方面頗具優(yōu)勢。Arm 攜手合作伙伴,在 Arm Neoverse N2 平臺上使用開源推理框架 llama.cpp 實現(xiàn) DeepSeek-R1 滿血版的部署,目前已可提供線上服務。

在基于 Neoverse N2 平臺設(shè)計的服務器級 CPU 上,通過對軟硬件架構(gòu)的合理適配,以及出色調(diào)優(yōu)來充分發(fā)揮平臺的計算能力和內(nèi)存帶寬,能夠以 INT8 的量化版本提供業(yè)界可用的詞元 (token) 生成速度,并以更具競爭力的性價比為中小微企業(yè)提供業(yè)界頂尖的 LLM 服務。

在部署 DeepSeek 大模型過程中,Arm 結(jié)合底層架構(gòu)特性進行了深度優(yōu)化:模型本身跨多 ?NUMA(非統(tǒng)一內(nèi)存訪問)節(jié)點以交錯 (interleave) 方式加載,以便充分利用所有內(nèi)存帶寬;除 INT8 量化外,通過開啟 KV 量化,以及激活 Flash Attention 機制,以此進一步降低計算量和壓縮內(nèi)存占用。通過技術(shù)團隊的努力,DeepSeek 滿血版的整體性能相較優(yōu)化前提升了 67%。工程團隊后續(xù)也會持續(xù)投入,提高多節(jié)點上的計算并發(fā)度及帶寬利用率,并通過開發(fā)者社區(qū)不斷完善 Arm 架構(gòu)的軟件生態(tài)。

細究 DeepSeek 的模型架構(gòu)創(chuàng)新,它針對大模型運行時的痛點進行計算、內(nèi)存訪問和算法流水線上的效率提升,比如 MLA 和 FP8 訓練和推理減少了內(nèi)存占用和帶寬需求,DeepSeekMoE 降低了計算強度、提高計算效率,DualPipe 提高了多計算節(jié)點間的通信和計算效率。這些工程優(yōu)化思維與 Arm 一貫倡導的高能效設(shè)計目標不謀而合,也使得在純 CPU 平臺上運行如此大規(guī)模的模型成為可能。

Arm 平臺致力于助力合作伙伴提高性能,并降低總體擁有成本 (TCO),在 Neoverse N2 平臺運行 DeepSeek 大模型推理也淋漓盡致地體現(xiàn)了這一原則。在為中小微企業(yè)提供大模型服務時,并發(fā)需求降低,成本敏感度提高。在基于 Neoverse N2 平臺上運行的 DeepSeek-R1 為他們提供了一個更為均衡的選擇。相較傳統(tǒng)多卡 GPU/加速器平臺,這能極大地降低訂閱服務成本,使用戶能以較低代價快速啟動業(yè)務部署。下圖是兩種方案訂閱服務的價格對比:

826368a6-532f-11f0-b715-92fbcf53809c.png

搭載 Neoverse N2 平臺的服務器平臺能把部署成本降低約八倍。此外,對數(shù)據(jù)中心來說,在 CPU 上部署 LLM 也能充分利用在線的空閑算力,提高整體資源利用率。與此同時,基于 Neoverse N2 平臺的服務器功耗僅為傳統(tǒng)八卡 GPU 服務器的 1/12,能極大地降低數(shù)據(jù)中心的能耗壓力。

如此大規(guī)模的模型(6,710億參數(shù))能夠在數(shù)據(jù)中心服務器級 CPU 上運行,并迅速上線為客戶提供快速部署,得益于 Neoverse 平臺對 AI 推理負載的一貫思考和設(shè)計,包括 2 x 128 位的可伸縮向量擴展 (SVE2) 特性、BF16/INT8 數(shù)據(jù)格式支持,以及點積和矩陣乘法等指令的支持,加之多通道高帶寬內(nèi)存配置,和低延遲 CMN 互聯(lián)等等。

隨著 AI 領(lǐng)域的飛速發(fā)展,LLM 在持續(xù)的工程創(chuàng)新和優(yōu)化之下應用領(lǐng)域不斷變廣。Arm 將持續(xù)通過 Neoverse 平臺為行業(yè)賦能,并在這一新的技術(shù)紀元中引領(lǐng)變革。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • ARM
    ARM
    +關(guān)注

    關(guān)注

    134

    文章

    9346

    瀏覽量

    376509
  • 人工智能
    +關(guān)注

    關(guān)注

    1806

    文章

    48952

    瀏覽量

    248392
  • DeepSeek
    +關(guān)注

    關(guān)注

    1

    文章

    793

    瀏覽量

    1597

原文標題:在 Arm Neoverse N2 平臺上以更優(yōu)成本、更低功耗,充分釋放 DeepSeek-R1 滿血版性能

文章出處:【微信號:Arm社區(qū),微信公眾號:Arm社區(qū)】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    如何使用OpenVINO運行DeepSeek-R1蒸餾模型

    DeepSeek-R1在春節(jié)期間引發(fā)了全球科技界的熱度,DeepSeek-R1 是由 DeepSeek 開發(fā)的開源推理模型,用于解決需要邏輯推理、數(shù)學問題解決和實時決策的任務。
    的頭像 發(fā)表于 03-12 13:45 ?1398次閱讀
    如何使用OpenVINO運行<b class='flag-5'>DeepSeek-R1</b>蒸餾模型

    在英特爾哪吒開發(fā)套件上部署DeepSeek-R1實現(xiàn)方式

    隨著人工智能技術(shù)的快速發(fā)展,企業(yè)對 AI 模型的部署方式有了更多選擇。本地部署 DeepSeek-R1 模型具有以下顯著優(yōu)勢,使其成為許多企業(yè)和開發(fā)者的首選。
    的頭像 發(fā)表于 03-12 13:38 ?541次閱讀
    在英特爾哪吒開發(fā)套件上<b class='flag-5'>部署</b><b class='flag-5'>DeepSeek-R1</b>的<b class='flag-5'>實現(xiàn)</b>方式

    RK3588開發(fā)板上部署DeepSeek-R1大模型的完整指南

    DeepSeek作為國產(chǎn)AI大數(shù)據(jù)模型的代表,憑借其卓越的推理能力和高效的文本生成技術(shù),在全球人工智能領(lǐng)域引發(fā)廣泛關(guān)注。DeepSeek-R1作為該系列最新迭代版本,實現(xiàn)了長文本處理效能躍遷、多模態(tài)
    發(fā)表于 02-27 16:45

    行芯完成DeepSeek-R1大模型本地化部署

    近日,行芯正式宣布完成 DeepSeek-R1 大模型本地化部署,實現(xiàn)在多場景、多產(chǎn)品中應用。解鎖“芯”玩法,開啟“芯”未來!
    的頭像 發(fā)表于 02-24 15:17 ?863次閱讀

    思必馳接入DeepSeek-R1滿血版大模型

    2月21日,思必馳DFM-2東風中樞大模型已完成671B滿血版的 DeepSeek-R1部署,在穩(wěn)定性和可靠性方面凸顯優(yōu)勢,用戶不掉線,使用
    的頭像 發(fā)表于 02-21 16:55 ?595次閱讀

    Infinix AI接入DeepSeek-R1滿血

    傳音控股旗下Infinix品牌正式宣布接入DeepSeek-R1滿血版,2月26日起支持XOS 14.5及以上版本的Infinix機型可通過升級使用,3月份將發(fā)布的全新NOTE系列也將接入De
    的頭像 發(fā)表于 02-21 16:08 ?770次閱讀

    省內(nèi)領(lǐng)先!南京率先引入DeepSeek滿血

    。 ? ? ? 滿血DeepSeek-R1部署(671B) ? 01 2024年10月,市數(shù)據(jù)局前瞻性的開展了智算的大規(guī)模擴容布局(20P); 02 2025年2
    的頭像 發(fā)表于 02-19 13:55 ?770次閱讀
    省內(nèi)領(lǐng)先!南京率先引入<b class='flag-5'>DeepSeek</b><b class='flag-5'>滿血</b>版

    宇芯基于T527成功部署DeepSeek-R1

    近日,宇芯成功在全志T527 Linux系統(tǒng)上本地部署并運行了DeepSeek-R1 1.5B模型。
    的頭像 發(fā)表于 02-15 09:06 ?1044次閱讀
    宇芯基于T527成功<b class='flag-5'>部署</b><b class='flag-5'>DeepSeek-R1</b>

    免費!「DeepSeek-R1 671B滿血版」不卡、不限次!問小白火速支援

    直接用的 DeepSeek-R1 671B 滿血版! 問小白「DeepSeek-R1 671B 滿血版」主打一個不卡、零延遲、不限次、全免費、隨便用。 簡單了解了一下,這個問小白的背后
    的頭像 發(fā)表于 02-14 11:30 ?1300次閱讀
    免費!「<b class='flag-5'>DeepSeek-R1</b> 671B<b class='flag-5'>滿血</b>版」不卡、不限次!問小白火速支援

    探討DeepSeek-R1滿血版的推理部署與優(yōu)化策略

    TL;DR 春節(jié)假期開始, 好像很多人都在開始卷DeepSeek-R1的推理了. 渣B也被兄弟團隊帶著一起卷了一陣, 其實推理中還有很多約束, 比較認同的是章老師的一個觀點: “推理框架很有可能就此
    的頭像 發(fā)表于 02-14 10:19 ?1350次閱讀
    探討<b class='flag-5'>DeepSeek-R1</b><b class='flag-5'>滿血</b>版的推理<b class='flag-5'>部署</b>與優(yōu)化策略

    了解DeepSeek-V3 和 DeepSeek-R1兩個大模型的不同定位和應用選擇

    場景 針對邏輯推理、符號操作、數(shù)學解題的深度優(yōu)化 2. 關(guān)鍵能力對比 能力維度 DeepSeek-V3 DeepSeek-R1 數(shù)學推理 基礎(chǔ)數(shù)學問題處理 顯著強化(復雜方程、幾何證明、符號運算) 代碼
    發(fā)表于 02-14 02:08

    OPPO Find N5接入DeepSeek-R1,語音操控更便捷

    DeepSeek-R1后,OPPO Find N5將展現(xiàn)出多項領(lǐng)先的體驗優(yōu)勢。用戶無需下載和進行復雜的操作步驟,只需通過小布助手即可輕松語音喚醒DeepSeek,實現(xiàn)智能交互的便捷高效
    的頭像 發(fā)表于 02-12 10:12 ?547次閱讀

    OPPO Find N5將接入DeepSeek-R1,可直接語音使用

    全球最薄折疊旗艦OPPO Find N5 將正式接入 DeepSeek-R1,并可通過語音喚醒直接使用,首批購買用戶即可率先體驗。Find N5將于本月正式發(fā)布。 ? 接入DeepSeek-R
    發(fā)表于 02-08 17:39 ?383次閱讀

    DeepSeek-R1本地部署指南,開啟你的AI探索之旅

    的進一步使用。 論文鏈接:https://github.com/deepseek-ai/DeepSeek-R1/blob/main/DeepSeek_R1.pdf 1|0一、什么是
    的頭像 發(fā)表于 02-08 10:30 ?5441次閱讀
    <b class='flag-5'>DeepSeek-R1</b>本地<b class='flag-5'>部署</b>指南,開啟你的AI探索之旅

    deepin UOS AI接入DeepSeek-R1模型

    DeepSeek-R1 模型自發(fā)布以來吸引了眾多用戶關(guān)注,為了讓 deepin 用戶更好地體驗這一前沿技術(shù),UOS AI 現(xiàn)已適配接入 DeepSeek-R1 端側(cè)模型!無需忍受服務器崩潰,兩步即可在本地獨享 DeepSeek-R1
    的頭像 發(fā)表于 02-08 09:52 ?992次閱讀
    主站蜘蛛池模板: 国产精品漂亮美女在线观看 | 日本免费观看完整视频 | 午夜久久久久久久 | 亚洲天堂导航 | 一级大片免费看 | 欧美一区二区三区男人的天堂 | 婷婷激情综合 | 久久国产精品99久久久久久牛牛 | 天天爱夜夜爽 | 窝窝午夜看片免费视频 | 国产片一级aaa毛片视频 | 国产高清一区二区三区四区 | 国产色视频一区 | 手机在线看片国产日韩生活片 | 97色资源| 国产精品久久久久网站 | 毛片在线播 | 欧美人成网 | 天堂资源在线官网 | 69国产成人综合久久精品 | 91在线网址 | 网站在线观看视频 | 999久久精品国产 | 色啦啦影院 | 美女天天干 | 性殴美高清视频 | ass嫩美女胴体 | 女同毛片| 午夜肉伦伦影院 | 欧美两性网 | 操视频网站 | 国产香港日本三级在线观看 | 美女一级一级毛片 | 日韩写真在线 | 亚洲美女黄视频 | 亚洲四虎在线 | 国模娜娜扒开嫩木耳 | 天天视频在线观看免费 | 亚洲精品美女 | 美女扒开尿口给男人捅 | 中文字幕一区在线 |