在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

成本打到6萬以下 手把手教你用4路銳炫? 顯卡+至強? W跑DeepSeek

話說科技 ? 來源:話說科技 ? 作者:話說科技 ? 2025-03-05 11:23 ? 次閱讀

憑借卓越性能表現與先天開源優勢,DeepSeek正迅速成為全球擴展大模型應用實踐的一大“圓心”。作為英特爾GPU領域的重要布局,英特爾銳炫?顯卡既是游戲黨與視頻生產力工作者的新歡,也可用作計算卡,對DeepSeek提供加速支持,為企業用戶部署相關AI應用提供一條全新的高價性比實現路徑。具體來說,就是與英特爾? 至強? 可擴展處理器或英特爾? 至強? W處理器搭配,以多卡配置的型態來運行和加速DeepSeek推理任務。

本文將在DeepSeek-R1- Distill-Qwen-32B推理場景下,以面向企業級應用且成本最低可控制在5-6萬元人民幣的4 路英特爾銳炫? A770顯卡 + 至強? W處理器的解決方案為例,詳細闡述搭建硬件環境、配置驅動與軟件、優化參數設置等步驟,手把手教大家部署和配置這一方案。

1. 軟硬件安裝配置與初始化

1.1 硬件安裝配置

硬件配置

處理器:英特爾? 至強? W 處理器(可選20核/24核/28核/32核)

內存:8 x 32GB DDR5-3200

存儲:2TB M.2 固態盤

電源:≥2000瓦

GPU:4 x英特爾銳炫? A770顯卡

BIOS:設置Re-Size BAR Support為[Enabled]

wKgZPGfHw42AGHr-AAu-1HmO40M110.png

圖. 安裝4路英特爾銳炫? A770顯卡的AI工作站

在BIOS設置中,將Re-Size BAR Support設為[Enabled]

wKgZPGfHw46AMt6iAAEL3ji2k6k738.png

1.2 軟件安裝配置

軟件配置

操作系統:Ubuntu22.04.1 LTS

內核:6.5.0 - 35 - general

驅動程序:23.43.27642.67

vLLM Serving:intelanalytics/ipex-llm-serving-xpu:b11

安裝操作系統Ubuntu22.04.1 LTS(鏡像文件可訪問https://old-releases.ubuntu.com/releases/22.04.1/ubuntu-22.04.1-desktop-amd64.iso獲?。?。

進行硬件驗證,你要為每塊 GPU 顯卡都配備足額功耗來保證其工作正常。安裝完操作系統后,可通過以下命令檢查英特爾銳炫? A770顯卡是否正常加載:

~$ lspci | grep 56a0

18:00.0 VGA compatible controller: Intel Corporation Device 56a0 (rev 08)

36:00.0 VGA compatible controller: Intel Corporation Device 56a0 (rev 08)

54:00.0 VGA compatible controller: Intel Corporation Device 56a0 (rev 08)

cc:00.0 VGA compatible controller: Intel Corporation Device 56a0 (rev 08)

在確保 APT 網絡已連接,且你的賬號已具有 sudo 權限的情況下,需嚴格按以下步驟安裝驅動程序:

~$ wget -qO - https://repositories.intel.com/gpu/intel-graphics.key | sudo gpg --yes --dearmor --output /usr/share/keyrings/intel-graphics.gpg

~$ echo "deb [arch=amd64,i386 signed-by=/usr/share/keyrings/intel-graphics.gpg] https://repositories.intel.com/gpu/ubuntu jammy/lts/2350 unified" | sudo tee /etc/apt/sources.list.d/intel-gpu-jammy.list

~$ sudo apt update

如果內核版本不是6.5.0-35,則通過以下命令安裝6.5.0-35版本:

~$ sudo apt-get install -y linux-image-6.5.0-35-generic linux-headers-6.5.0-35-generic linux-modules-6.5.0-35-generic linux-modules-extra-6.5.0-35-generic

~$ sudo apt install intel-i915-dkms

~$ sudo vim /etc/default/grub

GRUB_DEFAULT="Advanced options for Ubuntu>Ubuntu, with Linux 6.5.0-35-generic"

~$ sudo update-grub

~$ sudo reboot

然后通過以下命令安裝計算、媒體和顯示運行時庫:

~$ sudo apt install -y intel-opencl-icd intel-level-zero-gpu level-zero intel-media-va-driver-non-free libmfx1 libmfxgen1 libvpl2 libegl-mesa0 libegl1-mesa libegl1-mesa-dev libgbm1 libgl1-mesa-dev libgl1-mesa-dri libglapi-mesa libgles2-mesa-dev libglx-mesa0 libigdgmm12 libxatracker2 mesa-va-drivers mesa-vdpau-drivers mesa-vulkan-drivers va-driver-all vainfo hwinfo clinfo

通過以下命令將當前用戶添加到 render 組:

~$ sudo gpasswd -a $(USER) render

~$ sudo newgrp render

驅動程序安裝完成后,建議使用以下命令進行驗證:

~$ clinfo | grep "Driver Version"

Driver Version 23.43.27642.67

1.3 在英特爾? 至強? W平臺上設置GPU的HDMI顯示

首先禁用 ast 卡:

~$ sudo vim /etc/modprobe.d/blacklist.conf

在文件底部添加“blacklist ast”:

~$ sudo update-initramfs -u

然后將窗口系統配置為wayland模式:

~$ sudo vim /etc/gdm3/custom.conf

將WaylandEnable設置為true:

wKgZO2fHw4-AOC_4AAAgJTuM9jg404.png

完成后更新初始RAM文件系統(initramfs)并重啟系統,然后將HDMI線插入第一塊英特爾銳炫? A770顯卡即可完成顯示終端設置。

]# sudo update-initramfs -u

~$ sudo reboot

1.4 監控工具xpu-smi安裝

可根據xpumanager repo安裝用于監控和管理 XPU設備狀態信息的xpu-smi 工具。下載xpumanager并執行以下命令:

~$ wgethttps://github.com/intel/xpumanager/releases/download/V1.2.27/xpu-smi_1.2.27_20240103.051106.5eeb3f13.u22.04_amd64.deb--no-check-certificate

~$ sudo apt install ./xpu-smi_1.2.27_20240103.051106.5eeb3f13.u22.04_amd64.deb

~$ xpu-smi discovery

結果顯示如下:

wKgZO2fHw5CAcfYQAADviP_iAj0890.png

大模型服務與聊天機器人演示

2.1容器(Docker)安裝及服務設置

用戶可通過 Docker,在英特爾銳炫? A770顯卡上使用 IPEX-LLM開展 vLLM 服務。Docker的安裝可參考:https://docs.docker.com/engine/install/ubuntu/

通過以下命令,設置CPU主頻至最大睿頻,并將顯卡鎖頻至2.4GHz:

~$ apt-get install linux-tools-6.5.0-35-generic linux-cloud-tools-6.5.0-35-generic

# Query max turbo frequency, like W3445, Max Turbo Frequency is 4.8GHz:

~$ sudo cpupower frequency-set -d 4.8GHz

~$ sudo xpu-smi config -d 0 -t 0 --frequencyrange 2400,2400

~$ sudo xpu-smi config -d 1 -t 0 --frequencyrange 2400,2400

~$ sudo xpu-smi config -d 2 -t 0 --frequencyrange 2400,2400

~$ sudo xpu-smi config -d 3 -t 0 --frequencyrange 2400,2400

2.2 安裝并啟動vLLM服務

下載并安裝以下vllm版本:

~$ docker pull intelanalytics/ipex-llm-serving-xpu:2.2.0-b11

從https://hf-mirror.com下載LLM模型到本地文件夾中(例如:/home/worker/LLM)。

從https://hf-mirror.com/collections/deepseek-ai/deepseek-r1-678e1e131c0169c0bc89728d下載蒸餾版模型。

wKgZPGfHw5GAA95DAAJ8my7FPPA204.png

將以下腳本放入/home/intel/Demo-4xArc中的 bachkend-ipex-docker.sh文件(以下操作都以DeepSeek-R1-Distill-Qwen-32B版為例):

wKgZO2fHw5GAVGAGAABx5A9-3lI967.png

將以下腳本放入vllm-deepseek-r1-distill-qwen-32b-openaikey.sh文件:

wKgZPGfHw5KAUn4eAAY3plxtWuk287.png

然后啟動容器和vLLM 服務:

~$ sudo bash backend-ipex-docker.sh

~$ docker exec -it ipex-llm-b11 bash

~$ cd workspace & bash vllm-deepseek-r1-distill-qwen-32b-openaikey.sh

如下日志表明DeepSeek推理服務已啟動成功:

wKgZPGfHw5OAaXMwAAArL-UyUOg414.png

2.3 使用Chatbox AI進行性能測試

開發者可以在本地使用Chatbox AI進行LLM推理性能測試。如DeepSeek推理服務IP為192.168.10.110,在Windows PowerShell中執行以下命令并輸入密碼,將遠程服務端口映射到本地:

wKgZO2fHw5SAKLFEAAA_3nNPbvY942.png

User> ssh -L 8001:localhost:8001 [email protected]

打開Chatbox AI的Url(https://web.chatboxai.app/)

wKgZPGfHw5WAQmqGAACvpgvp-c0606.png

選擇 “User My Own API Key / Local Model”,點擊 “Add Custom Provider”,并根據下圖所示進行配置,手動輸入DeepSeek整流的模型名稱等信息:

wKgZPGfHw5aAPzgTAADoFFZOiA0842.png

wKgZO2fHw5eAIf6oAACqUPTFf5g816.png

由此,使用者可以在Chatbox AI中向大語言模型提問,測試其推理性能:

wKgZPGfHw5eAPmZWAAOGjab0Hg4253.png

vllm服務日志能夠顯示當前的性能狀況,如圖中所示,基于多路英特爾銳炫? A770顯卡的推理服務一直有著30+ tokens/s的性能表現。

wKgZO2fHw5mAGn9fAAD7RUF11R8241.png

創新不止步:全新24GB銳炫? 顯卡與滿血版DeepSeek R1方案正在路上

本部署指南雖然是圍繞4路英特爾銳炫? A770顯卡的方案展開,且以DeepSeek-R1-Distill-Qwen-32B版為例,但我們的實踐探索并未局限于此。

一方面,該解決方案可對DeepSeek各個蒸餾版提供同樣靈活的支持。使用者可通過調整輸入模型名稱,以及設定并行使用的顯卡數量來進行調整(使用--tensor-parallel-size參數來控制)。

wKgZPGfHw5mAL76eAALHfNKD7Ws072.jpg

另一方面,多路英特爾銳炫?顯卡 + 英特爾? 至強? 可擴展處理器 /至強? W處理器方案的關鍵目標,還是鎖定在DeepSeek- R1-671B這一性能巔峰版本上,其配置與優化方法很快就會與大家見面。預計其技術路徑會同時覆蓋基于KTransformer,能更充分發揮至強? 處理器內置AI加速技術AMX潛能的方案,以及GPU配置密度更高的單機16路英特爾銳炫? 顯卡的方案。

另一個值得期待的進展,就是專為生產力應用打造的新一代英特爾銳炫? 顯卡 B580 24G顯存版本也正向我們走來,其4張卡即可提供96GB的顯存容量,意味著用戶可在單機中更輕松地部署更大參數量的DeepSeek服務(例如DeepSeek- R1-671B版本),進而能在實戰中以較低的成本和較為便捷的部署方式,開啟不縮水的DeepSeek服務。

審核編輯 黃宇

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 顯卡
    +關注

    關注

    16

    文章

    2495

    瀏覽量

    68955
  • DeepSeek
    +關注

    關注

    1

    文章

    744

    瀏覽量

    907
收藏 人收藏

    評論

    相關推薦

    請求贈閱《零基礎開發AI Agent——手把手教你用扣子做智能體》

    博主好!致敬葉濤 管鍇 張心雨三位AI具身智能-智能體方面的專家、導師! 《零基礎開發AI Agent——手把手教你用扣子做智能體》一不懂編程的多數大眾也可以開發Agent,這意義深遠,功德無量
    發表于 04-10 12:16

    GPU顯卡維修避坑指南:手把手教你識別行業套路!

    的今天,高端顯卡維修已成“暴利暗流”。虛高報價、偷換配件、技術陷阱……用戶稍有不慎,輕則損失數,重則設備報廢。今天小助手將揭露行業亂象,手把手教你識別套路,并推薦
    的頭像 發表于 04-02 20:31 ?265次閱讀
    GPU<b class='flag-5'>顯卡</b>維修避坑指南:<b class='flag-5'>手把手</b><b class='flag-5'>教你</b>識別行業套路!

    部署成本顯著降低!英特爾助陣高效AI算力一體機方案

    3月27日,英特爾舉辦了名為“‘至’繪未來,來襲”的創新解決方案研討會,與生態伙伴共同分享最新AI算力一體機方案。該方案基于英特爾?至強? W處理器和多個英特爾
    的頭像 發表于 03-29 16:29 ?891次閱讀
    部署<b class='flag-5'>成本</b>顯著降低!英特爾助陣高效AI算力一體機方案

    《零基礎開發AI Agent——手把手教你用扣子做智能體》

    《零基礎開發AI Agent——手把手教你用扣子做智能體》是一本為普通人量身打造的AI開發指南。它不僅深入淺出地講解了Agent的概念和發展,還通過詳細的工具介紹和實戰案例,幫助讀者快速掌握
    發表于 03-18 12:03

    手把手教你做星閃無人機—KaihongOS星閃無人機開發實戰》系列課程課件匯總

    為助力開發者迅速掌握『KaihongOS輕量系統開發技術』與『星閃無線通信技術』,實現快速上手與深度體驗,“開鴻Developer社區”攜手“電子發燒友”再次聯合推出《手把手教你做星閃無人機
    發表于 03-18 10:33

    手把手教你做PC-KaihongOS筆記本電腦開發實戰》課件匯總

    ”攜手“電子發燒友”聯合推出了 《KaihongOS手把手系列直播課程》,該系列課程以實際產品為案例,詳細講解每個產品的開發全流程。 此次首發內容是《手把手教你做PC-KaihongOS筆記本電腦開發
    發表于 03-18 10:25

    【第四章 定時任務】手把手教你玩轉新版正點原子云

    【第四章 定時任務】手把手教你玩轉新版正點原子云 承接上篇,除了報警聯動這個功能,原子云還有一個特色功能也是各開發者喜歡的,定時任務功能。 【正點原子】云平臺:原子云(點擊登錄原子云) 前言
    發表于 03-13 10:19

    【第二章 模型與設備連接】手把手教你玩轉新版正點原子云

    【第二章 模型與設備連接】手把手教你玩轉新版正點原子云玩過物聯網的朋友們都知道,我們在接觸各大主流云平臺時會知道物模型的概念。 本實驗就是針對原子云中模型與設備連接,舉個簡單例子說明,溫度傳感器通過
    發表于 03-12 09:27

    【書籍評測活動NO.59】零基礎開發AI Agent——手把手教你用扣子做智能體

    把握科技大勢。 ▊《零基礎開發AI Agent——手把手教你用扣子做智能體》 葉濤管鍇張心雨 著 不懂編程也可以開發Agent Agent(智能體)是大模型落地的重要方向,是AI技術的下一個風口
    發表于 03-10 16:29

    開發者集結!《手把手教你做星閃無人機》第二課開講啦!

    開發者集結!《手把手教你做星閃無人機》第二課開講啦!
    的頭像 發表于 02-17 19:40 ?213次閱讀
    開發者集結!《<b class='flag-5'>手把手</b><b class='flag-5'>教你</b>做星閃無人機》第二課開講啦!

    手把手教你做星閃無人機》即將開播,鎖定15日晚七點!

    ”再次聯合推出《手把手教你做星閃無人機—KaihongOS星閃無人機開發實戰》系列課程,該課程與《手把手教你做PC—KaihongOS筆記本電腦開發實戰》同步并行,
    的頭像 發表于 01-13 19:42 ?297次閱讀
    《<b class='flag-5'>手把手</b><b class='flag-5'>教你</b>做星閃無人機》即將開播,鎖定15日晚七點!

    手把手教你做PC》課程即將啟動!深開鴻引領探索KaihongOS筆記本電腦開發實戰

    ”攜手“電子發燒友”聯合推出了《KaihongOS手把手系列直播課程》,該系列課程以實際產品為案例,詳細講解每個產品的開發全流程。此次首發內容是《手把手教你做PC-
    的頭像 發表于 01-06 20:46 ?347次閱讀
    《<b class='flag-5'>手把手</b><b class='flag-5'>教你</b>做PC》課程即將啟動!深開鴻引領探索KaihongOS筆記本電腦開發實戰

    Air780E模組LuatOS開發實戰 —— 手把手教你搞定數據打包解包

    本文要說的是低功耗4G模組Air780E的LuatOS開發實戰,我將手把手教你搞定數據打包解包。
    的頭像 發表于 12-03 11:17 ?471次閱讀
    Air780E模組LuatOS開發實戰 —— <b class='flag-5'>手把手</b><b class='flag-5'>教你</b>搞定數據打包解包

    手把手教你通過宏集物聯網工控屏&amp;網關進行協議轉換,將底層PLC/傳感器的數據轉換為TCP協議并傳輸到用戶

    手把手教你通過宏集物聯網工控屏&網關進行協議轉換,將底層PLC/傳感器的數據轉換為TCP協議并傳輸到用戶終端
    的頭像 發表于 08-15 13:29 ?839次閱讀
    <b class='flag-5'>手把手</b><b class='flag-5'>教你</b>通過宏集物聯網工控屏&amp;網關進行協議轉換,將底層PLC/傳感器的數據轉換為TCP協議并傳輸到用戶

    手把手教你排序算法怎么寫

    今天以直接插入排序算法,給大家分享一下排序算法的實現思路,主要包含以下部分內容:插入排序介紹插入排序算法實現手把手教你排序算法怎么寫在添加新的記錄時,使用順序查找的方式找到其要插入的位置,然后將
    的頭像 發表于 06-04 08:03 ?931次閱讀
    <b class='flag-5'>手把手</b><b class='flag-5'>教你</b>排序算法怎么寫
    主站蜘蛛池模板: 亚洲综合激情九月婷婷 | 久久99热精品免费观看无卡顿 | 亚洲特级毛片 | 99成人在线 | 免费看黄色毛片 | 西西人体大胆高清啪啪欧洲 | 好紧好爽太大了h快穿 | 中文在线最新版天堂 | 色偷偷91综合久久噜噜噜男男 | 麻豆三级视频 | 琪琪see色原网一区二区 | 亚洲综合欧美日本另类激情 | 色成人综合 | 午夜国产在线观看 | 久久综合精品视频 | www.色av.com| 人人添人人澡人人澡人人人爽 | 日韩综合nv一区二区在线观看 | 免费又爽又黄1000禁片 | a级男女性高爱潮高清试 | 最近2018免费中文字幕视频 | 四虎影院永久在线 | 91破处视频 | 在线看片成人免费视频 | 天堂在线中文无弹窗全文阅读 | 成人三级电影在线观看 | 五月婷婷网站 | 好男人社区www在线资源视频 | 婷婷四房综合激情五月性色 | 国产伦精品一区二区三区免费 | 亚洲高清一区二区三区四区 | 天天色啪| 在线激情网址 | 无遮挡一级毛片视频 | 国产成人夜间影院在线观看 | 性色xxx| 欧美黄三级在线观看 | 美女无遮挡拍拍拍免费视频 | 91高清在线成人免费观看 | 丁香综合激情 | 久久澡人人澡狠狠澡 |