在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

如何在英特爾平臺上高效部署DeepSeek模型

英特爾物聯(lián)網(wǎng) ? 來源:英特爾物聯(lián)網(wǎng) ? 2025-02-21 10:16 ? 次閱讀

隨著人工智能技術(shù)的迅猛發(fā)展,大規(guī)模語言模型(LLMs)在自然語言處理、內(nèi)容生成和智能對話等領(lǐng)域的應(yīng)用日益廣泛。國產(chǎn) AI 大模型 DeepSeek 憑借其強大的生成能力和廣泛的應(yīng)用場景,迅速成為業(yè)界焦點。

目前,我們已經(jīng)在英特爾 酷睿 處理器與英特爾銳炫 顯卡組成的硬件配置上,完成對大模型推理的驗證,為 AI 模型的部署和推理提供了強有力的支持。

本文將帶您深入了解如何在英特爾平臺上高效部署 DeepSeek 模型,充分發(fā)揮其潛力,助力 AI 應(yīng)用的快速落地。

1硬件配置

GPU: 英特爾銳炫 B580 12G

2BIOS 配置

安裝英特爾銳炫顯卡后,必須在 BIOS 中啟用 PCIe 可重設(shè) BAR(Base Address Register)。

3操作系統(tǒng)和驅(qū)動程序安裝

3.1Ubuntu* 24.10 操作系統(tǒng)安裝

以下是下載和安裝 Ubuntu 24.10 的步驟:

1)下載并安裝Ubuntu 24.10

wget https://releases.ubuntu.com/24.10/ubuntu-24.10-desktop-amd64.iso

2)關(guān)閉 Ubuntu 無人值守升級,以避免未經(jīng)驗證的內(nèi)核更新。

登錄 Ubuntu 后,設(shè)置屏幕永不鎖定并啟用自動登錄。

Setting->Power->Power Saving->Screen Blank->Never

設(shè)置 -> 電源 -> 節(jié)能 -> 屏幕空白 -> 從不

System->Users->Automatic Login

系統(tǒng) -> 用戶 -> 自動登錄

sudo systemctl disable --now unattended-upgrades

然后編輯/etc/apt/apt.conf.d/20auto-upgrades,將Unattended-Upgrade設(shè)置為 “0”。

3)檢查內(nèi)核版本是否為6.11.

$ uname -a
Linux benchmark-Z590-VISION-D 6.11.0-8-generic #8-Ubuntu SMP PREEMPT_DYNAMIC Mon Sep 16 1320 UTC 2024 x86_64 x86_64 x86_64 GNU/Linux

4)重新啟動設(shè)備,查看顯示是否正常工作。

3.2 英特爾客戶端 GPU

驅(qū)動程序安裝(ARC B 系列)

參考:

https://dgpu-docs.intel.com/driver/client/overview.html#installing-client-gpus-on-ubuntu-desktop-24-10

3.2.1在 Ubuntu Desktop 24.10 上

安裝客戶端 GPU

使用以下命令安裝 intel-graphics PPA 和必要的計算與媒體包:

sudo apt-get update
sudo apt-get install -y software-properties-common


# Add the intel-graphics PPA for 24.10
sudo add-apt-repository -y ppa:kobuk-team/intel-graphics


# Install the compute-related packages
sudo apt-get install -y libze-intel-gpu1 libze1 intel-ocloc intel-opencl-icd clinfo intel-gsc hwinfo


# Install the media-related packages
sudo apt-get install -y intel-media-va-driver-non-free libmfx1 libmfx-gen1 libvpl2 libvpl-tools libva-glx2 va-driver-all vainfo

上述命令安裝了大多數(shù)用戶所需的所有基本包,旨在盡量減少不必要的包安裝。

請注意,不同版本的 intel-opencl-icd 可能會有不同的性能表現(xiàn)。

3.2.2 配置渲染組成員資格

要訪問 GPU 功能,當(dāng)前用戶必須能夠訪問/dev/dri 中的 DRM 渲染節(jié)點。

如果當(dāng)前用戶不是 DRM 渲染節(jié)點(通常為 'render')組的成員,請將用戶添加到渲染節(jié)點組。

sudo gpasswd -a ${USER} render

這對更新后創(chuàng)建的 shell 就足夠了。要更改當(dāng)前 shell 的組 ID:

newgrp render

3.3 驗證英特爾銳炫 B580 PCIe 配置空間

確保英特爾銳炫 B580 PCIe 配置空間具有 12GB 的 BAR2。以下是檢查 GPU PCIe 配置空間的指南:

步驟 1:列出 VGA 設(shè)備的 PCIe 總線地址。

lspci | grep -i vga

您將在屏幕上看到這些消息:

a8ff2a88-ef73-11ef-9310-92fbcf53809c.png

步驟 2:檢查英特爾銳炫 B580 的 PCIe 功能。

sudo lspci -s 03:00 -vvv | grep BAR

您將看到英特爾銳炫 B580 的 PCIe 功能,并檢查 PCIe 配置空間。

4OpenVINO 和基準(zhǔn)測試工具安裝

OpenVINO 是一個開源工具包,用于優(yōu)化和部署從云到邊緣的深度學(xué)習(xí)模型。它加速了各種用例的深度學(xué)習(xí)推理,如生成式 AI、視頻、音頻和語言,支持來自流行框架(如 PyTorch、TensorFlow、ONNX 等)的模型。轉(zhuǎn)換和優(yōu)化模型,并部署在混合的英特爾 硬件和環(huán)境中,無論是在本地、設(shè)備上、瀏覽器中還是云端。

OpenVINO GenAI 是 OpenVINO 的一個變體,旨在簡化生成式 AI 模型的推理運行。它隱藏了生成過程的復(fù)雜性,并最大限度地減少了所需的代碼量。

使用以下命令快速安裝 OpenVINO 和工具。

git clone https://github.com/openvinotoolkit/openvino.genai.git


cd ./tools/llm_bench


python3 -m venv python-env


source python-env/bin/activate


pip install --upgrade pip


pip install -r requirements.txt

更多詳情請參考o(jì)penvino.genai/tools/llm_bench at master · openvinotoolkit/openvino.genai · GitHub

https://github.com/openvinotoolkit/openvino.genai/tree/master/tools/llm_bench

5運行 DeepSeek蒸餾模型的基準(zhǔn)測試

5.1 下載預(yù)訓(xùn)練的 LLM 模型

訪問:

https://huggingface.co或https://www.modelscope.cn

下載 deepseek 蒸餾模型,并將下載的模型保存在~/models 文件夾中。

5.2將模型轉(zhuǎn)換為 OpenVINO IR

運行以下命令將 DeepSeek-R1-Distill-Qwen-7B 轉(zhuǎn)換為 IR 格式并將權(quán)重壓縮為 INT4。您的系統(tǒng)必須至少具有 64GB 內(nèi)存才能進行轉(zhuǎn)換。

optimum-cli export openvino --framework pt 
-m ./DeepSeek-R1-Distill-Qwen-7B --weight-format int4 –sym 
--trust-remote-code --task 
text-generation-with-past ./DeepSeek-R1-Distill-Qwen-7B-IR

5.3 使用 OpenVINO 啟動 LLM 基準(zhǔn)測試

要在 B580 上啟動 LLM 模型 DeepSeek-R1-Distill-Qwen-7B 的基準(zhǔn)測試,請運行以下命令:

python3 benchmark.py -m DeepSeek-R1-Distill-Qwen-7B-IR -n 1 -d GPU
python benchmark.py -m DeepSeek-R1-Distill-Qwen-7B-IR -p "What is openvino?" -n 1 -d GPU

測試結(jié)果將顯示在屏幕上。請注意,結(jié)果可能因平臺和軟件版本而異。

通過本文的詳細(xì)步驟和配置指南,我們成功在英特爾平臺上驗證了 DeepSeek 蒸餾模型的推理性能。從硬件配置、BIOS 設(shè)置、操作系統(tǒng)安裝到驅(qū)動程序和 OpenVINO 工具的部署,每一步都確保了系統(tǒng)發(fā)揮更卓越的性能。

通過基準(zhǔn)測試,我們展示了 DeepSeek-R1-Distill-Qwen 系列模型在 INT4 精度下的高效推理能力,尤其是在首個 token 和后續(xù) token 的延遲表現(xiàn)上,展現(xiàn)了英特爾銳炫 顯卡在處理大模型推理任務(wù)時的強大潛力。英特爾銳炫 B580能夠為AI工作負(fù)載提供加速,其配備的英特爾Xe矩陣計算引擎(XMX),為新推出的XeSS 2提供強大支持。OpenVINO 工具套件可以縮短延遲,提高吞吐量,加速 AI 推理過程,同時保持精度,縮小模型占用空間,優(yōu)化硬件使用。

未來,隨著硬件和軟件的進一步優(yōu)化,我們期待在更多復(fù)雜場景中,特別是在生成式 AI 和大規(guī)模語言模型的應(yīng)用中,驗證和英特爾銳炫 顯卡的性能,通過英特爾豐富的軟硬件產(chǎn)品協(xié)同,為 DeepSeek 及各種 AI 大模型的應(yīng)用提供更強大的算力,讓邊緣側(cè)部署 AI 的使用場景有更多可能。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 英特爾
    +關(guān)注

    關(guān)注

    61

    文章

    10043

    瀏覽量

    172580
  • 顯卡
    +關(guān)注

    關(guān)注

    16

    文章

    2471

    瀏覽量

    68354
  • 人工智能
    +關(guān)注

    關(guān)注

    1798

    文章

    47956

    瀏覽量

    241130
  • DeepSeek
    +關(guān)注

    關(guān)注

    1

    文章

    447

    瀏覽量

    182

原文標(biāo)題:DeepSeek 模型在英特爾銳炫? 顯卡上的高效推理實踐

文章出處:【微信號:英特爾物聯(lián)網(wǎng),微信公眾號:英特爾物聯(lián)網(wǎng)】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關(guān)推薦

    MWC上海2018:英特爾助力合作伙伴加速5G部署

    在MWC上海2018上,英特爾攜手行業(yè)合作伙伴,展示了一系列基于英特爾5G端到端技術(shù)的精彩案例。從英特爾?FPGA、英特爾至強?處理器、英特爾
    的頭像 發(fā)表于 06-28 15:30 ?5709次閱讀

    英特爾CPU部署Qwen 1.8B模型的過程

    本文介紹了在英特爾 13 代酷睿 CPU i5 - 13490F 設(shè)備上部署 Qwen 1.8B 模型的過程,你需要至少 16GB 內(nèi)存的機器來完成這項任務(wù),我們將使用英特爾的大
    的頭像 發(fā)表于 01-12 10:28 ?2922次閱讀

    添越智創(chuàng)基于 RK3588 開發(fā)板部署測試 DeepSeek 模型全攻略

    DeepSeek 模型部署與測試,開啟這場充滿挑戰(zhàn)與驚喜的技術(shù)探索之旅。 RK3588 開發(fā)板:AI 性能擔(dān)當(dāng) RK3588 開發(fā)板基于先進的 8nm LP 制程工藝精心打造,其硬件配置堪稱豪華,在 AI
    發(fā)表于 02-14 17:42

    #高通 #英特爾 #Elite 高通X Elite芯片或終結(jié)蘋果、英特爾的芯片王朝

    高通英特爾蘋果
    深圳市浮思特科技有限公司
    發(fā)布于 :2023年10月27日 16:46:07

    英特爾多款平板電腦CPU將于明年推出

    的價格均在199美元至249美元之間。此外,對于那些售價在249美元以上的Android平板,英特爾還會提供Bay Trail和Cherry Trail平臺供選擇。  2014年9月份,英特爾將會
    發(fā)表于 12-19 16:48

    OpenCL平臺英特爾Stratix 10 FPGA的結(jié)合使用

    在這個高度依賴圖像的時代,英特爾? FPGA 可利用 OpenCL? 平臺滿足巨大的圖像處 理和分類需求簡介從 2015 年到 2020 年,互聯(lián)網(wǎng)視頻流量將增長四倍。[1] 鑒于可視數(shù)據(jù)的爆炸性
    發(fā)表于 07-17 06:34

    為什么選擇加入英特爾

    近日,加入英特爾已有3個月的明星芯片架構(gòu)師Jim Keller接受了外媒VentureBeat的采訪,在采訪中談及了自己加入英特爾的始末和讓其為之興奮的新角色——英特爾公司技術(shù)、系統(tǒng)架構(gòu)和客戶端事業(yè)部高級副總裁兼芯片工程事業(yè)部總
    發(fā)表于 07-25 07:31

    適用于英特爾性能設(shè)備平臺的RMC

    適用于英特爾性能設(shè)備平臺的RMC
    發(fā)表于 08-20 07:53

    介紹英特爾?分布式OpenVINO?工具包

    介紹英特爾?分布式OpenVINO?工具包可快速部署模擬人類視覺的應(yīng)用程序和解決方案。 該工具包基于卷積神經(jīng)網(wǎng)絡(luò)(CNN),可擴展英特爾?硬件的計算機視覺(CV)工作負(fù)載,從而最大限度地提高
    發(fā)表于 07-26 06:45

    英特爾Context Sensing SDK跨平臺上下文感知體驗

    英特爾?ContextSensing SDK使應(yīng)用程序開發(fā)人員能夠創(chuàng)建引人注目的跨平臺上下文感知體驗。
    的頭像 發(fā)表于 11-07 06:09 ?3574次閱讀

    由Gayathri Murali設(shè)計英特爾平臺上的Android

    Android在英特爾平臺上由Gayathri Murali設(shè)計 - 灣區(qū)Android巨星
    的頭像 發(fā)表于 05-31 09:29 ?2358次閱讀

    何在英特爾? 平臺上實現(xiàn)高效的大語言模型訓(xùn)練后量化

    本文介紹了可提升大語言模型的訓(xùn)練后量化表現(xiàn)的增強型 SmoothQuant 技術(shù),說明了這項技術(shù)的用法,并證明了其在準(zhǔn)確率方面的優(yōu)勢。此方法已整合至 英特爾 ?Neural Compressor
    的頭像 發(fā)表于 07-14 20:10 ?966次閱讀
    如<b class='flag-5'>何在</b><b class='flag-5'>英特爾</b>? <b class='flag-5'>平臺上</b>實現(xiàn)<b class='flag-5'>高效</b>的大語言<b class='flag-5'>模型</b>訓(xùn)練后量化

    英特爾酷睿Ultra處理器支持DeepSeek運行

    Janus-Pro更是將其多模態(tài)的本領(lǐng)發(fā)揮至極。DeepSeek模型因其高效、易部署等特性,非常適合在英特爾AI PC進行本地化應(yīng)用。
    的頭像 發(fā)表于 02-08 10:13 ?386次閱讀

    探索座艙“未至之境”:英特爾支持DeepSeek車內(nèi)本地運行

    超火的DeepSeek進入駕艙是什么樣子?英特爾告訴你答案。在英特爾的軟件定義汽車車載平臺上DeepSeek-R1,從1.5B直到14B,
    的頭像 發(fā)表于 02-14 16:19 ?130次閱讀
    探索座艙“未至之境”:<b class='flag-5'>英特爾</b>支持<b class='flag-5'>DeepSeek</b>車內(nèi)本地運行

    英特爾賦能DeepSeek本地運行,助力汽車升級“最強大腦”

    英特爾近期宣布支持DeepSeek在本地實現(xiàn)高效運行。據(jù)悉,借助英特爾的軟件定義汽車車載平臺DeepS
    的頭像 發(fā)表于 02-17 09:37 ?368次閱讀
    主站蜘蛛池模板: 美女露出扒开尿口让男人桶 | 在线视频观看一区 | 天天综合天天做天天综合 | 狼色视频在线观免费观看 | 天堂网最新版中文 | 欧美爽爽爽爽爽爽视频 | 久久天天躁狠狠躁狠狠躁 | 亚洲色图片区 | 国内一级野外a一级毛片 | 亚洲高清国产一线久久 | 欧美操操操操 | 午夜视频在线免费观看 | 婷婷热| 国产在线精品美女观看 | 求网址你懂的手机在线观看网站 | 色婷婷一区 | 91欧美精品激情在线观看 | 69国产 | 日本www免费 | caoporn97人人做人人爱最新 | 欧美性猛交ⅹxxx乱大交免费 | 一级一级特黄女人精品毛片 | 看片在线观看免费 | 香蕉视频在线免费播放 | 日本三级中文字幕 | 日本精品三级 | 婷婷射丁香 | 免费特黄一区二区三区视频一 | 久久国产视频网站 | 手机看片国产免费 | 久久欧洲视频 | 日本三级日本三级人妇三级四 | 亚洲精品视频在线 | 经典三级四虎在线观看 | 国产大片黄在线观看 | 天天射天天拍 | 久久网色 | 亚洲欧美强伦一区二区另类 | 天天草夜夜操 | 国产精品漂亮美女在线观看 | 激情婷婷|