在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

華為OceanStor A800支持DeepSeek

華為數字中國 ? 來源:華為數字中國 ? 2025-02-18 10:09 ? 次閱讀

人工智能技術迅猛發展的當下,大模型的低成本與高性能成為各大科技企業競相追逐的焦點。

近期火爆的DeepSeek-R1模型憑借低成本、高性能優勢引發市場波動,DeepSeek-R1實力驚人,擁有6710億參數,推理能力表現卓越,采用了慢思考+思維鏈,能對復雜問題深入分析和推理,得出準確且有邏輯的結論,這使其在處理數學計算、代碼編寫、自然語言處理等各種任務時都游刃有余。

但是復雜推理的多輪對話和長序列需要緩存更多的KV Cache,導致GPU高帶寬內存容量成為瓶頸,而通過增加DRAM解決問題又會讓推理成本激增。為了應對上下文KV Cache緩存的問題,DeepSeek采用創新性的硬盤緩存技術,將GPU、DRAM中的緩存數據Offload到存儲陣列中,成功將大模型使用成本降低一個數量級。

在大模型推理過程中通過高性能分布式文件存儲以存代算,可以提升用戶體驗與推理效率,同時有效降低推理成本。這一技術趨勢在DeepSeek API服務中大范圍應用,其上下文硬盤緩存技術不僅能降低服務延遲,還可大幅削減最終的使用成本。

a222f38e-ed2a-11ef-9310-92fbcf53809c.png

DeepSeek API 模型&價格

(數據來源:https://api-docs.deepseek.com/zh-cn/quick_start/pricing)

從技術角度來看,在大模型API使用場景中,用戶輸入存在相當比例的重復內容,比如用戶的提問中常有重復引用部分,多輪對話中每一輪都需重復輸入前幾輪內容。同時,在很多面向企業(ToB)的專業領域里,業務信息又多又復雜,常常是一長串地輸入。推理時需要從這些長上下文的內容里找出有用的信息和關鍵主題,這就需要計算和存儲相互配合。為此,采用以存代算技術,將預計未來會重復使用的內容緩存在存儲中,當輸入有重復時,重復部分只需從緩存讀取,無需重新計算。這一技術不僅顯著降低服務延遲,還大幅削減最終使用成本。

以多輪對話場景為例,下一輪對話會命中上一輪對話生成的上下文緩存:

a23fa70e-ed2a-11ef-9310-92fbcf53809c.jpg

華為數據存儲OceanStor A800針對大模型推理具備Unified Cache多級緩存技術,與DeepSeek硬盤緩存技術采用相同的技術路線,簡單來說,就是提前把和你相關的歷史信息,比如你們之前聊過的內容、你的喜好這些“記憶”,存到的存儲設備里。等你要用的時候,它能快速找到這些相關信息(相關KV Cache片段),不用每次都從頭開始推理計算。這樣一來,不僅能快速準確地處理長對話內容(長序列),成本也能降下來,而且還能根據你的獨特需求提供更貼心的個性化服務,讓模型就像專門為你定制的一樣。

a2563910-ed2a-11ef-9310-92fbcf53809c.png

華為OceanStor A800是基于數控分離全交換架構的原生AI存儲,Unified Cache多級緩存技術可應用于:

具有長預設提示詞的問答助手類應用,如智能客服、智能運維;

具有角色設定與多輪對話的角色扮演類應用,如電商&教培、英語口語陪練;

超長文本行業總結分析以及復雜推理等場景,如金融投研分析、法律卷宗分析;

針對固定文本集合進行頻繁詢問的數據分析類應用;

代碼倉庫級別的代碼分析與排障工具。

為推理系統提供TB級性能、PB級容量、大規模共享的全局內存擴展池,實現高效的上下文KV Cache保存、管理與加載策略,有效提升KV Cache加載效率,可支持的序列長度從百K擴展到無限長,實現推理首Token時延4+倍降低,E2E推理成本2+倍降低,為大模型提供終身記憶和無限上下文能力。

a26a275e-ed2a-11ef-9310-92fbcf53809c.png

大模型推理使用華為OceanStor A800高性能分布式文件存儲,能夠實現PB級容量的DRAM性能,進一步降低大模型推理服務的延遲,大幅削減最終使用成本,重新定義了AI服務的性價比,為大模型在各行業的廣泛普及與應用注入強大動力,加速大模型普惠時代的到來。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 華為
    +關注

    關注

    216

    文章

    35032

    瀏覽量

    255078
  • 硬盤
    +關注

    關注

    3

    文章

    1335

    瀏覽量

    58157
  • DeepSeek
    +關注

    關注

    1

    文章

    775

    瀏覽量

    1346

原文標題:華為OceanStor A800支持DeepSeek硬盤緩存技術,重新定義AI性價比

文章出處:【微信號:HWS_yunfuwu,微信公眾號:華為數字中國】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦
    熱點推薦

    請問ADS1255/6支持菊花鏈嗎?

    ADS1255/6支持菊花鏈嗎?連接方法是否同ADS1271?菊花鏈連接以后各ADC是否同步采集,順序輸出數據?
    發表于 02-12 06:05

    P82B96支持HDCP嗎?

    你好:我用P89B96用做HDMI的DDC通道的I2C的轉換,我現在是解決了II2問題,但是它里面有個HDCP保護協議通過DDC通道,感覺它有延時一樣,不穩定。請問是否用P82B96支持HDCP?
    發表于 12-27 07:01

    ADS1256支持菊花鏈連接嗎?

    求助:1、ADS1256支持菊花鏈連接嗎? 2、如果不支持菊花鏈連接,能否把多片ADS1256掛在同一個SPI(CLK,MISO,MOSI)總線上,通過不同的CS來選擇芯片? 3、多片ADS1256能否支持廣播,來啟動所有芯片
    發表于 12-24 06:03

    請問PCM9211支持HDMI音頻輸入嗎?

    請問PCM9211支持HDMI 2.1 eARC 標準的幀的專用輸入,是否同時支持HDMI音頻輸入。
    發表于 10-17 07:53

    請問TAS5727支持幾段EQ?

    TAS5727支持幾段EQ? 比如PCM5121支持7段以上,TAS5727可以么?
    發表于 10-14 07:02

    TPS272C45支持遠程I/Os的智能電源管理

    電子發燒友網站提供《TPS272C45支持遠程I/Os的智能電源管理.pdf》資料免費下載
    發表于 09-25 11:13 ?4次下載
    TPS272C45<b class='flag-5'>支持</b>遠程I/Os的智能電源管理

    請問OPA2541支持單電源嗎?如果支持此時功放范圍是多少?

    請問OPA2541支持單電源嗎?如果支持此時功放范圍是多少?
    發表于 09-02 07:42

    TUBS8041支持從設備嗎?

    TUBS8041支持從設備么?
    發表于 08-19 06:22

    TPA6120A2支持單電源應用的話焊盤接地還是接1/2電源電壓?

    如題,如果TPA6120A2支持單電源應用的話焊盤接地還是接1/2電源電壓?
    發表于 08-15 08:23

    請問TL072支持單端供電嗎?

    TL072支持單端供電嗎?看到規格書上的建議運行條件,VCC-的電壓最大值為-5V,沒有0;現在有電路上VCC+接的是12V,VCC-接的是地,單端供電,這樣貌似芯片也能正常運行,可靠嗎?
    發表于 08-02 06:57

    ESP32支持OpenHarmony嗎?

    ESP32支持OpenHarmony嗎,可以用AT命令卡控制鴻蒙智聯的連接嗎,使用ESP32模組的情況下帶寬是否能支持視頻流的上傳
    發表于 07-19 06:07

    請問visionFive2支持哪些操作系統?

    visionFive2支持哪些操作系統?
    發表于 07-03 07:30

    esp32-S3支持arduino編程嗎?

    arduino選開發板的時候沒有es32-s3, 只有s2可選。 請問: 1. esp32-S3支持arduino編程嗎 2. arduino下sample下的BLE庫能用嗎? 3. esp32-s3能作為usb host嗎?相應的arduino庫是不是USBSerial?
    發表于 06-27 08:23

    esp32支持經典藍牙嗎?

    kconfig里面經典藍牙依賴IDF_TARGET_ESP32,只有esp32支持經典藍牙嗎? \"depends_on\": \"
    發表于 06-13 06:54

    求助,請問ESP32支持MIMO嗎?

    請問ESP32支持MIMO嗎?
    發表于 06-13 06:00
    主站蜘蛛池模板: 在线观看黄日本高清视频 | 欧美高清一区二区三 | 亚洲免费一 | 又粗又长又色又爽视频 | 色宅男看片午夜大片免费看 | 色黄污在线看黄污免费看黄污 | 美女黄色一级片 | 国产成人精品日本亚洲网站 | 日本女人啪啪 | 狠狠干天天色 | bt天堂在线www中文在线 | 一级a爰片久久毛片 | 九九九国产在线 | 日本不卡一区二区三区在线观看 | 2018天堂视频免费观看 | 亚洲加勒比在线 | 四虎在线成人免费网站 | 国产免费一级高清淫日本片 | 一级毛片ab片高清毛片 | 亚洲日本在线观看视频 | 奇米影视亚洲四色8888 | 免费一级特黄特色大片在线 | 国产黄色的视频 | 国产精品福利午夜h视频 | 亚洲婷婷综合色高清在线 | 激情五月综合综合久久69 | 黄视频福利 | 456成人免费高清视频 | 福利视频午夜 | 亚洲国产成人久久一区www | 久久黄色影片 | 精品久久久久久婷婷 | 色爱区综合激情五月综合激情 | 黄色福利小视频 | 666夜色666夜色国产免费看 | 亚洲欧洲一二三区 | 青青热久久国产久精品秒播 | 欧美日韩高清一区 | 爱操视频在线观看 | 国产网站免费视频 | 天天干天天夜 |