電子發燒友網報道(文 / 吳子鵬)北京時間 2 月 24 日凌晨 3 點,全球最大開源平臺之一 huggingface 聯合創始人兼首席執行官 Clement Delangue 發布的最新數據顯示,中國開源大模型 DeepSeek-R1 在 huggingface 平臺上超過 150 萬個模型中脫穎而出,成為該平臺最受歡迎的開源大模型,點贊數突破 1 萬。
目前,DeepSeek 已在全球范圍內成為爆火的 AI 大模型。1 月 26 日,DeepSeek 首次登上蘋果 App Store 全球榜首并持續領先。上線 18 天,其下載量達到 1600 萬次,幾乎是同期 ChatGPT 下載量的兩倍,其中印度是新用戶增長的最大來源地。據統計,DeepSeek 目前在全球 140 多個國家的 App 榜單中位居第一。
在流量方面,2025 年 1 月,DeepSeek 網站的桌面和移動訪問量飆升至 2.78 億次,而2024年12月僅為 1200 萬次。中國貢獻了近四分之一的桌面流量,美國、巴西、印度、德國等國家也占據一定比例。
此前,Clement 特意發文祝賀 DeepSeek-R1 下載量突破 1000 萬次,這一成績也創造了 huggingface 平臺有史以來最受歡迎模型的記錄。
那么,DeepSeek 究竟給開源大模型的發展帶來了什么,使其如此火爆?
DeepSeek 給開源大模型發展帶來的影響
DeepSeek 通過技術創新和商業策略的突破,重塑了開源大模型行業的競爭格局,為開源 AI 大模型的發展帶來了積極影響。
帶動技術創新
DeepSeek 在模型訓練中采用強化學習和模型蒸餾技術,在減少模型參數規模的同時提升性能。例如,R1 模型在數學推理任務中的準確率高達 97.3%。在架構設計方面,以 DeepSeek-V3 為例,其首創多頭潛注意力機制,有效解決了長文本推理時的顯存效率瓶頸問題,還革新了動態路由算法,提高了專家利用率。
降低成本
DeepSeek 降低了開源大模型的訓練成本、推理成本和模型使用成本。其采用的混合專家模型(MoE)架構利用動態冗余策略,將計算成本降低至傳統模型的 1/10。結合自研的稀疏結構(MLA 架構),提升了推理效率,實現了性能與成本的平衡。通過純深度學習方法,DeepSeek 使 AI 涌現出自發推理能力,在數學、代碼、自然語言推理等任務上達到國際頂尖水平(如比肩 GPT-4/o1)。借助這些創新,DeepSeek 將大模型訓練成本壓縮至 560 萬美元量級,僅為美國同類模型的 1/100,打破了動輒數億美元投入的行業慣例。同時,DeepSeek 通過開源以及提供低成本的 API,開發者可以自由定制和二次開發。其 API 定價親民,僅為 OpenAI 同類產品的 1/10,讓中小企業能夠以較低成本進入 AI 領域,推動了大模型在更多領域的應用和創新。
拓展應用邊界
DeepSeek 拓展了開源大模型新的應用邊界,使 AI 大模型得以廣泛落地。DeepSeek 采用免費商用開源策略,完全開放模型源碼并支持衍生開發,推動開發者生態快速擴張。這種 “零門檻 + 零成本” 模式直接導致行業價格體系崩塌,API 使用成本降至 OpenAI 的 5%,最終引領市場進入 “按厘計價” 甚至零成本時代。這一舉措激發了全球開發者的熱情,推動了技術共享與社區協作。眾多開發者基于 DeepSeek 的模型進行創新,加速了垂直領域小模型的發展。同時,DeepSeek 憑借模型壓縮等技術,成功適配智能眼鏡、工業終端等邊緣設備。在金融交易、工業質檢、醫療影像分析等眾多垂直領域展現出獨特的應用優勢,為各行業的數字化轉型提供了強大動力,極大地拓展了開源大模型的應用場景。
推動模型融合
DeepSeek 推動了開源大模型和閉源大模型的融合。其開源模型 R1 發布后,迫使阿里、騰訊等巨頭跟進降價,同時刺激全球開發者社區加速創新。在這個過程中,相當一部分閉源大模型選擇與 DeepSeek 進行融合。例如,2025 年 2 月,文心一言(現更名為 “文小言”)App 的 4.9.0 版本更新,接入了 DeepSeek-R1 開源大模型,借助該模型優化了拍照解題功能,通過 “思維鏈” 技術將解題過程可視化;2 月 6 日,吉利汽車宣布將自研的星睿車控 FunctionCall 大模型、汽車主動交互端側大模型等與 DeepSeek R1 大模型深度融合,以重新定義智能汽車的人機交互及智能駕駛;醫渡科技的 “AI 醫療大腦” YiduCore、智云健康的 “智云大腦” 等醫療領域的閉源模型也接入了 DeepSeek-R1 模型,用于升級智能預問診、病歷生成與質控等核心醫療 AI 應用。DeepSeek 的成功促使其他大模型開發者如 OpenAI、百度等開始重新審視開源策略,對整個行業的發展起到了積極的推動作用。
毫無疑問,DeepSeek 改變了 AI 大模型的市場格局。憑借低成本、高性能、全國產的特點,引發人工智能產業生態巨變,在一定程度上沖擊了 OpenAI 等巨頭主導的市場格局,加快形成大模型市場的新增長極,推動了整個行業的創新發展。
-
DeepSeek
+關注
關注
1文章
778瀏覽量
1367
發布評論請先 登錄
【書籍評測活動NO.62】一本書讀懂 DeepSeek 全家桶核心技術:DeepSeek 核心技術揭秘
如何使用OpenVINO運行DeepSeek-R1蒸餾模型

HarmonyOS NEXT開發實戰:DevEco Studio中DeepSeek的使用
聆思CSK6大模型語音開發板接入DeepSeek資料匯總(包含深度求索/火山引擎/硅基流動華為昇騰滿血版)
RK3588開發板上部署DeepSeek-R1大模型的完整指南
鴻蒙原生應用開發也可以使用DeepSeek了
開源大模型DeepSeek的開放內容詳析

評論