繼 DeepSeek 全套蒸餾模型以及 V3 版本上線后,經過 Gitee AI 和沐曦團隊兩天緊鑼密鼓的適配和機器籌備,DeepSeek-R1全尺寸版本現在已上線 Gitee AI 供開發者們使用。
截至目前,DeepSeek-R1、DeepSeek-V3 以及 DeepSeek-R1-Distill(1.5B/7B/14B/32B) 千問蒸餾模型均實現了在國產沐曦訓推一體 GPU 上成功運行,且均已上線 Gitee AI 開放使用體驗,國內 AI 全鏈路自主技術閉環踏出了巨大且關鍵的一步。在此特別感謝沐曦團隊的技術支持以及來自上海加佳的算力支撐。
三大「殺手锏」成就國產模型新高度
DeepSeek-R1的性能相信大家已經充分領教了,其「殺手锏」之一就是開放了思維鏈輸出過程,用戶可以看到模型進行推理時的每一步邏輯,告別了傳統大模型的「黑盒」問題。
DeepSeek-R1另一個「殺手锏」則是在后訓練階段大規模使用了強化學習技術,在僅有極少標注數據的情況下,極大提升了模型推理能力。在數學、代碼、自然語言推理等任務上,性能比肩OpenAI-o1 正式版。
DeepSeek-R1的第三個「殺手锏」無疑是開放的許可證和用戶協議,模型開源 License 統一使用 MIT,完全開源,不限制商用,無需申請。
同時,產品協議明確可「模型蒸餾」,明確允許用戶利用模型輸出、通過模型蒸餾等方式訓練其他模型。
這三大「殺手锏」使得DeepSeek-R1不但擁有極高的透明度和易用性,也為開發者提供了更靈活的訓練和應用方式,極大地加速了模型的落地與普及,迅速讓國產模型在世界 AI 競爭格局中登上了新的制高點。
沐曦 GPU+曦源一號萬卡集群=國產算力新標桿
當然,想要實現技術自主與獨立,僅有模型的領先還不夠,關鍵在于 AI 模型對國產 GPU 的深度適配與高效運行。
唯有 DeepSeek-R1 能夠在國產 GPU 上穩定運行,中國 AI 技術體系才能真正實現自主可控的完整閉環。
本次DeepSeek-R1部署采用了沐曦訓推一體 GPU,使用完全自主研發的 GPU IP,擁有完整的知識產權,并具備強大的多精度混合計算能力及高帶寬顯存支持。同時,沐曦產品搭載先進的時空互聯技術和全球兼容的 MXMACA 軟件棧,可廣泛應用于智能、通用計算和數據處理等場景。
此外,由上海加佳智云數字科技有限公司運營的曦源一號國產替代萬卡集群正以其卓越的性能為本次部署以及各類 AI 平臺、AI 模型及 AI 應用提供強大的算力支持。
曦源一號國產替代算力集群是基于沐曦高性能 GPU 加速卡所構建的一個開放、標準、高效的計算架構,有效促進了計算資源、數據資源與智能服務的全面整合。這種創新不僅提升了整體性能,也在 AI 實時推理、大規模模型訓練等眾多領域展現出巨大的潛力,從而滿足了目前急需高效、穩定計算能力的國內市場。
Gitee AI——模型 API 新選擇
2024 年初上線以來,Gitee AI 平臺以 Serverless API、模型引擎、AI 應用為核心功能與服務,致力于讓開發者輕松構建和部署 AI 應用,為企業客戶提供更加智能、高效的 AI 應用解決方案。
Gitee AI 的 Serverless API 提供了文本生成、視覺模型、圖像處理、語音識別、語音生成、向量與重排模型、代碼生成等 9 種類型共 54 個大模型的 API 使用。通過購買模型資源包,即可通過極低的價格即可盡享眾多主流模型。
點擊文末閱讀原文訪問 Gitee AI,體驗基于基于沐曦曦云 GPU 及曦源一號國產替代算力集群的DeepSeek-R1,使用 100% 國產 AI 開發應用吧!
-
gpu
+關注
關注
28文章
4779瀏覽量
129369 -
AI
+關注
關注
87文章
31572瀏覽量
270372 -
模型
+關注
關注
1文章
3317瀏覽量
49234 -
DeepSeek
+關注
關注
0文章
67瀏覽量
16
原文標題:繼V3之后,沐曦GPU再完成DeepSeek-R1全尺寸適配,已上線Gitee AI
文章出處:【微信號:OSC開源社區,微信公眾號:OSC開源社區】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
相關推薦
評論