英偉達近日宣布,其DeepSeek R1 671b版本已正式上線英偉達NIM(NVIDIA Inference Microservices)平臺,并以預覽版的形式在build.nvidia.com網站上發布。
據悉,DeepSeek R1 NIM微服務是英偉達在人工智能領域的一項重要創新,旨在為用戶提供高效、精準的推理服務。在單個英偉達HGX H200系統上,該微服務每秒最多可處理3872個token,展現出強大的處理能力和高效性。
此次上線的DeepSeek R1 NIM微服務預覽版,允許開發人員對其進行測試和實驗,以更好地了解其性能和功能。英偉達表示,未來該API將作為英偉達AI Enterprise軟件平臺的一部分,以可下載的NIM微服務形式正式推出,為用戶提供更加便捷、高效的使用體驗。
英偉達一直致力于推動人工智能技術的發展和應用,此次發布的DeepSeek R1 NIM微服務預覽版,不僅展示了英偉達在人工智能領域的強大技術實力,也為用戶提供了更加高效、精準的推理服務。
-
軟件
+關注
關注
69文章
5139瀏覽量
89069 -
NIM
+關注
關注
0文章
10瀏覽量
8173 -
人工智能
+關注
關注
1805文章
48887瀏覽量
247790 -
英偉達
+關注
關注
22文章
3932瀏覽量
93340 -
DeepSeek
+關注
關注
1文章
787瀏覽量
1537
發布評論請先 登錄
DeepSeek開源新版R1 媲美OpenAI o3
研華發布昇騰AI Box及Deepseek R1模型部署流程
OpenAI O3與DeepSeek R1:推理模型性能深度分析
研華邊緣AI Box MIC-ATL3S部署Deepseek R1模型

IBM在watsonx.ai平臺推出DeepSeek R1蒸餾模型
了解DeepSeek-V3 和 DeepSeek-R1兩個大模型的不同定位和應用選擇
景嘉微完成DeepSeek R1系列模型適配
Deepseek R1大模型離線部署教程

部署DeepSeek R1于AX650N與AX630C平臺

扣子平臺支持DeepSeek R1與V3模型
Krea發布Deepseek R1驅動的Chat功能
云天勵飛上線DeepSeek R1系列模型

評論