作者:IBM watsonx.ai 產品主管Maryam Ashoori;IBM AI 平臺(watsonx.ai 和 watsonx.governance)產品管理副總裁Armand Ruiz;IBM watsonx.ai 產品經理Nisarg Patel
IBM日前宣布,DeepSeek-R1 的 Llama 3.1 8B 和 Llama 3.3 70b 蒸餾版本現已在 IBM 的企業級 AI 開發平臺 watsonx.ai 上提供。
DeepSeek-R1 到底是啥?
DeepSeek-R1 是中國人工智能(AI)初創公司 DeepSeek 的推理大語言模型(LLM),是世界上最強大的開源模型之一,甚至可以與 OpenAI 的 o1 相媲美。DeepSeek-R1 在 MIT 許可證下發布,主要是通過在基礎模型 DeepSeek-V3 上直接使用強化學習(RL)開發的,這是微調 LLM 的一項重大創新。
DeepSeek 還使用了一種稱為知識蒸餾的技術,使用較大的 R1 模型生成的數據來微調多個 Llama 和 Qwen 模型。用戶可以通過兩種方式在 watsonx.ai 上訪問 DeepSeek 蒸餾模型:
IBM 通過 “按需部署目錄”在 watsonx.ai 中提供兩種 Llama 蒸餾變體,允許用戶部署專用實例進行安全推理。
用戶還可以使用自定義基礎模型導入功能導入 DeepSeek-R1 模型的其他變體,如 Qwen 蒸餾模型。
DeepSeek-R1 支持哪些類型的用例?
DeepSeek-R1 是一種先進的 AI 模型,以其卓越的推理能力而著稱,支持各行各業的廣泛應用:
規劃:DeepSeek-R1 專注于思維邏輯鏈,能夠執行需要逐步推理的任務,因此非常適合為智能體(代理)應用程序提供支持。
編碼:DeepSeek-R1 擅長編碼任務,提供代碼生成、調試輔助和優化建議。
數學問題解決:該模型強大的推理能力使其善于解決復雜的數學問題,這對學術研究、工程和科學計算大有裨益。
開發人員可在 IBM watsonx.ai 中使用 DeepSeek-R1 等已部署的模型和解決方案功能構建人工智能解決方案:
以易于理解的格式和用戶界面測試和評估模型輸出
通過連接各種向量數據庫和嵌入模型來構建 RAG 管道
與 LangChain、CrewAI 等流行框架和連接器協同工作
為何要在 watsonx.ai 上使用 DeepSeek 蒸餾模型?IBM watsonx.ai 使客戶能夠定制實施 DeepSeek-R1 等開源模型,從部署環境的完全靈活性到智能體(代理)開發、微調、RAG、提示工程和與企業應用程序集成的直觀工作流,用戶可以利用 watsonx.ai 的內置護欄來保護他們的應用程序。
當然,數據安全和 AI 治理是客戶最關心的問題。除防護欄外,在 watsonx.ai 上部署時,這些模型將成為專用實例,這意味著除平臺外,不會在其他任何地方共享數據。此外,與 IBM watsonx.governance 這一功能強大的治理、風險和合規性(GRC)工具包的無縫集成,可確保客戶的 AI 在整個 AI 生命周期內都是負責任、透明和可解釋的。
開始在 IBM watsonx.ai 上使用 DeepSeek
支持 DeepSeek-R1 的蒸餾變體是 IBM 致力于 AI 開源創新的一部分。DeepSeek Llama 的兩個蒸餾模型都以納入 IBM watsonx.ai 上按需部署目錄,能夠在專用 GPU 上按小時部署。
如何從 watsonx 資源中心按需部署 R1 模型從資源中心按需部署基礎模型,請完成以下步驟:
1. 從導航菜單打開資源中心。
2. 從“按小時付費 ”部分,找到要按需部署的 DeepSeek 模型。
3. 從模型詳細信息頁面,單擊“Deploy (部署)”。
4. 從基礎模型磁貼中單擊“Deploy (部署)”,然后選擇要部署基礎模型的部署空間。
5. 單擊“Create (創建)”。
6. 通過 Prompt Lab 或 API/SDK 開始使用模型。
IBM watsonx.ai 在這里會用斜體顯示模型的思維過程,而最終輸出則用非斜體顯示。正如你所見,只需一個簡單的提示,模型就能推理并規劃出響應中需要包含的各個部分。
如何通過 REST API 在 watsonx 上部署 R1 模型您也可以使用 REST API 來部署模型 當然,您必須將 bearer token 和 space-id 等信息替換為相應的憑證。模型部署完成后,您可以從 Prompt Lab 或 watsonx.ai API 提示基礎模型。
通過讓用戶訪問 watsonx.ai 上同類最優的開源模型(包括第三方模型和 IBM Granite),我們以期能夠塑造協作和知識共享的文化。
關于 IBM
IBM 是全球領先的混合云、人工智能及企業服務提供商,幫助超過 175個國家和地區的客戶,從其擁有的數據中獲取商業洞察,簡化業務流程,降低成本,并獲得行業競爭優勢。金融服務、電信和醫療健康等關鍵基礎設施領域的超過 4000家政府和企業實體依靠 IBM 混合云平臺和紅帽 OpenShift 快速、高效、安全地實現數字化轉型。IBM 在人工智能、量子計算、行業云解決方案和企業服務方面的突破性創新為我們的客戶提供了開放和靈活的選擇。對企業誠信、透明治理、社會責任、包容文化和服務精神的長期承諾是 IBM 業務發展的基石。
-
IBM
+關注
關注
3文章
1771瀏覽量
74883 -
模型
+關注
關注
1文章
3346瀏覽量
49274 -
DeepSeek
+關注
關注
1文章
229瀏覽量
83
原文標題:企業通過 watsonx.ai 采用 DeepSeek R1 蒸餾模型,可增強安全、治理和規模化部署能力
文章出處:【微信號:IBMGCG,微信公眾號:IBM中國】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
相關推薦
DeepSeek模型成功部署,物通博聯在 AI 賦能工業上持續探索、不斷前行
OrangePi AI Studio運行Deepseek-R1蒸餾模型,開啟你的AI之旅
![OrangePi <b class='flag-5'>AI</b> Studio運行<b class='flag-5'>Deepseek-R1</b><b class='flag-5'>蒸餾</b><b class='flag-5'>模型</b>,開啟你的<b class='flag-5'>AI</b>之旅](https://file1.elecfans.com/web3/M00/07/D6/wKgZO2eqsqCAXbYdAAB0h-ulRo0581.png)
Gitee AI 聯合沐曦首發全套 DeepSeek R1 千問蒸餾模型,全免費體驗!
![Gitee <b class='flag-5'>AI</b> 聯合沐曦首發全套 <b class='flag-5'>DeepSeek</b> <b class='flag-5'>R1</b> 千問<b class='flag-5'>蒸餾</b><b class='flag-5'>模型</b>,全免費體驗!](https://file1.elecfans.com//web3/M00/07/9E/wKgZPGepXOOAUDYmAA45t-baKr0306.png)
部署DeepSeek R1于AX650N與AX630C平臺
![部署<b class='flag-5'>DeepSeek</b> <b class='flag-5'>R1</b>于AX650N與AX630C<b class='flag-5'>平臺</b>](https://file1.elecfans.com/web3/M00/07/93/wKgZPGeoBhiAbFSOAAAYmyujFsI606.jpg)
壁仞科技順利部署DeepSeek R1千問蒸餾模型
扣子平臺支持DeepSeek R1與V3模型
DeepSeek最新AI模型現已登陸IBM watsonx.ai平臺
DeepSeek-R1全尺寸版本上線Gitee AI
華為ModelEngine AI平臺全面支持DeepSeek
![華為ModelEngine <b class='flag-5'>AI</b><b class='flag-5'>平臺</b>全面支持<b class='flag-5'>DeepSeek</b>](https://file1.elecfans.com/web3/M00/07/5F/wKgZPGelb7mAOewwAAAqzDXoRzQ798.png)
評論