谷歌 Gemini 模型即將支持本地部署,可通過搭載 NVIDIA Blackwell 架構的基礎設施,在 Google 分布式云上運行 NVIDIA 機密計算。
NVIDIA 正在與谷歌云合作,為希望使用NVIDIA BlackwellHGX 和 DGX 平臺以及NVIDIA 機密計算技術本地化運行谷歌 Gemini AI 模型系列的企業引入代理式 AI,以保證數據安全。
借助 Google 分布式云上的 NVIDIA Blackwell 平臺,本地數據中心可借助敏感信息訪問權限嚴格管控(例如病患檔案、金融交易和政府涉密信息),確保符合監管要求和數據主權法律。NVIDIA 機密計算還可以保護 Gemini 模型中的敏感代碼免于未經授權的訪問和數據泄露。
“通過將我們的 Gemini 模型與 NVIDIA Blackwell 的突破性性能和機密計算能力引入本地部署環境,企業得以充分釋放代理式 AI 的全部潛能,”谷歌云副總裁兼基礎設施和解決方案總經理 Sachin Gupta 表示。“此次合作有助于確保客戶在不犧牲性能或操作簡易性的前提下,安全地實現技術創新。”
基于 NVIDIA Blackwell 的機密計算可以為企業提供技術保障,確保用戶向 Gemini 模型的應用編程接口提交的指令及模型微調數據均全程加密,無法被查看或修改。
同時,模型所有者可以防范未經授權的訪問或篡改,提供雙層保護,使企業使用 Gemini 模型進行創新的同時,還能保障數據隱私。
AI 智能體驅動新的企業應用
隨著代理式 AI 正在推動企業技術變革,并提供更強的解決問題能力,這一新產品應運而生。
與基于學習知識進行感知或生成的 AI 模型不同,代理式 AI 系統可以在動態環境中進行推理、調整并做出決策。例如,在企業 IT 支持中,知識型 AI 模型可以檢索并給出故障排除指南,而代理式 AI 系統則能診斷問題、執行修復并自主完成復雜問題升級。
同樣,在金融領域,傳統 AI 模型可以根據模式標記潛在的欺詐交易,但代理式 AI 系統不僅能溯源異常數據,更能進行主動干預(例如攔截可疑交易或實時調整欺詐檢測規則)。
本地困境
雖然許多用戶已經可以使用具有多模態邏輯推理能力的模型——通過整合文本、圖像、代碼等多類數據來解決復雜問題,并構建基于云的代理式 AI 應用,但對于那些有嚴格安全要求或數據主權要求的客戶來說,尚無法做到這一點。
此次發布后,谷歌云將成為首批提供機密計算功能的云服務提供商之一,以保護各類環境中的代理式 AI 工作負載(無論是云還是混合環境)。
該解決方案由搭載NVIDIABlackwell GPU和采用 NVIDIA 機密計算的 NVIDIA HGX 平臺提供支持,助力客戶保護 AI 模型和數據,使用戶能夠在不損害數據安全性或模型完整性的前提下實現突破性的性能和能效。
代理式 AI 的 AI 可觀測性和安全性
在生產環境中擴展代理式 AI 需要構建強大的可觀測性和安全保障體系,以確保系統性能可靠并滿足合規要求。
谷歌云宣布推出全新 GKE 推理網關 (GKE Inference Gateway),旨在通過先進的路由和擴展能力優化 AI 推理工作負載的部署。該網關集成NVIDIA Triton推理服務器以及NVIDIA NeMo Guardrails,提供智能負載均衡,能夠提升性能并降低服務成本,同時實現模型的集中式安全防護和治理。
展望未來,谷歌云正在通過集成NVIDIA Dynamo來增強代理式 AI 工作負載的可觀測性。NVIDIA Dynamo 是一個開源庫,用于加速并擴展 AI 工廠的 AI 邏輯推理模型。
-
谷歌
+關注
關注
27文章
6231瀏覽量
108103 -
NVIDIA
+關注
關注
14文章
5308瀏覽量
106342 -
AI
+關注
關注
88文章
35093瀏覽量
279505
原文標題:NVIDIA 與谷歌云為企業帶來代理式 AI 邏輯推理
文章出處:【微信號:NVIDIA-Enterprise,微信公眾號:NVIDIA英偉達企業解決方案】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
NVIDIA全棧加速代理式AI應用落地
NVIDIA攜手微軟加速代理式AI發展
英偉達GTC2025亮點:NVIDIA、Alphabet 和谷歌攜手開啟代理式與物理AI的未來

Oracle 與 NVIDIA 合作助力企業加速代理式 AI 推理

NVIDIA Blackwell RTX PRO 提供工作站和服務器兩種規格,助力設計師、開發者、數據科學家和創作人員構建代理式

NVIDIA 推出開放推理 AI 模型系列,助力開發者和企業構建代理式 AI 平臺

評論