GN7是全球首個公有云上基于NVIDIA T4以及vComputeServer的虛擬化實例,能夠加速人工智能、機器學習和數據科學的工作負載。
今日,騰訊云正式對外發布基于 NVIDIA T4 的虛擬GPU(vGPU)計算產品GN7實例,這也是全球首家公有云實現了基于NVIDIAT4GPU及NVIDIA vComputeServer軟件的vGPU實例。
基于多精度支持,NVIDIA T4擁有可加速深度學習訓練和推理、機器學習以及數據科學工作負載的 Tensor Core,以及豐富的平臺堆棧,包括用于深度學習的cuDNN、用于數據分析和機器學習的NVIDIARAPIDS、用于云工作站圖形的NVIDIAQuadro虛擬工作站和用于云游戲的NVIDIA游戲軟件。結合用于GPU虛擬化的 vComputeServer軟件,騰訊云客戶可以靈活選擇在虛擬環境中運行GPU加速的工作負載,從而在提高安全性和利用率的同時降低成本。
騰訊云副總裁劉穎表示:“人工智能的迅速發展對算力需求提出了各種挑戰,而我們專注解決這些問題,為客戶提供全方位的產品解決方案。騰訊云GN7實例通過部署NVIDIA T4 GPU,提供豐富多樣的實例規格,滿足從計算視覺到語音以及NLP等不同層次的算力需求。NVIDIA vComputeServer進一步豐富了算力粒度,為用戶提供了更多選擇的可能,最終為客戶節省成本。”
NVIDIA專業可視化業務副總裁Bob Pette表示:“企業正在迅速實施人工智能(AI)策略,AI策略需要依靠現代應用程序才能實現,而現代應用程序則需強大算力的支持。如今,在NVIDIA vComputeServer的助力之下,騰訊云可以輕松地幫助客戶實施并擴展數據分析、機器學習、AI以及企業中的其他工作負載。”
多重特性,廣泛適用不同AI場景
憑借強大的計算能力和彈性能力,GN7實例在海量數據處理和人工智能領域都具有廣闊的應用價值。它既可以滿足諸如搜索、大數據分析等需要對海量數據進行處理的業務場景,也可以作為深度學習訓練和推理的系統平臺。GN7實例的虛擬化特性也十分適合互聯網業務中人工智能業務的批量部署以及云游戲,AR/VR在云端的應用。目前GN7實例已經在騰訊云自有的智能鈦彈性模型服務(TI-EMS)上實現了應用。該平臺通過使用vGPU做小模型推理,幫助用戶解決復雜模型部署和GPU利用成本效益等問題。
進一步降低成本
GN7實例降低了GPU加速的初始投資成本,是初創企業、大學和企業在評估AI時的經濟選擇。 NVIDIA vComputeServer軟件通過對NVIDIAT4進行虛擬化,使多臺虛擬機(VM)可以同時訪問GPU或者使一臺虛擬機可以訪問多顆 GPU,從而實現性能的最大化。因此,騰訊云用戶可以根據工作負載的需求靈活選擇對應的GPU加速量。
比如在進行簡單模型推理這一類低算力需求的應用時,用戶無須再像以往必須使用單顆物理GPU,而是可以根據自身業務具體類型對GPU算力的需求,靈活選擇匹配的vGPU資源,提升了計算資源的利用率,從而有效降低用戶的使用成本,避免因配置不足或配置過度而產生成本。比如,通過使用1/2 vGPU實例規格,成本相對單卡實例降低了50%。
更出色的安全性
一直以來,騰訊云都在致力于通過最新虛擬化技術研發為用戶提供最安全最便利的異構計算產品。GN7實例具有更出色的性能與安全性,能夠安全隔離公有云上的實例。 相比過往進程級別的虛擬化GPU,GN7的升級點在于其提供的設備級虛擬化vGPU是完全模擬出來一個GPU設備,在支持GPU硬件的絕大多數特性的同時,還能夠做到操作系統級別的隔離,而且不同的用戶使用也不用擔心資源爭搶的問題。
下周,在于蘇州舉辦的GTC大會上,騰訊云海將會演示NVIDIA GPU加速的云服務,并介紹如何從云端部署AI工作負載。
責任編輯;zl
-
gpu
+關注
關注
28文章
4779瀏覽量
129369 -
人工智能
+關注
關注
1796文章
47704瀏覽量
240352 -
騰訊云
+關注
關注
0文章
216瀏覽量
16846
發布評論請先 登錄
相關推薦
評論