微軟已經為深度學習優化庫 DeepSpeed 申請了商標保護。該商標于2020年12月8日提交,其中提到“為人工智能處理和深度學習提供臨時使用的在線不可下載的計算機軟件”,這表明微軟可能在考慮通過在線云服務提供 DeepSpeed。
該庫于今年 2 月發布,可以在適度的硬件上訓練大規模的人工智能模型。它只需要使用 800 塊 Nvidia V100 顯卡就可以創建具有萬億參數的深度學習模型,是目前世界上最大的模型的 5 倍多。如果沒有DeepSpeed,同樣的任務需要 4000 塊 Nvidia A100(性能比 V100 快2.5倍),而且事件縮短了 100 多天。
在 GPT-3 顯示模型在神經網和數據集越大的情況下繼續改進后,這個工具特別有用。然而,這確實有可能將最新的創新推到資源較少的小型團隊的范圍之外,但DeepSpeed已經允許這些團隊以最小的硬件與更大的服務競爭。轉移到云處理可能會使大型模型AI訓練更容易獲得。
責任編輯:haq
-
微軟
+關注
關注
4文章
6676瀏覽量
105505 -
人工智能
+關注
關注
1805文章
48868瀏覽量
247665 -
云服務
+關注
關注
0文章
853瀏覽量
39609
發布評論請先 登錄
有可能在 FX3 GPIF2 中創建兩個獨立的狀態機嗎?
ads8568采集基本正常,但可能在某一次上電后,出現不工作的狀態,為什么?
微軟最新消息:微軟入歐洲云服務提供商協會 微軟執行副總裁將離職
微軟調整協議:OpenAI獲準使用其他云服務
微軟調整協議,OpenAI獲準使用其他云服務
華為 Flexus 云服務器打造 Laverna 在線筆記應用

通過工業智能網關實現與微軟Azure IoT中心快速配置操作

評論