據最新消息,自 AMD 去年 12 月份公布 ROCm 6.0 以來,已經開始積極籌備 6.1 版的發布,以提高與英偉達(NVIDIA)CUDA 競爭的核心實力。
在此期間,AMD 頻繁向GitHub公共倉庫推送有關 ROCm 6.1 的最新開發進展,透露出不久后有可能正式上線新版本的意圖。
據悉,此次 ROCm 6.1 主要的突破在于其升級至全新版本的 MIPOpen 3.1;新增了使用AI進行參數預測的 conv_hip_igemm_group_fwd_xdlops 求解器;解決了當前版本的眾多 BUG,以及引入了新的求解器算法。
此外,該系列還努力提升了系統性能,尤其是優化了MIGraphX功能,包含但不限于加入對FP8精度的支持,以及增加更多運算符等,同時更新了針對 Whisper / Llama-2 / Stable Diffusion 2.1 的文檔示例,以及提供新的ONNX示例,以便更好地適應 GEMM 的BLAS自動調整。
更重要的是,為了改善在Microsoft Windows 環境下運行 MIGraphX的效率,AMD特別推出了全新的“hipother”資源庫。
值得一提的是,HIP 技術是AMD專有的C++運行時API和內核語言,適配可移植的AMD/NVIDIA GPU應用程序,而HIPIFY 工具則能協助將CUDA源碼便捷地轉化成HIP腳本。
-
amd
+關注
關注
25文章
5503瀏覽量
134697 -
英偉達
+關注
關注
22文章
3854瀏覽量
92076 -
求解器
+關注
關注
0文章
78瀏覽量
4558
發布評論請先 登錄
相關推薦
AI模型部署邊緣設備的奇妙之旅:目標檢測模型
AMD發布10億參數開源AI模型OLMo
英偉達發布AI模型 Llama-3.1-Nemotron-51B AI模型
Meta Llama 3.1系列模型可在Google Cloud上使用
Meta發布全新開源大模型Llama 3.1
NVIDIA AI Foundry 為全球企業打造自定義 Llama 3.1 生成式 AI 模型
![NVIDIA <b class='flag-5'>AI</b> Foundry 為全球企業打造自定義 Llama <b class='flag-5'>3.1</b> 生成式 <b class='flag-5'>AI</b> <b class='flag-5'>模型</b>](https://file1.elecfans.com/web2/M00/FE/F8/wKgaomagW9SAbLHwAAVEfeObLRk613.png)
評論