據最新消息,自 AMD 去年 12 月份公布 ROCm 6.0 以來,已經開始積極籌備 6.1 版的發布,以提高與英偉達(NVIDIA)CUDA 競爭的核心實力。
在此期間,AMD 頻繁向GitHub公共倉庫推送有關 ROCm 6.1 的最新開發進展,透露出不久后有可能正式上線新版本的意圖。
據悉,此次 ROCm 6.1 主要的突破在于其升級至全新版本的 MIPOpen 3.1;新增了使用AI進行參數預測的 conv_hip_igemm_group_fwd_xdlops 求解器;解決了當前版本的眾多 BUG,以及引入了新的求解器算法。
此外,該系列還努力提升了系統性能,尤其是優化了MIGraphX功能,包含但不限于加入對FP8精度的支持,以及增加更多運算符等,同時更新了針對 Whisper / Llama-2 / Stable Diffusion 2.1 的文檔示例,以及提供新的ONNX示例,以便更好地適應 GEMM 的BLAS自動調整。
更重要的是,為了改善在Microsoft Windows 環境下運行 MIGraphX的效率,AMD特別推出了全新的“hipother”資源庫。
值得一提的是,HIP 技術是AMD專有的C++運行時API和內核語言,適配可移植的AMD/NVIDIA GPU應用程序,而HIPIFY 工具則能協助將CUDA源碼便捷地轉化成HIP腳本。
-
amd
+關注
關注
25文章
5574瀏覽量
136036 -
英偉達
+關注
關注
22文章
3927瀏覽量
93270 -
求解器
+關注
關注
0文章
79瀏覽量
4718
發布評論請先 登錄
首創開源架構,天璣AI開發套件讓端側AI模型接入得心應手
FPGA+AI王炸組合如何重塑未來世界:看看DeepSeek東方神秘力量如何預測......
AI賦能邊緣網關:開啟智能時代的新藍海
淵亭KGAG升級引入“高級策略推理”
IBM在watsonx.ai平臺推出DeepSeek R1蒸餾模型
AI模型部署邊緣設備的奇妙之旅:目標檢測模型
AMD發布10億參數開源AI模型OLMo
英偉達發布AI模型 Llama-3.1-Nemotron-51B AI模型
Meta Llama 3.1系列模型可在Google Cloud上使用
Meta發布全新開源大模型Llama 3.1
NVIDIA AI Foundry 為全球企業打造自定義 Llama 3.1 生成式 AI 模型

評論