何金池
IBM 大中華區科技事業部資深架構師
現在搞大模型,GPU 芯片就是命根子,沒有高性能的 GPU 芯片,大模型跑不動,大模型的應用也玩不轉。所以高性能芯片的研發就變得非常關鍵,就拿一個 7nm 芯片的仿真來說,每分鐘能噴涌出,幾千個甚至上萬個作業,可能會瞬間擠爆計算資源。那如何把成千上萬個作業有序的調度到大規模的集群中呢?這時候,就得請出 HPC(高性能計算)調度界的“大宗師”—— IBM Spectrum LSF!
在大模型時代,電子半導體是當前技術攻堅的關鍵領域,IBM Spectrum LSF 如何助力半導體企業應對 AI 時代的高性能芯片需求?
作為 HPC 調度領域的扛把子,LSF 經過三十年的發展,但凡你想到調度的這種需求,基本都能滿足。LSF 有一系列的智能調度策略,可以讓作業在最合適的資源,以最快的速度來完成。比如說對一些關鍵的作業,LSF 會開綠燈,保證高優先級的作業插隊完成,低優先級的作業先靠邊站。也可以根據作業的一些依賴關系編排工作流。同時,LSF 還會實時的掃描整個集群的狀態,然后發現哪個服務器在偷水摸魚就會立刻抓出來,給他安排上合適的作業。
這里我分享一個半導體客戶的案例。他在芯片仿真過程中,遇到了作業不能及時完成、資源利用率低的情況,導致產品的上市周期非常長。用了 LSF 之后,他的資源利用率暴增 40%,芯片仿真的驗證周期幾乎縮短到了原來的一半。原來一個作業要等很長時間才能出結果,現在可以說,溫酒斬華雄,工程師泡的咖啡還沒涼,作業已經算完了。
LSF 如何助力企業降本增效?
LSF 不光可以幫企業增效,也可以降本。比如說,在EDA(Electronic Design Automation,電子設計自動化)軟件里,有一些商業的許可證非常昂貴,貴到讓人懷疑人生。曾經有一個半導體客戶,他每年購買 EDA 的軟件的商業許可證,要花費幾千萬的美金。對于普通的調度器來說,它只管硬件資源,不管像許可證這樣的一些其他資源的調度。而 LSF 作為調度界的“瑞士軍刀”,它有一個功能模塊叫做License Scheduler,是業界唯一具備的功能,可以幫助企業去調度商業許可證,按需分配,不用的時候及時收回,還可以跨項目的去調度這個許可證。就拿剛才的案例來說,這個半導體企業利用LSF License Scheduler功能模塊,它的許可證利用率暴漲了 38%,還避免了因為沒有License的時候,經常導致作業失敗的情況。所以 LSF 幫助企業省錢的同時,還提高了工作效率,真正做到了一舉兩得。
IBM Spectrum LSF的獨特優勢有哪些?
首先,LSF 被稱為“瑞士軍刀”,就是因為它強悍的性能和豐富的功能。LSF同時可以支持幾千個用戶向它提交作業,可以同時管理幾百萬個作業。LSF 的功能也非常齊全,基本上我們看到在 HPC 這種場景下看到的需求,不管是作業管理、作業編排、作業調度、作業監控,LSF 都可以滿足。其他這種調度軟件,它可能只滿足一些基本的調度需求,對于一些高性能的策略,更智能的策略,它是沒有的。還有一些,比如說商業許可證調度功能,其他調度軟件也是沒有的。
另一方面,IBM 具有全世界范圍內 7x24小時的專業支持團隊。如果您在使用 LSF 過程中遇到問題,您隨時可以登錄我們的系統或撥打電話去尋求解決方案。這種貼身的專業支持,一些開源軟件也是不具備的。
IBM Spectrum LSF的應用場景有哪些?
LSF 的應用場景非常廣泛。比較常見的,比如剛提到的芯片 EDA 的仿真,還有生命科學和生物制藥,一些高端制造的 CIE 的場景,還有石油、天然氣、天氣預報、人工智能,以及一些超級的計算中心。
目前在芯片電子半導體企業,不管是大型的企業還是微創的企業,基本上我們看到百分之七八十已經在用了。還有一些醫療行業,因為我們跟一些醫療的軟件可以無縫的集合起來,能做這種基因的檢測,或者蛋白質的仿真。
在新冠期間,LSF 是幕后英雄。它在新冠疫苗研發里起了非常大的作用。國外某家新冠疫苗研發企業,它使用了 LSF 來做它的作業調度,使得它的疫苗盡快的推上市場。
我們每天看精準的天氣預報,比如說要刮大風,要下雨了,也是離不開 LSF 在幕后幫我們做的高性能的資源編排、作業的調度。
最后,我用 14個字來總結 IBM Spectrum LSF:智能調度快如風,資源管理準又精。如果您遇到“作業算不過來” “資源管不過來”等問題,歡迎聯系我們,IBM Spectrum LSF 讓您的超級計算不再“超級難”。
于 IBM
IBM 是全球領先的混合云、人工智能及企業服務提供商,幫助超過 175個國家和地區的客戶,從其擁有的數據中獲取商業洞察,簡化業務流程,降低成本,并獲得行業競爭優勢。金融服務、電信和醫療健康等關鍵基礎設施領域的超過 4000家政府和企業實體依靠 IBM 混合云平臺和紅帽 OpenShift 快速、高效、安全地實現數字化轉型。IBM 在人工智能、量子計算、行業云解決方案和企業服務方面的突破性創新為我們的客戶提供了開放和靈活的選擇。對企業誠信、透明治理、社會責任、包容文化和服務精神的長期承諾是 IBM 業務發展的基石。
-
芯片
+關注
關注
459文章
52176瀏覽量
436140 -
IBM
+關注
關注
3文章
1808瀏覽量
75460 -
AI
+關注
關注
87文章
34205瀏覽量
275368 -
超級計算
+關注
關注
1文章
42瀏覽量
11394
原文標題:IBM Spectrum LSF:讓超級計算不再“超級難”
文章出處:【微信號:IBMGCG,微信公眾號:IBM中國】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
先楫半導體MCU具有哪些優勢?
Nordic nRF54 系列芯片:開啟 AI 與物聯網新時代?
漢高亮相SEMICON China 2025 助力半導體產業在AI時代打造新質生產力

適用于數據中心和AI時代的800G網絡
Banana Pi 發布 BPI-AI2N & BPI-AI2N Carrier,助力 AI 計算與嵌入式開發
砥礪創新 芯耀未來——武漢芯源半導體榮膺21ic電子網2024年度“創新驅動獎”
北京市最值得去的十家半導體芯片公司
Cadence如何應對AI芯片設計挑戰
大模型時代的算力需求
IBM陳旭東:攜手IBM加速 AI 規模化應用,解鎖企業新質生產力

評論