今日,在火山引擎2025春季原動力大會上,英特爾聯(lián)合火山引擎共同發(fā)布搭載英特爾至強6性能核處理器的第四代通用計算型(ECS)實例家族,即全新推出的通用計算基礎型實例 g4i、算力增強型實例 g4ie,并深入展示了此前發(fā)布的I/O增強型實例 g4il的豐富用例。不僅如此,雙方還分享了AI時代共同驅動算力成本優(yōu)化、端云協(xié)同與開發(fā)范式升級的最新合作進展。
AI的發(fā)展推動著云計算的演進,加速行業(yè)從云原生時代邁向AI原生時代。在這一進程中,企業(yè)對算力的需求日益多樣化,同時對高性價比、高穩(wěn)定性的需求也與日俱增?;诙嗄甑膹V泛合作,英特爾與火山引擎繼續(xù)攜手共進,一方面充分利用雙方的優(yōu)勢,打造涵蓋從通用到智能的彈性AI算力底座,為企業(yè)提供強大、靈活、兼顧成本效益的AI算力基礎設施;另一方面,雙方亦通過共建開放生態(tài),支持大模型應用、智能體DevOps中臺與高性價比智算平臺相結合,構建AI生態(tài)新范式,加速企業(yè)的智能化進程。
高效算力底座,推動云端算力躍升
本次大會上,英特爾攜手火山引擎共同發(fā)布了全新第四代 ECS 實例家族,不僅功能上更加豐富,在性能與架構上也得到了進一步提升。與上一代實例相比,通用計算基礎型實例 g4i在MySQL 數(shù)據(jù)庫和Web 應用上分別實現(xiàn)了20%和19%的性能提升,算力增強型實例 g4ie在視頻解碼和圖像渲染上帶來了15%和26%提升,I/O增強型實例 g4il在Spark大數(shù)據(jù)和Redis數(shù)據(jù)庫上也實現(xiàn)了13%和30%的提升。值得一提的是,得益于英特爾高級矩陣擴展(AMX)的深度優(yōu)化,基礎型實例 g4i在RAG全鏈路提速、WDL 模型推理優(yōu)化上均展現(xiàn)了出色的性能。其中,RAG全鏈路在文檔處理、Embedding、向量數(shù)據(jù)庫檢索和Reranking加速中,耗時減少了40%-90%。
高性價比智算平臺,助力企業(yè)智能體進階
邊緣AI應用的發(fā)展,對定制化、便捷化和安全化提出了新的需求,這讓具備靈活、高效、高性價比的智算平臺成為理想之選。在基于英特爾至強處理器和多張英特爾銳炫顯卡的一體機解決方案中,全新英特爾銳炫Pro B60,單卡可提供24GB顯存,在上下文擴展和并發(fā)擴展等場景中,提供更強的處理能力。因此,在邊緣和企業(yè)AI等應用場景中,該方案能夠以出色的成本效益優(yōu)勢,提供高效、可靠的AI算力。此外,英特爾提供了包括vLLM、PyTorch在內的完善的主流生態(tài)軟件棧和封裝成服務化的企業(yè)AI平臺(EAP),幫助用戶將上層應用平滑遷移到英特爾平臺上,加速用戶私有化部署LLM應用和智能體。
軟硬件協(xié)同加速,煥新模型開發(fā)至應用落地
通過幫助企業(yè)打造彈性的AI算力底座,英特爾與火山引擎正攜手推動AI技術在云端的普及與應用,護航AI云原生從開發(fā)到生產的全流程,本次活動的現(xiàn)場展區(qū)也展示了雙方合作的豐富成果。
在企業(yè)AI應用開發(fā)側,英特爾攜手火山引擎基于第四代實例提供了大模型應用的開發(fā)環(huán)境——“開源大模型應用-知識庫問答”應用鏡像,支持開發(fā)者快速完成大模型的微調和推理環(huán)境的搭建。在結合HiAgent大模型能力中臺時,能夠從Dev到Ops全方位支持智能體規(guī)劃、開發(fā)與應用,幫助降低AI落地的技術門檻和運營成本。在助力企業(yè)AI生產領域,英特爾至強處理器和AMX加速引擎、配合火山引擎的深度優(yōu)化,讓企業(yè)在大模型落地階段可以實現(xiàn)全流程性能提升,降低AI應用的部署成本,保障在高并發(fā)場景下的系統(tǒng)穩(wěn)定性的同時,提升產品的整體性能與實際落地效率。
通過共同構建開放的AI生態(tài),英特爾與火山引擎正在推動AI算力普惠,打造高性價比的智算平臺。展望未來,雙方也將繼續(xù)探索AI時代云計算的更多創(chuàng)新應用,以高效的算力加速低成本AI應用落地,助力企業(yè)的智能化升級之路。
審核編輯 黃宇
-
英特爾
+關注
關注
61文章
10184瀏覽量
174210 -
AI
+關注
關注
88文章
34623瀏覽量
276456
發(fā)布評論請先 登錄
評論