電子發燒友網報道(文/黃山明)近日,有媒體報道,小米正在著手搭建自家的GPU萬卡集群,將對AI大模型加大投入。該計劃已進行數月,據悉小米大模型團隊在成立之初便已擁有6500張GPU資源,小米創始人兼董事長雷軍在該團隊扮演重要的領導角色。
高性能計算是大模型發展的基礎,而GPU在其中扮演重要作用。隨著AI在如今社會中發揮著越來越重要的作用,應用領域不斷擴展,需要的計算資源也越來越多,因此對于GPU的需求也在不斷上升。
小米搭建萬卡GPU集群,加大AI大模型投入
如今我們生活中已經有不少領域開始充斥著AI的身影,包括AI配音、AI影像、AI圖片、AI導航,以及不少人正在使用的免費AI大模型等。但相比ChatGPT、豆包、Kimi、通義千問等知名度不小的大模型,小米的MiLM顯得相對低調。
這是一款在今年5月份才正式通過大模型備案的小米大預言模型,小米宣布將把相關模型逐步應用于小米汽車、手機、智能家居等產品中,后續“將面向更多用戶開放體驗”。
而到了近期,市場更是傳出小米準備搭建GPU萬卡集群,決心加大對AI的投入。但搭建GPU的萬卡集群并不容易,一方面在于昂貴的成本。訓練AI大模型通常需要使用高性能的GPU芯片,如英偉達的A100、H100等。
這些高端芯片的單價本身就非常高,A100芯片價格約9萬元一張,H100閹割后的HGX H20渠道價格約11萬一張,而萬卡集群需要至少一萬張以上的GPU卡,僅芯片采購成本就可能達到數十億元。
并且除了GPU芯片本身,構建萬卡集群還需要大量的配套硬件設備,如服務器、存儲設備、網絡設備等。這些設備的采購和安裝成本也相當恐怖,進一步增加了總體投入。
而之所以需要GPU萬卡集群,是因為AI大模型通常包含數十億乃至數萬億的參數,例如GPT-3就有1750億個參數,訓練和推理過程中需要進行海量的矩陣運算和復雜的數學計算。如此大規模的計算任務,單張GPU的計算能力遠遠無法滿足,需要借助GPU萬卡集群并行計算來加速。
當然,這些技術的出現,其實并非突然,而是早有布局。小米早在2016年便開始組建第一只視覺AI團隊,逐步建立了視覺、語音、聲學、知識圖譜、NLP、機器學習、多模態等AI技術能力。
到2017年,小米正式發布了智能語音助手“小愛同學”。盡管當時的AI技術和現在相比可能顯得較為基礎,但小愛同學已經運用了語音識別、NLP、機器學習等核心技術來實現人機交互。
去年4月份,小米成立AI實驗室大模型團隊,初始團隊便擁有6500張GPU資源。并認為欒劍擔任該團隊的負責人,欒劍此前曾任東芝(中國)研究院研究員、微軟(中國)工程院高級語音科學家、微軟小冰首席語音科學家及語音團隊負責人等職位。
并且在近期,有消息稱DeepSeek開源大模型DeepSeek-V2的關鍵開發者之一羅福莉將加入小米,有望進一步加強小米AI大模型團隊實力。
端側擁抱AI已成共識,小米具備重大優勢
國內目前已經有多家企業開展了萬卡集群的建設,例如華為昇騰、科大訊飛、中國電信、中國移動等,其中中國電信在上海、北京兩個萬卡集群已經投產,而中國移動位于呼和浩特、哈爾濱兩大萬卡級別的智算中心也已經先后投產運行。
更別說百度等公司已經在探討構建十萬卡集群,有業內人士認為,市場中很快便會有更多的十萬卡集群出現。
另一方面,海外則更加激進。例如由馬斯克旗下xAI公司打造的xAI Colossus 超級AI集群,擁有10萬個英偉達H100 GPU。其第一階段建設已完成并全面上線,未來計劃增加5萬張H100 GPU和5萬張下一代H200 GPU,屆時GPU總數將翻倍。
OpenAI正在設計能夠將1000萬塊GPU連在一起的計算模型,Meta CEO扎克伯格曾在年初宣布,計劃購買35萬塊英偉達H100 GPU,將Meta的算力擴展到相當于60萬塊英偉達H100 GPU的水平。
與此同時,越來越多的企業開始更為注重AI,包括理想汽車創始人李想此前公開表示,理想汽車不僅是一家汽車制造企業,更是一家AI企業。
加上如今的AI手機、AI手表、AIPC甚至智能汽車等,這些端側產品均在積極擁抱AI,AI的加入也為這些產品帶來了更多的差異化與個性化,甚至有望成為未來產品體驗差異的分水嶺。
而相比其他企業,小米擁有一項重大的優勢,其AI大模型可以與自身的“人車家”戰略完美契合,甚至可以說AI大模型的加入,讓小米“人車家”全生態完成了最后一項閉環。
從手機到智能家居,再到新能源汽車,小米均有涉獵,并且大多已經成為行業中的主要參與者,例如小米為全球第三大手機廠商,米家更是全球最大的智能家居平臺,其中小愛音箱以超過40%的市場份額穩居中國智能音箱榜首。
小米汽車更是后來居上,不僅屢屢出圈,自今年3月份發布以來,有望在今年內實現超過13萬輛的交付成績,為小米集團貢獻近百億元的營收。同時小米汽車更是小米集團獨資控股,保證了小米汽車能夠貫徹未來小米集團的發展方向。
另一方面,雷軍不僅是小米的創始人,如今依然是金山軟件的董事長,意味著未來小米AI大模型有望在WPS等辦公軟件中布局。
從硬件端的互聯網入口,到辦公軟件、游戲等領域,都已經為小米的MiLM大模型預留足夠的發展空間,這是許多AI大模型企業沒有的巨大優勢。不僅保障了未來小米AI大模型的迭代升級,同時也解決了其數據歸屬問題,進一步加速AI大模型的升級。
總結
從小米過往布局新賽道的步伐來看,通常是確定了某個賽道已經得到市場驗證,并相對成熟再決定進入。進入賽道后,再利用小米集團的自身優勢,迅速做大做強。如今小米采用萬卡集群,加大投入到AI大模型領域,意味著不久后便有望看到該模型的普及。也期待未來市場中小米AI大模型的表現。
高性能計算是大模型發展的基礎,而GPU在其中扮演重要作用。隨著AI在如今社會中發揮著越來越重要的作用,應用領域不斷擴展,需要的計算資源也越來越多,因此對于GPU的需求也在不斷上升。
小米搭建萬卡GPU集群,加大AI大模型投入
如今我們生活中已經有不少領域開始充斥著AI的身影,包括AI配音、AI影像、AI圖片、AI導航,以及不少人正在使用的免費AI大模型等。但相比ChatGPT、豆包、Kimi、通義千問等知名度不小的大模型,小米的MiLM顯得相對低調。
這是一款在今年5月份才正式通過大模型備案的小米大預言模型,小米宣布將把相關模型逐步應用于小米汽車、手機、智能家居等產品中,后續“將面向更多用戶開放體驗”。
而到了近期,市場更是傳出小米準備搭建GPU萬卡集群,決心加大對AI的投入。但搭建GPU的萬卡集群并不容易,一方面在于昂貴的成本。訓練AI大模型通常需要使用高性能的GPU芯片,如英偉達的A100、H100等。
這些高端芯片的單價本身就非常高,A100芯片價格約9萬元一張,H100閹割后的HGX H20渠道價格約11萬一張,而萬卡集群需要至少一萬張以上的GPU卡,僅芯片采購成本就可能達到數十億元。
并且除了GPU芯片本身,構建萬卡集群還需要大量的配套硬件設備,如服務器、存儲設備、網絡設備等。這些設備的采購和安裝成本也相當恐怖,進一步增加了總體投入。
而之所以需要GPU萬卡集群,是因為AI大模型通常包含數十億乃至數萬億的參數,例如GPT-3就有1750億個參數,訓練和推理過程中需要進行海量的矩陣運算和復雜的數學計算。如此大規模的計算任務,單張GPU的計算能力遠遠無法滿足,需要借助GPU萬卡集群并行計算來加速。
當然,這些技術的出現,其實并非突然,而是早有布局。小米早在2016年便開始組建第一只視覺AI團隊,逐步建立了視覺、語音、聲學、知識圖譜、NLP、機器學習、多模態等AI技術能力。
到2017年,小米正式發布了智能語音助手“小愛同學”。盡管當時的AI技術和現在相比可能顯得較為基礎,但小愛同學已經運用了語音識別、NLP、機器學習等核心技術來實現人機交互。
去年4月份,小米成立AI實驗室大模型團隊,初始團隊便擁有6500張GPU資源。并認為欒劍擔任該團隊的負責人,欒劍此前曾任東芝(中國)研究院研究員、微軟(中國)工程院高級語音科學家、微軟小冰首席語音科學家及語音團隊負責人等職位。
并且在近期,有消息稱DeepSeek開源大模型DeepSeek-V2的關鍵開發者之一羅福莉將加入小米,有望進一步加強小米AI大模型團隊實力。
端側擁抱AI已成共識,小米具備重大優勢
國內目前已經有多家企業開展了萬卡集群的建設,例如華為昇騰、科大訊飛、中國電信、中國移動等,其中中國電信在上海、北京兩個萬卡集群已經投產,而中國移動位于呼和浩特、哈爾濱兩大萬卡級別的智算中心也已經先后投產運行。
更別說百度等公司已經在探討構建十萬卡集群,有業內人士認為,市場中很快便會有更多的十萬卡集群出現。
另一方面,海外則更加激進。例如由馬斯克旗下xAI公司打造的xAI Colossus 超級AI集群,擁有10萬個英偉達H100 GPU。其第一階段建設已完成并全面上線,未來計劃增加5萬張H100 GPU和5萬張下一代H200 GPU,屆時GPU總數將翻倍。
OpenAI正在設計能夠將1000萬塊GPU連在一起的計算模型,Meta CEO扎克伯格曾在年初宣布,計劃購買35萬塊英偉達H100 GPU,將Meta的算力擴展到相當于60萬塊英偉達H100 GPU的水平。
與此同時,越來越多的企業開始更為注重AI,包括理想汽車創始人李想此前公開表示,理想汽車不僅是一家汽車制造企業,更是一家AI企業。
加上如今的AI手機、AI手表、AIPC甚至智能汽車等,這些端側產品均在積極擁抱AI,AI的加入也為這些產品帶來了更多的差異化與個性化,甚至有望成為未來產品體驗差異的分水嶺。
而相比其他企業,小米擁有一項重大的優勢,其AI大模型可以與自身的“人車家”戰略完美契合,甚至可以說AI大模型的加入,讓小米“人車家”全生態完成了最后一項閉環。
從手機到智能家居,再到新能源汽車,小米均有涉獵,并且大多已經成為行業中的主要參與者,例如小米為全球第三大手機廠商,米家更是全球最大的智能家居平臺,其中小愛音箱以超過40%的市場份額穩居中國智能音箱榜首。
小米汽車更是后來居上,不僅屢屢出圈,自今年3月份發布以來,有望在今年內實現超過13萬輛的交付成績,為小米集團貢獻近百億元的營收。同時小米汽車更是小米集團獨資控股,保證了小米汽車能夠貫徹未來小米集團的發展方向。
另一方面,雷軍不僅是小米的創始人,如今依然是金山軟件的董事長,意味著未來小米AI大模型有望在WPS等辦公軟件中布局。
從硬件端的互聯網入口,到辦公軟件、游戲等領域,都已經為小米的MiLM大模型預留足夠的發展空間,這是許多AI大模型企業沒有的巨大優勢。不僅保障了未來小米AI大模型的迭代升級,同時也解決了其數據歸屬問題,進一步加速AI大模型的升級。
總結
從小米過往布局新賽道的步伐來看,通常是確定了某個賽道已經得到市場驗證,并相對成熟再決定進入。進入賽道后,再利用小米集團的自身優勢,迅速做大做強。如今小米采用萬卡集群,加大投入到AI大模型領域,意味著不久后便有望看到該模型的普及。也期待未來市場中小米AI大模型的表現。
聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。
舉報投訴
-
gpu
+關注
關注
28文章
4880瀏覽量
130348 -
小米
+關注
關注
70文章
14418瀏覽量
146050 -
AI大模型
+關注
關注
0文章
358瀏覽量
460
發布評論請先 登錄
相關推薦
國產千卡GPU集群完成大模型訓練測試,極具高兼容性和穩定性
卡集群的方式成為了必然的選擇。 ? 2023年底,摩爾線程推出首個全國產千卡千億模型訓練平臺“摩爾線程KUAE智算中心”。摩爾線程相關負責人此前談到,百

百度智能云發布昆侖芯三代萬卡集群及DeepSeek-R1/V3上線
01百度智能云點亮昆侖芯三代萬卡集群 近日,百度智能云成功點亮昆侖芯三代萬卡集群,這也是國內首個
昆侖芯P800萬卡集群成功點亮,將進一步點亮3萬卡集群
的。而24年9月升級的百度百舸AI異構計算平臺4.0,圍繞落地大模型全旅程的算力需求,在集群創建、開發實驗、模型訓練、模型推理四大方面,能為
發表于 02-05 17:58
?360次閱讀

GPU是如何訓練AI大模型的
在AI模型的訓練過程中,大量的計算工作集中在矩陣乘法、向量加法和激活函數等運算上。這些運算正是GPU所擅長的。接下來,AI部落小編帶您了解GPU
Meta萬卡GPU集群穩定性剖析與最佳實踐
一、背景 本文中我們將具體介紹 Meta 對其萬卡 AI 集群穩定性的剖析和刻畫,以及在其中遇到的各種挑戰,并在其中補充了一些真實場景中遇到的 Case,便于理解。 對應的論文為

【「大模型時代的基礎架構」閱讀體驗】+ 未知領域的感受
”,好奇于這種大模型算力中心到底是如何建設的,用什么設備、什么架構建設的?對這些問題真是一無所知,甚至都沒有想過,帶著這份好奇開始閱讀。
先瀏覽目錄,共分十三章,目錄中出現最多的就是GPU,比如機器學習
發表于 10-08 10:40
從千卡集群卡到萬卡集群,燧原科技打造更好的AI算力底座
:WAIC 2024)上,不僅有國內各大模型廠商同場競技,也有豐富的算力基礎設施展示,其中包括專注人工智能領域云端算力產品的燧原科技。 ? 燧原科技展臺 從千卡集群到萬

摩爾線程與智譜AI完成大模型性能測試與適配
近日,摩爾線程與智譜AI在人工智能領域開展了一輪深入的合作,共同對GPU大模型進行了適配及性能測試。此次測試不僅涵蓋了大模型的推理能力,還涉及了基于摩爾線程夸娥(KUAE)千
摩爾線程與師者AI攜手完成70億參數教育AI大模型訓練測試
近日,國內知名的GPU制造商摩爾線程與全學科教育AI大模型“師者AI”聯合宣布,雙方已成功完成了一項重要的大模型訓練測試。此次測試依托摩爾線
國產GPU可替代!摩爾線程千卡集群點亮新成就
摩爾線程、無問芯穹聯合宣布,雙方已經正式完成MT-infini-3B 3B(30億參數)規模大模型的實訓,基于摩爾線程國產全功能GPU MTT S4000組成的千卡集群,以及無問芯穹的

中國移動將商用三個自主可控萬卡集群
中國移動在近日舉辦的2024年算力網絡大會上宣布了重要計劃。據中國移動副總經理高同慶透露,公司今年將正式商用三個具有完全自主控制權的萬卡集群,分別位于哈爾濱、呼和浩特和貴陽。這三個集群
評論