電子發(fā)燒友網(wǎng)報道(文/李彎彎)AI框架是一種底層開發(fā)工具,是集深度學(xué)習(xí)核心訓(xùn)練和推理框架、基礎(chǔ)模型庫、端到端開發(fā)套件、豐富的工具組件于一體的平臺。
有了AI框架,工程師在工作時調(diào)試算法,就可以更快速、更高效。通俗一點講,AI框架相當(dāng)于是AI時代的操作系統(tǒng),如同PC時代Windows,移動互聯(lián)網(wǎng)時代的iOS和安卓。
AI框架發(fā)展現(xiàn)狀和趨勢
AI框架的歷史并不算長,從2010年誕生的Theano算起,至今不過十二年時間。2017年后,早期的Theano、Caffe、Torch等框架逐漸銷聲匿跡,2016年前后出現(xiàn)的TensorFlow(谷歌)、PyTorch(Facebook)、飛槳(百度)逐漸占據(jù)市場。
從目前市場占有情況看,產(chǎn)業(yè)界以TensorFlow為主,學(xué)術(shù)界以PyTorch為主。與TensorFlow過于注重工業(yè),PyTorch專注學(xué)界不同,飛槳的特性在于工業(yè)學(xué)界兩手抓,通過動態(tài)圖自動解析編譯靜態(tài)圖的技術(shù),兼顧了學(xué)界的靈活,同時也實現(xiàn)了產(chǎn)業(yè)界希望的高效。
除了TensorFlow、PyTorch、飛槳,深度學(xué)習(xí)框架還包括由Amazon設(shè)計研發(fā)并開源的MXNet、微軟在github上開源的CNTK、華為推出的MindSpore、北京一流科技有限公司開發(fā)的OneFlow,以及清華大學(xué)自研的Jittor,和騰訊、字節(jié)跳動、360開源的Angel、BytePS、TensorNet。
過去這些年,AI框架已形成較為完整的技術(shù)體系,當(dāng)前主流AI框架的核心技術(shù)演化出三大層次,分為基礎(chǔ)層、組件層和生態(tài)層,其中基礎(chǔ)層實現(xiàn)AI框架最基礎(chǔ)核心的功能,具體包括編程開發(fā)、編譯優(yōu)化以及硬件使能三個子層。
從技術(shù)生態(tài)體系中的功能定位看,AI框架對下調(diào)用底層硬件計算資源,對上支撐AI應(yīng)用算法模型搭建,提供算法工程化實現(xiàn)的標(biāo)準(zhǔn)環(huán)境,是AI技術(shù)體系的關(guān)鍵核心。
AI框架技術(shù)持續(xù)演進,歷經(jīng)萌芽階段、成長階段、穩(wěn)定階段,當(dāng)前已進入深化階段。AI框架正向著超大規(guī)模AI、全場景支持、安全可信等技術(shù)特性深化探索。
AI框架面臨的挑戰(zhàn)
然而在這個探索的過程中,面臨諸多挑戰(zhàn)。在超大規(guī)模AI方面,當(dāng)前超大規(guī)模AI成為新的深度學(xué)習(xí)范式。OpenAI于2020年5月發(fā)布GPT-3模型,包含1750億參數(shù),數(shù)據(jù)集達到45T,在多項NLP任務(wù)中超越了人類水平。這種超大規(guī)模的模型參數(shù)及超大規(guī)模的數(shù)據(jù)集的AI大模型范式,實現(xiàn)了深度學(xué)習(xí)新的突破。
產(chǎn)業(yè)界和學(xué)術(shù)界看到這種新型范式的潛力后紛紛入局,繼OpenAI后,華為基于MindSpore框架發(fā)布了盤古大模型、智源發(fā)布了悟道模型、阿里發(fā)布了M6模型、百度發(fā)布了文心模型等。超大規(guī)模AI正成為下一代人工智能的突破口,也是最有潛力的強人工智能技術(shù)。
超大規(guī)模AI需要大模型、大數(shù)據(jù)、大算力的三重支持,這就對AI框架提出了新的挑戰(zhàn),比如內(nèi)存墻,大模型訓(xùn)練過程中需要存儲參數(shù)、激活、梯度、優(yōu)化器狀態(tài),鵬程 . 盤古一個模型的訓(xùn)練就需要近4TB的內(nèi)存。算力墻,以鵬程 . 盤古2000億參數(shù)量的大模型為例,需要3.6EFLOPS的算力支持,要求必須構(gòu)建大規(guī)模的異構(gòu)AI計算集群才能滿足這樣的算力需求,同時算力平臺要滿足智能調(diào)度來提升算力資源的利用率。還有通信墻、調(diào)優(yōu)墻、部署墻等。
在全場景支持方面,隨著云服務(wù)器、邊緣設(shè)備、終端設(shè)備等人工智能硬件運算設(shè)備的不斷涌現(xiàn),以及各類人工智能運算庫、中間表示工具以及編程框架的快速發(fā)展,人工智能軟硬件生態(tài)呈現(xiàn)多樣化發(fā)展趨勢。但主流框架訓(xùn)練出來的模型卻不能通用,學(xué)術(shù)科研項目間難以合作延伸,造成了深度學(xué)習(xí)框架的“碎片化”。
目前業(yè)界并沒有統(tǒng)一的中間表示層標(biāo)準(zhǔn),導(dǎo)致各硬件廠商解決方案存在一定差異,以致應(yīng)用模型遷移不暢,增加了應(yīng)用部署難度。因此,基于AI框架訓(xùn)練出來的模型進行標(biāo)準(zhǔn)化互通將是未來的挑戰(zhàn)。
然而即使面臨諸多挑戰(zhàn),過去兩年,行業(yè)一直在持續(xù)探索,并取得一定突破,如2020年華為推出昇思MindSpore,在全場景協(xié)同、可信賴方面有一定的突破;曠視推出天元MegEngine,在訓(xùn)練推理一體化方面深度布局等。
整體而言,在人工智能體系中,AI框架處于貫通上下的腰部位置,下接芯片、上承應(yīng)用,是一個關(guān)鍵樞紐,是推動AI應(yīng)用大規(guī)模落地的關(guān)鍵力量。因此對于企業(yè)來說,克服AI框架當(dāng)前面臨的挑戰(zhàn),不斷探索新趨勢,進行技術(shù)創(chuàng)新,完善技術(shù)、功能和生態(tài)是關(guān)鍵。
有了AI框架,工程師在工作時調(diào)試算法,就可以更快速、更高效。通俗一點講,AI框架相當(dāng)于是AI時代的操作系統(tǒng),如同PC時代Windows,移動互聯(lián)網(wǎng)時代的iOS和安卓。
AI框架發(fā)展現(xiàn)狀和趨勢
AI框架的歷史并不算長,從2010年誕生的Theano算起,至今不過十二年時間。2017年后,早期的Theano、Caffe、Torch等框架逐漸銷聲匿跡,2016年前后出現(xiàn)的TensorFlow(谷歌)、PyTorch(Facebook)、飛槳(百度)逐漸占據(jù)市場。
從目前市場占有情況看,產(chǎn)業(yè)界以TensorFlow為主,學(xué)術(shù)界以PyTorch為主。與TensorFlow過于注重工業(yè),PyTorch專注學(xué)界不同,飛槳的特性在于工業(yè)學(xué)界兩手抓,通過動態(tài)圖自動解析編譯靜態(tài)圖的技術(shù),兼顧了學(xué)界的靈活,同時也實現(xiàn)了產(chǎn)業(yè)界希望的高效。
除了TensorFlow、PyTorch、飛槳,深度學(xué)習(xí)框架還包括由Amazon設(shè)計研發(fā)并開源的MXNet、微軟在github上開源的CNTK、華為推出的MindSpore、北京一流科技有限公司開發(fā)的OneFlow,以及清華大學(xué)自研的Jittor,和騰訊、字節(jié)跳動、360開源的Angel、BytePS、TensorNet。
過去這些年,AI框架已形成較為完整的技術(shù)體系,當(dāng)前主流AI框架的核心技術(shù)演化出三大層次,分為基礎(chǔ)層、組件層和生態(tài)層,其中基礎(chǔ)層實現(xiàn)AI框架最基礎(chǔ)核心的功能,具體包括編程開發(fā)、編譯優(yōu)化以及硬件使能三個子層。
從技術(shù)生態(tài)體系中的功能定位看,AI框架對下調(diào)用底層硬件計算資源,對上支撐AI應(yīng)用算法模型搭建,提供算法工程化實現(xiàn)的標(biāo)準(zhǔn)環(huán)境,是AI技術(shù)體系的關(guān)鍵核心。
AI框架技術(shù)持續(xù)演進,歷經(jīng)萌芽階段、成長階段、穩(wěn)定階段,當(dāng)前已進入深化階段。AI框架正向著超大規(guī)模AI、全場景支持、安全可信等技術(shù)特性深化探索。
AI框架面臨的挑戰(zhàn)
然而在這個探索的過程中,面臨諸多挑戰(zhàn)。在超大規(guī)模AI方面,當(dāng)前超大規(guī)模AI成為新的深度學(xué)習(xí)范式。OpenAI于2020年5月發(fā)布GPT-3模型,包含1750億參數(shù),數(shù)據(jù)集達到45T,在多項NLP任務(wù)中超越了人類水平。這種超大規(guī)模的模型參數(shù)及超大規(guī)模的數(shù)據(jù)集的AI大模型范式,實現(xiàn)了深度學(xué)習(xí)新的突破。
產(chǎn)業(yè)界和學(xué)術(shù)界看到這種新型范式的潛力后紛紛入局,繼OpenAI后,華為基于MindSpore框架發(fā)布了盤古大模型、智源發(fā)布了悟道模型、阿里發(fā)布了M6模型、百度發(fā)布了文心模型等。超大規(guī)模AI正成為下一代人工智能的突破口,也是最有潛力的強人工智能技術(shù)。
超大規(guī)模AI需要大模型、大數(shù)據(jù)、大算力的三重支持,這就對AI框架提出了新的挑戰(zhàn),比如內(nèi)存墻,大模型訓(xùn)練過程中需要存儲參數(shù)、激活、梯度、優(yōu)化器狀態(tài),鵬程 . 盤古一個模型的訓(xùn)練就需要近4TB的內(nèi)存。算力墻,以鵬程 . 盤古2000億參數(shù)量的大模型為例,需要3.6EFLOPS的算力支持,要求必須構(gòu)建大規(guī)模的異構(gòu)AI計算集群才能滿足這樣的算力需求,同時算力平臺要滿足智能調(diào)度來提升算力資源的利用率。還有通信墻、調(diào)優(yōu)墻、部署墻等。
在全場景支持方面,隨著云服務(wù)器、邊緣設(shè)備、終端設(shè)備等人工智能硬件運算設(shè)備的不斷涌現(xiàn),以及各類人工智能運算庫、中間表示工具以及編程框架的快速發(fā)展,人工智能軟硬件生態(tài)呈現(xiàn)多樣化發(fā)展趨勢。但主流框架訓(xùn)練出來的模型卻不能通用,學(xué)術(shù)科研項目間難以合作延伸,造成了深度學(xué)習(xí)框架的“碎片化”。
目前業(yè)界并沒有統(tǒng)一的中間表示層標(biāo)準(zhǔn),導(dǎo)致各硬件廠商解決方案存在一定差異,以致應(yīng)用模型遷移不暢,增加了應(yīng)用部署難度。因此,基于AI框架訓(xùn)練出來的模型進行標(biāo)準(zhǔn)化互通將是未來的挑戰(zhàn)。
然而即使面臨諸多挑戰(zhàn),過去兩年,行業(yè)一直在持續(xù)探索,并取得一定突破,如2020年華為推出昇思MindSpore,在全場景協(xié)同、可信賴方面有一定的突破;曠視推出天元MegEngine,在訓(xùn)練推理一體化方面深度布局等。
整體而言,在人工智能體系中,AI框架處于貫通上下的腰部位置,下接芯片、上承應(yīng)用,是一個關(guān)鍵樞紐,是推動AI應(yīng)用大規(guī)模落地的關(guān)鍵力量。因此對于企業(yè)來說,克服AI框架當(dāng)前面臨的挑戰(zhàn),不斷探索新趨勢,進行技術(shù)創(chuàng)新,完善技術(shù)、功能和生態(tài)是關(guān)鍵。
聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。
舉報投訴
-
AI
+關(guān)注
關(guān)注
88文章
34405瀏覽量
275679
發(fā)布評論請先 登錄
相關(guān)推薦
熱點推薦
AI演進的核心哲學(xué):使用通用方法,然后Scale Up!
作者:算力魔方創(chuàng)始人/英特爾創(chuàng)新大使劉力 一,AI演進的核心哲學(xué):通用方法 + 計算能力? Richard S. Sutton在《The Bitter Lesson》一文中提到,“回顧AI研究

在線研討會 @4/10 ASTRA?賦能邊緣 AI:探索 Synaptics SL &amp; SR 處理器的無限可能
邊緣AI:探索SynapticsSL&SR處理器的無限可能”主題研討會。介紹SynapticsASTRA系列AI處理器,包括SL和SR系列,全面解析其AI原生

《AI Agent 應(yīng)用與項目實戰(zhàn)》閱讀心得2——客服機器人、AutoGen框架 、生成式代理
及時處理。
第5章的斯坦福AI小鎮(zhèn)項目對生成式代理技術(shù)做出了開創(chuàng)性的探索。該項目的核心是將LLM與計算交互代理相結(jié)合,構(gòu)建了一個具有記憶、反思、規(guī)劃能力的智能體系統(tǒng)。在技術(shù)實現(xiàn)層面,記憶和檢索模塊采用
發(fā)表于 02-25 21:59
《AI Agent 應(yīng)用與項目實戰(zhàn)》第1-2章閱讀心得——理解Agent框架與Coze平臺的應(yīng)用
Operator 和 Deep Research 代表的第三層 Agent。
我對AI Agent的發(fā)展前景和未來應(yīng)用落地都持有非常樂觀的看法。
談回到本書,書中對Agent框架的闡述打破了我之前對其認(rèn)識
發(fā)表于 02-19 16:35
涂鴉Wukong AI硬件開發(fā)框架超強兼容DeepSeek等大模型,助你打造爆款AI硬件
一、什么是“Wukong”?涂鴉全新推出的“Wukong”AI硬件開發(fā)框架,是為實現(xiàn)AI硬件領(lǐng)域的商業(yè)化而專門開發(fā)設(shè)計的創(chuàng)新平臺。它基于TuyaOS所構(gòu)建,繼承了諸多優(yōu)勢,如跨平臺兼容性、模塊化

英飛凌AI服務(wù)器機架PSU的趨勢和功率演進
人工智能(AI)的迅猛發(fā)展推動了數(shù)據(jù)中心處理能力的顯著增長。如圖1所示,英飛凌預(yù)測單臺GPU的功耗將呈指數(shù)級上升,預(yù)計到2030年將達到約2000W [1],而AI服務(wù)器機架的峰值功耗將突破驚人

AI開發(fā)框架集成介紹
隨著AI應(yīng)用的廣泛深入,單一框架往往難以滿足多樣化的需求,因此,AI開發(fā)框架的集成成為了提升開發(fā)效率、促進技術(shù)創(chuàng)新的關(guān)鍵路徑。以下,是對AI
大語言模型開發(fā)框架是什么
大語言模型開發(fā)框架是指用于訓(xùn)練、推理和部署大型語言模型的軟件工具和庫。下面,AI部落小編為您介紹大語言模型開發(fā)框架。
RISC-V如何支持不同的AI和機器學(xué)習(xí)框架和庫?
RISC-V如何支持不同的AI和機器學(xué)習(xí)框架和庫?還請壇友們多多指教一下。
發(fā)表于 10-10 22:24
探索手機震動馬達的種類與應(yīng)用:技術(shù)演進與市場趨勢
手機震動馬達,作為手機中不可或缺的一個組件,扮演著提醒、通知和反饋的重要角色。然而,隨著技術(shù)的不斷發(fā)展和市場需求的變化,手機震動馬達也在不斷演進和多樣化。本文將深入分析手機震動馬達的種類、技術(shù)特點以及應(yīng)用場景,為讀者呈現(xiàn)手機震動馬達領(lǐng)域的最新動態(tài)。

簡述微處理器的發(fā)展歷史
微處理器的發(fā)展歷史是一部充滿創(chuàng)新與突破的技術(shù)演進史,它見證了計算機技術(shù)的飛速發(fā)展和人類社會的巨大變革。以下是對微處理器發(fā)展歷史的詳細(xì)回顧,內(nèi)容將涵蓋其關(guān)鍵節(jié)點、重要里程碑以及技術(shù)演進
英偉達推出Flextron AI框架:賦能靈活高效的AI模型部署
在人工智能與機器學(xué)習(xí)領(lǐng)域,隨著技術(shù)的不斷演進,模型的高效部署與適應(yīng)性成為研究的新熱點。近日,英偉達與德克薩斯大學(xué)奧斯汀分校攜手宣布了一項重大突破——推出了一種名為FLEXTRON的新型靈活模型架構(gòu)及訓(xùn)練后優(yōu)化框架,這一創(chuàng)新成果為AI
ai大模型和ai框架的關(guān)系是什么
AI大模型和AI框架是人工智能領(lǐng)域中兩個重要的概念,它們之間的關(guān)系密切且復(fù)雜。 AI大模型的定義和特點 AI大模型是指具有大量參數(shù)的深度學(xué)習(xí)
AI大模型與AI框架的關(guān)系
在探討AI大模型與AI框架的關(guān)系時,我們首先需要明確兩者的基本概念及其在人工智能領(lǐng)域中的角色。AI大模型通常指的是具有極大規(guī)模、高度復(fù)雜性和強大能力的人工智能系統(tǒng),它們能夠處理復(fù)雜的任
評論