自2018年谷歌發(fā)布BERT以來(lái),預(yù)訓(xùn)練大模型經(jīng)過(guò)幾年的發(fā)展,以強(qiáng)大的算法效果,席卷了以NLP為代表的各大AI榜單與測(cè)試數(shù)據(jù)集。2020年OpenAI發(fā)布的NLP大模型GPT-3,實(shí)現(xiàn)了千億級(jí)參數(shù)。BERT、GPT的強(qiáng)大能力成為AI領(lǐng)域里程碑式的存在,大模型的顯著優(yōu)勢(shì),也讓產(chǎn)業(yè)界巨頭與機(jī)構(gòu)紛紛參與其中。
大模型優(yōu)秀的泛化能力、通用AI的能力、高精度、覆蓋多業(yè)務(wù)場(chǎng)景等優(yōu)勢(shì),降低了AI開(kāi)發(fā)與應(yīng)用的門(mén)檻,也讓“煉大模型”也成為AI產(chǎn)業(yè)的潮流。但有了算力、有了大模型,AI產(chǎn)業(yè)創(chuàng)新與落地應(yīng)用就無(wú)憂無(wú)慮了嗎?答案并沒(méi)有這么簡(jiǎn)單,很多產(chǎn)業(yè)需求是無(wú)法用通用模型來(lái)處理的,技術(shù)理論與應(yīng)用場(chǎng)景之間仍然存在著代溝;一些超大規(guī)模模型在部署時(shí)也會(huì)面臨一系列問(wèn)題,如算力、調(diào)參難度、硬件兼容性等。
如何讓大模型走出實(shí)驗(yàn)室,走向產(chǎn)業(yè),推動(dòng)行業(yè)的創(chuàng)新,成為橫亙?cè)贏I廠商面前的難題。那么,大模型該如何完成自身的進(jìn)化,去適配使用場(chǎng)景、進(jìn)一步推動(dòng)AI產(chǎn)業(yè)的發(fā)展呢?在這方面,華為有一些方法與路徑值得借鑒與思考。
從刷分轉(zhuǎn)向全面可用
預(yù)訓(xùn)練大模型是AI持續(xù)變革的動(dòng)力與核心發(fā)展方向之一,隨著AI不斷深入產(chǎn)業(yè)與各學(xué)科領(lǐng)域的過(guò)程中,科研院所及各大企業(yè)間開(kāi)始了大模型軍備battle,模型的類型朝著多樣化、參數(shù)規(guī)模朝著極致化的方向發(fā)展。
百家爭(zhēng)鳴中,我們看到模型參數(shù)規(guī)模越來(lái)越大,數(shù)據(jù)集紀(jì)錄不斷被刷新。但在真正的產(chǎn)業(yè)空間里,卻很難看到大模型規(guī)模化的應(yīng)用。拼模型參數(shù),拼下游任務(wù)打榜成績(jī),是廠商推出大模型后標(biāo)榜實(shí)力的慣常操作。然而到拼落地應(yīng)用的時(shí)候,許多廠商的大模型卻緘默了。
從高分到高能,大模型距離現(xiàn)實(shí)中的產(chǎn)業(yè)場(chǎng)景還有不短的路程要走。讓大模型從“刷分”走向千行百業(yè),需要一場(chǎng)全面的轉(zhuǎn)型。
為了更好地推動(dòng)大模型的發(fā)展,華為推出了人工智能大模型全流程使能體系,該體系包含從大模型規(guī)劃、開(kāi)發(fā)到產(chǎn)業(yè)化全流程,加速大模型產(chǎn)業(yè)化進(jìn)程。
在產(chǎn)業(yè)界基于昇騰AI先后推出鵬程.盤(pán)古、鵬程.神農(nóng)、紫東.太初、武漢.LuoJia、華為云盤(pán)古系列等有影響力的大模型后,為進(jìn)一步鼓勵(lì)大模型的研究與創(chuàng)新,華為推出了昇騰科研創(chuàng)新使能計(jì)劃,通過(guò)資金、算力、技術(shù)和社區(qū)的扶持,鼓勵(lì)高校及科研院所基于昇騰大模型沙盤(pán),開(kāi)展大模型的研究和創(chuàng)新,在前沿領(lǐng)域和熱點(diǎn)行業(yè)打造出世界級(jí)領(lǐng)先的大模型。
為了讓大模型易開(kāi)發(fā)、易適配、易部署,針對(duì)基礎(chǔ)模型開(kāi)發(fā),華為推出基于昇思MindSpore的大模型開(kāi)發(fā)套件,通過(guò)算法開(kāi)發(fā)、并行計(jì)算、存儲(chǔ)優(yōu)化、斷點(diǎn)續(xù)訓(xùn)等技術(shù),實(shí)現(xiàn)大模型的高效開(kāi)發(fā)與部署。
從科研創(chuàng)新到行業(yè)落地,華為與產(chǎn)業(yè)伙伴一起成立了智能遙感開(kāi)源生態(tài)聯(lián)盟和多模態(tài)人工智能產(chǎn)業(yè)聯(lián)盟等,目前已經(jīng)有70余家合作伙伴陸續(xù)孵化出多個(gè)行業(yè)解決方案,未來(lái)華為還會(huì)聯(lián)合伙伴成立AI流體力學(xué)、AI生物醫(yī)藥及智慧生物育種等產(chǎn)業(yè)聯(lián)盟,助力相關(guān)領(lǐng)域的大模型創(chuàng)新和產(chǎn)業(yè)化發(fā)展。
大模型全流程使能體系不僅為大模型的研發(fā)與創(chuàng)新帶來(lái)生長(zhǎng)的土壤,也促進(jìn)著生態(tài)伙伴基于已有大模型孵化更多行業(yè)應(yīng)用,同時(shí),大模型也會(huì)得到行業(yè)更豐富的數(shù)據(jù)和更泛化應(yīng)用場(chǎng)景的反哺。在良性循環(huán)的過(guò)程中,大模型從而生長(zhǎng)得更加茁壯,能夠真正枝繁葉茂地賦能產(chǎn)業(yè)。
從宏觀的使能體系中,我們能夠感知到大模型賦能千行百業(yè)的實(shí)力與價(jià)值;在微觀個(gè)體中,透過(guò)大模型的代表紫東.太初,我們也能夠看到其帶來(lái)的產(chǎn)業(yè)之變。
紫東.太初的開(kāi)發(fā)之根
現(xiàn)階段,產(chǎn)學(xué)研界的大模型主要集中在NLP和CV領(lǐng)域。行業(yè)內(nèi)傳統(tǒng)的以文本、圖像為主的單模態(tài)或雙模態(tài)預(yù)訓(xùn)練模型,覆蓋的范圍與滿足的需求有限,不能充分發(fā)揮數(shù)據(jù)生產(chǎn)力,限制了下一階段AI 的應(yīng)用創(chuàng)新。多模態(tài)大模型應(yīng)運(yùn)而生,打通圖像、文本、語(yǔ)音等不同模態(tài)數(shù)據(jù)的協(xié)同轉(zhuǎn)化,進(jìn)而使AI應(yīng)用更貼合人類行為習(xí)慣與現(xiàn)實(shí)需求,成為當(dāng)前人工智能行業(yè)攻堅(jiān)點(diǎn)之一。
紫東.太初是全球首個(gè)三模態(tài)千億參數(shù)大模型,作為多模態(tài)模型的代表,正在全力助推AI研發(fā)規(guī)則和產(chǎn)業(yè)應(yīng)用模式變革,加速各行業(yè)智能化轉(zhuǎn)型實(shí)踐。在7月29日-31日的首屆中國(guó)算力大會(huì)上,“紫東.太初”大模型榮獲“DC Tech創(chuàng)新先鋒”優(yōu)秀成果獎(jiǎng)。
創(chuàng)新先鋒優(yōu)秀成果獎(jiǎng)評(píng)選大模型的維度嚴(yán)謹(jǐn)并全面,無(wú)論是技術(shù)、系統(tǒng),還是應(yīng)用賦能等方面,都是重點(diǎn)考量的因素。紫東.太初大模型被業(yè)界認(rèn)可,成為標(biāo)桿引領(lǐng)多模態(tài)大模型,能夠保持優(yōu)秀并持續(xù)創(chuàng)新的前提,源于其強(qiáng)壯的AI根技術(shù),在AI框架、AI算力等層面滿足大模型的“創(chuàng)新”需求。
紫東.太初是中科院自動(dòng)化所以昇騰AI基礎(chǔ)軟硬件為基礎(chǔ),基于全場(chǎng)景AI框架昇思MindSpore打造的三模態(tài)模型,紫東.太初兼具跨模態(tài)理解和生成能力,與單模態(tài)和圖文兩模態(tài)相比,其采用一個(gè)大模型就可以靈活支撐圖-文-音全場(chǎng)景AI應(yīng)用,具有在無(wú)監(jiān)督情況下多任務(wù)聯(lián)合學(xué)習(xí)、并快速遷移到不同領(lǐng)域數(shù)據(jù)的強(qiáng)大能力。
紫東.太初目前已經(jīng)具備領(lǐng)先的圖文音跨模態(tài)理解與生成能力,可輕松完成智能問(wèn)答、圖片生成、視頻理解與等任務(wù),這些能力將在工業(yè)質(zhì)檢、影視創(chuàng)作、互聯(lián)網(wǎng)推薦、智能駕駛等領(lǐng)域廣泛應(yīng)用。例如在紡織工業(yè)生產(chǎn)線中的應(yīng)用案例中,紫東.太初融合多模態(tài)信息,可以通過(guò)聲音識(shí)別來(lái)判斷紡織機(jī)運(yùn)轉(zhuǎn)過(guò)程中斷經(jīng)和斷緯的情形,同時(shí)通過(guò)視覺(jué)識(shí)別來(lái)判斷布匹的缺陷,展示出綜合研判的能力和廣闊的應(yīng)用前景。
由于三模態(tài)大模型非常接近人類的信息處理方式,其對(duì)信息數(shù)據(jù)有非常好的協(xié)同掌握能力,因此可以非常廣泛地應(yīng)用于產(chǎn)學(xué)各領(lǐng)域,孵化出更多新應(yīng)用。新華社技術(shù)局、長(zhǎng)安汽車、中國(guó)移動(dòng)、千博手語(yǔ)等企業(yè)通過(guò)加盟多模態(tài)人工智能產(chǎn)業(yè)聯(lián)盟,將開(kāi)源的多模態(tài)大模型與自身業(yè)務(wù)融合創(chuàng)新,基于紫東.太初陸續(xù)孵化出新媒體內(nèi)容檢索平臺(tái)、智能座艙、南宋御街?jǐn)?shù)字人、手語(yǔ)教考一體機(jī)等場(chǎng)景化行業(yè)應(yīng)用,充分展現(xiàn)了大模型的潛力與產(chǎn)業(yè)價(jià)值。
從大模型技術(shù)深處挖掘,我們會(huì)發(fā)現(xiàn)紫東.太初的打造,得益于昇騰AI的產(chǎn)業(yè)底座,尤其是昇思對(duì)大模型的原生支持,讓大模型具備了快速開(kāi)發(fā)、極簡(jiǎn)訓(xùn)練的“開(kāi)發(fā)之根”。
澆灌創(chuàng)新之花
從昇思AI框架中汲取“創(chuàng)新”的營(yíng)養(yǎng)澆灌大模型,是使能其發(fā)展的關(guān)鍵。昇思 MindSpore 在進(jìn)行架構(gòu)設(shè)計(jì)時(shí)就考慮了大模型開(kāi)發(fā)時(shí)遇到的內(nèi)存占用、通信瓶頸、調(diào)試復(fù)雜、部署難等問(wèn)題,針對(duì)性進(jìn)行技術(shù)研究與創(chuàng)新。
在大模型支持方面,昇思實(shí)現(xiàn)了原生支持大模型,能夠在業(yè)界率先支持全自動(dòng)并行計(jì)算。在大模型訓(xùn)練中,可以同時(shí)使用數(shù)據(jù)并行、算子級(jí)模型并行、Pipeline 模型并行、優(yōu)化器模型并行、異構(gòu)并行、重計(jì)算、高效內(nèi)存復(fù)用多維度、全種類的分布式并行策略;原創(chuàng)集群拓?fù)涓兄亩嗑S度自動(dòng)混合并行,實(shí)現(xiàn)超大模型自動(dòng)切分、并行計(jì)算,顯著提升集群加速能力;新的 DNN分布式并行編程范式,可以實(shí)現(xiàn)低代碼算法切換,大幅節(jié)省開(kāi)發(fā)時(shí)間。
在科研創(chuàng)新和應(yīng)用領(lǐng)域,昇思面向 8 大科學(xué)計(jì)算場(chǎng)景推出 MindSpore Science 系列套件,其包含業(yè)界領(lǐng)先的數(shù)據(jù)集、基礎(chǔ)模型、預(yù)置高精度模型和前后處理工具,可以加速科學(xué)行業(yè)應(yīng)用開(kāi)發(fā)。
面向產(chǎn)業(yè)生態(tài)的開(kāi)放,昇思正在與產(chǎn)學(xué)研各界一同推進(jìn)開(kāi)源開(kāi)放,昇思 MindSpore AI 框架已經(jīng)成為大模型開(kāi)發(fā)的技術(shù)支撐,開(kāi)源開(kāi)放更使得產(chǎn)學(xué)界可以基于它研發(fā)自己的大模型。昇騰社區(qū)和昇思MindSpore社區(qū)一直在加強(qiáng)對(duì)大模型開(kāi)源開(kāi)放的支持。截至7月,昇思社區(qū)下載量已經(jīng)突破200萬(wàn),社區(qū)貢獻(xiàn)者超過(guò)5900人。
目前,華為聯(lián)合科研機(jī)構(gòu)和產(chǎn)業(yè)界,基于昇思 MindSpore AI 框架與昇騰 AI 強(qiáng)大算力,不斷發(fā)展基礎(chǔ)大模型和行業(yè)大模型的產(chǎn)業(yè)生態(tài),賦能千行百業(yè)數(shù)字化、智能化。
例如,鵬城實(shí)驗(yàn)室基于昇思 MindSpore 先后推出了業(yè)界首個(gè) 2000 億參數(shù)中文預(yù)訓(xùn)練語(yǔ)言模型鵬程.盤(pán)古和面向生物醫(yī)學(xué)領(lǐng)域的鵬程.神農(nóng)大模型,深度賦能文本生成領(lǐng)域與生物制藥;武漢大學(xué)在嵌入昇思MindSpore先進(jìn)技術(shù)特性后打造了全球首個(gè)遙感影像智能解譯專用框架武漢.LuoJiaNet和業(yè)界最大遙感樣本庫(kù)武漢.LuoJiaSET,為遙感應(yīng)用開(kāi)發(fā)提供便利。
從根技術(shù)創(chuàng)新提升大模型的性能,到賦能不同科學(xué)計(jì)算行業(yè)應(yīng)用的加速開(kāi)發(fā),大模型全流程使能體系的構(gòu)建,產(chǎn)業(yè)生態(tài)的開(kāi)源開(kāi)放與架橋連接,基于昇騰AI軟硬協(xié)同的技術(shù)創(chuàng)新與產(chǎn)業(yè)服務(wù)助力,大模型的創(chuàng)新與產(chǎn)業(yè)落地之路越來(lái)越寬敞,加速各行業(yè)智能化轉(zhuǎn)型實(shí)踐,未來(lái)會(huì)有更多不同領(lǐng)域的原創(chuàng)技術(shù)成果誕生。
華為為大模型確立了從研致用的范式,推動(dòng)大模型走向服務(wù)產(chǎn)業(yè)的新階段,不同的行業(yè)在各類應(yīng)用場(chǎng)景中驗(yàn)證著大模型的能力。遍地花開(kāi)的成果,離不開(kāi)昇騰 AI 提供的強(qiáng)大算力底座與昇思 MindSpore AI 框架的賦能,澆灌著大模型的研發(fā)與創(chuàng)新,為其注入活力與生命力,大模型的產(chǎn)業(yè)之花得以在數(shù)智時(shí)代的原野中爭(zhēng)奇斗艷,盎然生機(jī),一幅智慧生活的圖景正在徐徐展開(kāi)。
-
華為
+關(guān)注
關(guān)注
216文章
34547瀏覽量
253152 -
算法
+關(guān)注
關(guān)注
23文章
4631瀏覽量
93427 -
AI
+關(guān)注
關(guān)注
87文章
31711瀏覽量
270505 -
nlp
+關(guān)注
關(guān)注
1文章
489瀏覽量
22117 -
昇騰
+關(guān)注
關(guān)注
1文章
137瀏覽量
6662 -
昇騰AI
+關(guān)注
關(guān)注
0文章
80瀏覽量
621 -
大模型
+關(guān)注
關(guān)注
2文章
2603瀏覽量
3215
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
AI開(kāi)發(fā)平臺(tái)模型怎么用
中軟國(guó)際科創(chuàng)中心上線DeepSeek模型
昇騰AI創(chuàng)新大賽2024總決賽圓滿落幕
![<b class='flag-5'>昇</b><b class='flag-5'>騰</b><b class='flag-5'>AI</b><b class='flag-5'>創(chuàng)新</b>大賽2024總決賽圓滿落幕](https://file1.elecfans.com/web3/M00/03/A3/wKgZO2dqeeyAESmsAAEJ0mHbg3U800.png)
AI大語(yǔ)言模型開(kāi)發(fā)步驟
迅龍軟件受邀參加華為昇思人工智能框架峰會(huì),展示昇思X香橙派的創(chuàng)新AI案例
![迅龍軟件受邀參加華為<b class='flag-5'>昇</b>思人工智能框架峰會(huì),展示<b class='flag-5'>昇</b>思X香橙派的<b class='flag-5'>創(chuàng)新</b><b class='flag-5'>AI</b>案例](https://file1.elecfans.com/web3/M00/02/A5/wKgZPGdhTEOALAw1AADKiqYXJow990.png)
商湯參與基于昇思AI框架的大模型原生開(kāi)發(fā)成果發(fā)布
谷東科技民航維修智能決策大模型榮獲華為昇騰技術(shù)認(rèn)證
昇騰與昇思原生,助力智譜打造自主創(chuàng)新大模型體系!
![<b class='flag-5'>昇</b><b class='flag-5'>騰</b>與<b class='flag-5'>昇</b>思原生,助力智譜打造自主<b class='flag-5'>創(chuàng)新</b>大<b class='flag-5'>模型</b>體系!](https://file1.elecfans.com/web2/M00/03/8E/wKgZombEb_yAeStIAADUAA7ZV4E970.png)
香橙派亮相昇騰AI開(kāi)發(fā)者創(chuàng)享日,打造“AI+鴻蒙”高算力開(kāi)發(fā)板
![香橙派亮相<b class='flag-5'>昇</b><b class='flag-5'>騰</b><b class='flag-5'>AI</b><b class='flag-5'>開(kāi)發(fā)</b>者創(chuàng)享日,打造“<b class='flag-5'>AI</b>+鴻蒙”高算力<b class='flag-5'>開(kāi)發(fā)</b>板](https://file1.elecfans.com/web2/M00/F8/57/wKgZomaHoT-AZsUHAADCTQvh0Fw669.png)
基于昇騰AI Yolov7模型遷移到昇騰平臺(tái)EA500I邊緣計(jì)算盒子的實(shí)操指南
![基于<b class='flag-5'>昇</b><b class='flag-5'>騰</b><b class='flag-5'>AI</b> Yolov7<b class='flag-5'>模型</b>遷移到<b class='flag-5'>昇</b><b class='flag-5'>騰</b>平臺(tái)EA500I邊緣計(jì)算盒子的實(shí)操指南](https://file1.elecfans.com/web2/M00/F3/1E/wKgZomZ742OAfwABAAEg1AXWtSo339.png)
華為云昇騰AI云服務(wù)可適配100多個(gè)大模型
畢昇大模型應(yīng)用開(kāi)發(fā)平臺(tái)+浪潮信息AIStation,讓大模型定制更簡(jiǎn)單
![畢<b class='flag-5'>昇</b>大<b class='flag-5'>模型</b>應(yīng)用<b class='flag-5'>開(kāi)發(fā)</b>平臺(tái)+浪潮信息AIStation,讓大<b class='flag-5'>模型</b>定制更簡(jiǎn)單](https://file1.elecfans.com//web2/M00/EC/B9/wKgaomZf4mOAbz4-AABMEiuZ0YY104.jpg)
華為發(fā)布會(huì)大模型翻車?昇騰社區(qū)回應(yīng)!
![華為發(fā)布會(huì)大<b class='flag-5'>模型</b>翻車?<b class='flag-5'>昇</b><b class='flag-5'>騰</b>社區(qū)回應(yīng)!](https://file1.elecfans.com/web2/M00/E6/DA/wKgaomZFo36AYOPDAAGROM2k2h0790.jpg)
評(píng)論