由中國(guó)工程院信息與電子工程學(xué)部主辦,浪潮信息承辦,2021年人工智能計(jì)算大會(huì)(AICC)于北京成功召開。作為全球AI計(jì)算領(lǐng)域最具影響力的技術(shù)盛會(huì),本次大會(huì)以“智算·新際”為主題,邀請(qǐng)到眾多專家學(xué)者與產(chǎn)業(yè)領(lǐng)袖,就智能算力發(fā)展、人工智能產(chǎn)業(yè)創(chuàng)新以及產(chǎn)業(yè)數(shù)字化轉(zhuǎn)型展開精彩分享。燧原科技副總裁鄧輝先生受邀出席“AI芯片創(chuàng)新技術(shù)”分論壇,并就燧原科技如何立足于國(guó)產(chǎn)云端AI算力攻克通用性與性能雙重挑戰(zhàn)發(fā)表演講。
起點(diǎn)
長(zhǎng)期處于自主創(chuàng)新空白的云端訓(xùn)練AI算力一切要從2012年那場(chǎng)改變?nèi)斯ぶ悄馨l(fā)展史的ImageNet圖像分類競(jìng)賽開始談起。在當(dāng)時(shí)的比賽中,“深度學(xué)習(xí)之父”、圖靈獎(jiǎng)獲得者——多倫多大學(xué)Geoffrey Hinton教授首次提出深度卷積神經(jīng)網(wǎng)絡(luò)模型“AlexNet”,參數(shù)量達(dá)6000萬。AlexNet的出現(xiàn)是人工智能技術(shù)發(fā)展史上重要的轉(zhuǎn)折點(diǎn),它將沉寂已久的深度學(xué)習(xí)技術(shù)再次推至歷史舞臺(tái)。除了革命性的“大模型”,Geoffrey Hinton教授創(chuàng)新性地采用了異構(gòu)算力GPU作為訓(xùn)練加速資源。“AI加速”這個(gè)概念由此進(jìn)入廣大AI科研工作者與產(chǎn)業(yè)落地先鋒的視野。
新一輪技術(shù)文明由此開始,可這并沒有帶來我國(guó)自主創(chuàng)新AI算力的繁榮,一直以來,AI加速產(chǎn)品與技術(shù)都被GPU廠商所壟斷,尤其是在云端訓(xùn)練領(lǐng)域,由于云端數(shù)據(jù)中心整體架構(gòu)的高度復(fù)雜性、大規(guī)模分布式AI訓(xùn)練帶來的巨大挑戰(zhàn)及其本身要支撐的業(yè)務(wù)多樣性等原因,云端訓(xùn)練是國(guó)內(nèi)廠商切入難度最為高的一個(gè)領(lǐng)域,長(zhǎng)期處于空白的狀態(tài),燧原科技作為行業(yè)領(lǐng)頭羊于2019年發(fā)布邃思1.0云端訓(xùn)練芯片,開始了攻堅(jiān)技術(shù)壁壘、打破壟斷的征程。
挑戰(zhàn)
云端專用AI訓(xùn)練產(chǎn)品的性能與通用性互聯(lián)網(wǎng)是人工智能技術(shù)與產(chǎn)業(yè)發(fā)展的沃土,人工智能在互聯(lián)網(wǎng)的廣泛應(yīng)用得益于各類深入人們生活的終端應(yīng)用所產(chǎn)生的大量數(shù)據(jù),而云計(jì)算作為關(guān)鍵的底層技術(shù)支撐,正與互聯(lián)網(wǎng)共同以孿生體姿態(tài)不斷地蓬勃發(fā)展,為我們帶來了空前的數(shù)據(jù)井噴與突破人類認(rèn)知的巨量模型,對(duì)超強(qiáng)算力產(chǎn)生了爆炸性的需求;傳統(tǒng)GPU架構(gòu)雖然早期開創(chuàng)了人工智能發(fā)展的篇章,但隨著人工智能產(chǎn)業(yè)蓬勃發(fā)展,在規(guī)模效應(yīng)的驅(qū)使下,DSA架構(gòu)帶來的更經(jīng)濟(jì)的成本與更高效的計(jì)算能力使得專用AI訓(xùn)練產(chǎn)品變得越來越有優(yōu)勢(shì)。然而由于專用AI訓(xùn)練產(chǎn)品天生缺乏生態(tài)積累,在模型泛化與通用性上一直是業(yè)界痛點(diǎn)。因此如何保證比GPU更高效的AI模型計(jì)算能力,同時(shí)兼顧一定的通用性是云端AI訓(xùn)練芯片面臨的最大挑戰(zhàn)。燧原科技副總裁鄧輝先生表示:“我們把性能與通用性作為產(chǎn)品成功最重要的衡量標(biāo)準(zhǔn),經(jīng)過3年的努力,這兩方面的能力在我們第二代產(chǎn)品上取得飛躍。”
燧原
中國(guó)首家發(fā)布二代云端訓(xùn)練加速產(chǎn)品組合的企業(yè)燧原科技以助力發(fā)展我國(guó)集成電路和人工智能產(chǎn)業(yè)、推動(dòng)AI算力普惠化為使命,秉承“做大芯片、拼硬科技”的原則,自2019年12月推出第一代云端訓(xùn)練芯片邃思1.0以后,率先實(shí)現(xiàn)國(guó)產(chǎn)AI芯片數(shù)據(jù)中心與千卡液冷集群的商業(yè)落地,并于2021年7月在世界人工智能大會(huì)(WAIC)發(fā)布邃思2.0,是中國(guó)唯一一家推出二代云端訓(xùn)練加速產(chǎn)品組合的企業(yè)。
基于燧原科技自研的GCU-CARE計(jì)算引擎,邃思2.0進(jìn)行了大規(guī)模的架構(gòu)升級(jí),針對(duì)人工智能計(jì)算的特性進(jìn)行深度優(yōu)化,夯實(shí)了支持通用異構(gòu)計(jì)算的基礎(chǔ)。支持全面的計(jì)算精度,涵蓋從FP32、TF32、FP16、BF16到INT8;并在單精度算力方面達(dá)到與7nm GPU相當(dāng)?shù)男阅芩剑簡(jiǎn)尉菷P32峰值算力最高達(dá)到40 TFLOPS,單精度張量TF32峰值算力最高達(dá)到160 TFLOPS,大大提高了能效比。同時(shí)搭載了4顆HBM2E片上存儲(chǔ)芯片,高配支持64 GB內(nèi)存,帶寬最高可達(dá)1.8 TB/s。GCU-LARE也全面升級(jí),提供雙向300 GB/s互聯(lián)帶寬,支持?jǐn)?shù)千張?jiān)旗軨loudBlazer加速卡互聯(lián),實(shí)現(xiàn)優(yōu)異的線性加速比。
而同步升級(jí)的馭算TopsRider軟件平臺(tái),成為燧原科技構(gòu)建原始創(chuàng)新軟件生態(tài)的基石。通過軟硬件協(xié)同架構(gòu)設(shè)計(jì),充分發(fā)揮邃思2.0的性能;基于算子泛化技術(shù)及圖優(yōu)化策略,支持主流深度學(xué)習(xí)框架下的各類模型訓(xùn)練;利用Horovod分布式訓(xùn)練框架與GCU-LARE互聯(lián)技術(shù)相互配合,為超大規(guī)模集群的高效運(yùn)行提供解決方案。開放升級(jí)的編程模型和可擴(kuò)展的算子接口,為客戶模型的優(yōu)化提供了自定義的開發(fā)能力。
基于邃思2.0,燧原科技推出了云燧T20人工智能訓(xùn)練加速卡與云燧T21人工智能訓(xùn)練OAM模組,能夠通過300GB/s的獨(dú)立片間互聯(lián)通道提供靈活的多芯片算力擴(kuò)展方案,支持單機(jī)多卡、單機(jī)柜多節(jié)點(diǎn)、多機(jī)柜大機(jī)群多種部署方式。
未來
更多的AI解決方案與產(chǎn)品孵化除了強(qiáng)勁的原始創(chuàng)新芯片支撐,AI算力的騰飛與人工智能產(chǎn)業(yè)的發(fā)展需要依托于健全的生態(tài)合作體系。在演講的最后,燧原科技副總裁鄧輝先生表示:“未來,我們期望在人工智能領(lǐng)域和浪潮以及更多的合作伙伴一起合作打造更多AI解決方案和產(chǎn)品,助力中國(guó)AI產(chǎn)業(yè)蓬勃發(fā)展。”
責(zé)任編輯:haq
-
芯片
+關(guān)注
關(guān)注
459文章
52090瀏覽量
435316 -
AI
+關(guān)注
關(guān)注
87文章
33998瀏覽量
275002 -
燧原科技
+關(guān)注
關(guān)注
0文章
136瀏覽量
8810
原文標(biāo)題:原始創(chuàng)新架構(gòu)助力云端AI算力騰飛
文章出處:【微信號(hào):gh_1222367b8780,微信公眾號(hào):燧原科技Enflame】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
弘信電子旗下燧弘華創(chuàng)與聯(lián)想發(fā)布多元異構(gòu)算力調(diào)度平臺(tái)
DeepSeek推動(dòng)AI算力需求:800G光模塊的關(guān)鍵作用
燧原技術(shù)伙伴培育計(jì)劃第二期開啟
智算中心會(huì)取代通用算力中心嗎?

北電數(shù)智前進(jìn)·AI異構(gòu)計(jì)算平臺(tái),繪制國(guó)產(chǎn)算力商業(yè)化落地新藍(lán)圖
迅為瑞芯微RK3576開發(fā)板大小架構(gòu)集成6TOPS算力NPU
燧原科技入選先進(jìn)計(jì)算賦能新質(zhì)生產(chǎn)力典型應(yīng)用案例
存算一體架構(gòu)創(chuàng)新助力國(guó)產(chǎn)大算力AI芯片騰飛
燧弘華創(chuàng)助力慶陽構(gòu)建算力產(chǎn)業(yè)生態(tài)
燧原科技啟動(dòng)IPO輔導(dǎo),加速AI算力底座布局
蘭洋科技與燧原科技深化江蘇地區(qū)智算合作 共筑算力基石
燧原科技與銳捷網(wǎng)絡(luò)攜手共筑AI數(shù)據(jù)中心高性能網(wǎng)絡(luò)新紀(jì)元
燧原科技與銳捷網(wǎng)絡(luò)達(dá)成合作,共創(chuàng)智算中心AIGC網(wǎng)絡(luò)解決方案
從千卡集群卡到萬卡集群,燧原科技打造更好的AI算力底座

專注為通用人工智能算力底座筑基,燧原科技連續(xù)五年參加世界人工智能大會(huì)

評(píng)論