在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

存算一體芯片如何支持Transformer等不同模型?

后摩智能 ? 來源:后摩智能 ? 2024-01-05 14:14 ? 次閱讀

后摩智能致力于打造通用人工智能芯片,自主研發(fā)的存算一體芯片在支持各類模型方面表現(xiàn)突出,包括YOLO系列網(wǎng)絡(luò)、BEV系列網(wǎng)絡(luò)、點云系列網(wǎng)絡(luò)等。這一系列芯片不僅在性能上有著顯著的優(yōu)勢,而且特別針對目前自動駕駛領(lǐng)域的算法進(jìn)行了專門的優(yōu)化。近期,后摩智能剛完成新一款技術(shù)驗證芯片的量產(chǎn)測試,屬于國內(nèi)首款基于存算一體架構(gòu)的7nm車規(guī)級技術(shù)驗證芯片,專為Transformer 等車端大模型設(shè)計。

當(dāng)前,自動駕駛等領(lǐng)域中,Transformer模型的應(yīng)用逐漸占據(jù)主導(dǎo)地位。這一架構(gòu)的優(yōu)勢在于其能夠更好地捕捉長距離依賴關(guān)系,有助于提高模型對復(fù)雜場景的理解和處理能力。面對Transformer在自動駕駛中的日益增長的需求,一個關(guān)鍵的問題浮現(xiàn)出來:存算一體芯片是否能夠高效部署Transformer模型?

Q1?存算一體芯片能高效部署Transformer嗎?

Transformer架構(gòu)是一種強(qiáng)大的神經(jīng)網(wǎng)絡(luò)架構(gòu),能夠?qū)崿F(xiàn)高效的序列建模和復(fù)雜的任務(wù)處理,它的核心組成部分包括多層感知機(jī)(MLP)和多頭注意力(MHA)。MLP是一種前饋神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu),由多個層次的神經(jīng)元組成,每一層都與上一層的所有神經(jīng)元相連。

這些神經(jīng)元通過權(quán)重進(jìn)行連接。MLP在Transformer中負(fù)責(zé)對輸入特征進(jìn)行變換和映射,幫助網(wǎng)絡(luò)捕捉不同層次的抽象特征;MHA允許網(wǎng)絡(luò)在不同位置對輸入序列的不同部分進(jìn)行關(guān)注,從而提高模型的并行性和全局信息的捕捉能力。MHA的基本思想是通過多個注意力頭(Attention Head)并行處理輸入序列,每個頭都學(xué)習(xí)關(guān)注輸入的不同方面。

這種并行性有助于有效地處理長序列,并使網(wǎng)絡(luò)更具擴(kuò)展性和泛化能力。在部署Transformer時,AI芯片的任務(wù)就是高效執(zhí)行網(wǎng)絡(luò)中的MLP和MHA結(jié)構(gòu)。這需要AI芯片能對其中所有算子都有很高的并行執(zhí)行能力。

Q2?多層感知機(jī)如何高效部署在存算一體芯片上?

全連接層的本質(zhì)是執(zhí)行兩個矩陣(輸入特征矩陣和權(quán)重矩陣)的矩陣乘法。我們將其中權(quán)重存放在存算單元上。將輸入的特征送入存算單元,由存算單元中的計算單元直接完成乘累加操作,輸出乘累加結(jié)果。由于存算單元的計算密度很高,執(zhí)行這種全連接層的并行度很高,因此效率很高。另一方面,權(quán)重被保持在存算單元上,不發(fā)生移動,從而大幅降低了搬移權(quán)重所帶來的能耗開銷。

多頭注意力是Transformer模型的一個關(guān)鍵組成部分,它有點像大腦的多個小模塊,每個模塊都負(fù)責(zé)關(guān)注輸入數(shù)據(jù)的不同方面。這個結(jié)構(gòu)之所以特別,是因為它包含了多個小“頭”,每個“頭”都在關(guān)注輸入數(shù)據(jù)的不同部分。

在處理輸入數(shù)據(jù)時,每個“頭”都有三個關(guān)鍵矩陣,分別是查詢(Q)、鍵(K)、和值(V)。通過一系列數(shù)學(xué)運算,多頭注意力可以捕捉到輸入序列中不同位置之間的關(guān)系。

關(guān)系計算:首先,我們讓查詢(Q)和鍵(K)進(jìn)行一種特殊的數(shù)學(xué)操作,就像在查找輸入數(shù)據(jù)中不同部分之間的聯(lián)系。這為模型提供了對輸入序列中不同位置的關(guān)注程度。

重要性映射:接著,我們通過一個函數(shù)(softmax)把剛才計算的結(jié)果映射到0到1之間,就好像在給不同位置分配注意力的“權(quán)重”,表示它們的相對重要性。

信息整合:最后,我們把剛才得到的歸一化的結(jié)果與值(V)進(jìn)行另一次數(shù)學(xué)操作,這樣就得到了最終輸出。這一步把被注意到的值通過權(quán)重相加,得到多頭注意力的最終輸出。

雖然這里提到的數(shù)學(xué)操作和全連接層有點相似,但在多頭注意力中,查詢、鍵、和值這三個矩陣是動態(tài)生成的。這就意味著在執(zhí)行數(shù)學(xué)操作時,需要靈活的加載數(shù)據(jù)到存算單元上,這一過程的效率對于處理器性能非常關(guān)鍵。

為了解決這個問題,后摩智能設(shè)計了高效的存算單元數(shù)據(jù)加載硬件。這可以極大地提高存算單元中數(shù)據(jù)的替換效率,確保在多頭注意力的計算中,動態(tài)產(chǎn)生的矩陣K、V能夠快速而高效地加載到存算單元中。這種巧妙的設(shè)計使得存算一體芯片能夠在執(zhí)行多頭注意力結(jié)構(gòu)時取得最佳性能,為Transformer模型的高效運行提供了強(qiáng)有力的支持。

除了計算密集型的全連接層和矩陣乘法之外,后摩智能的芯片還擁有大量的向量算力和標(biāo)量算力來處理其它算子,例如softmax和layernorm算子。為了充分利用這些算力資源,后摩智能采用了先進(jìn)的編譯優(yōu)化算法。這一算法的設(shè)計使得存算單元、向量單元和標(biāo)量單元能夠被同時調(diào)度,實現(xiàn)并行執(zhí)行不同的計算任務(wù)。這種并行計算的優(yōu)勢不僅僅體現(xiàn)在同一算子的多個實例之間,更在于不同算子之間的并發(fā)執(zhí)行。通過同時處理各個算子,后摩智能的芯片在運行Transformer時能夠達(dá)到最高的效率,極大地提升了整個計算過程的速度和效能。

綜合而言,后摩智能芯片以其先進(jìn)的設(shè)計理念和高效的存算一體架構(gòu),成功解決了對Transformer算法的高效支持問題。通過優(yōu)化全連接層、矩陣乘法和動態(tài)加載、向量和標(biāo)量運算等關(guān)鍵環(huán)節(jié),后摩智能為Transformer運行的高效性和性能提供了強(qiáng)大的支持,為自動駕駛等領(lǐng)域的發(fā)展注入了新的動力。未來,后摩智能的存算一體架構(gòu)芯片也將隨著算法與硬件的演進(jìn),不斷迭代,滿足萬物智能時代對算力的澎湃需求。






審核編輯:劉清

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 人工智能芯片
    +關(guān)注

    關(guān)注

    1

    文章

    121

    瀏覽量

    29597
  • 后摩智能
    +關(guān)注

    關(guān)注

    0

    文章

    33

    瀏覽量

    1334

原文標(biāo)題:存算十問|(九):存算一體芯片如何支持Transformer等不同模型?

文章出處:【微信號:后摩智能,微信公眾號:后摩智能】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關(guān)推薦
    熱點推薦

    蘋芯科技 N300 一體 NPU,開啟端側(cè) AI 新征程

    隨著端側(cè)人工智能技術(shù)的爆發(fā)式增長,智能設(shè)備對本地力與能效的需求日益提高。而傳統(tǒng)馮·諾依曼架構(gòu)在數(shù)據(jù)處理效率上存在瓶頸,“內(nèi)存墻”問題成為制約端側(cè)AI性能突破的關(guān)鍵掣肘。在這背景下,
    的頭像 發(fā)表于 05-06 17:01 ?300次閱讀
    蘋芯科技 N300 <b class='flag-5'>存</b><b class='flag-5'>算</b><b class='flag-5'>一體</b> NPU,開啟端側(cè) AI 新征程

    澎峰科技DeepSeek智一體機(jī)助力中小企業(yè)AI轉(zhuǎn)型

    澎峰科技推出的智先鋒 Deep Fusion DF系列大模型一體機(jī)是專為中小企業(yè)、事業(yè)單位以及對數(shù)據(jù)安全有極高要求的部門(財務(wù)、人力、研發(fā)、銷售)設(shè)計的高性能大
    的頭像 發(fā)表于 02-28 11:07 ?676次閱讀
    澎峰科技DeepSeek智<b class='flag-5'>算</b><b class='flag-5'>一體</b>機(jī)助力中小企業(yè)AI轉(zhuǎn)型

    濟(jì)南市中區(qū)一體化智中心上線DeepSeek

    濟(jì)南市中未來產(chǎn)業(yè)發(fā)展有限公司(簡稱“市中產(chǎn)發(fā)”)聯(lián)合華為、北京昇騰和清昴智能基于市中區(qū)一體化智中心(國家大學(xué)科技園節(jié)點)昇騰力部署D
    的頭像 發(fā)表于 02-19 10:38 ?602次閱讀

    梯度科技推出DeepSeek智一體機(jī)

    近日,梯度科技搭載DeepSeek大模型的智一體機(jī)正式發(fā)布。該產(chǎn)品基于“國產(chǎn)服務(wù)器+國產(chǎn)GPU+自主算法”核心架構(gòu),搭載梯度科技人工智能應(yīng)用開發(fā)平臺,形成了軟硬一體解決方案。
    的頭像 發(fā)表于 02-17 09:53 ?711次閱讀

    澎峰科技發(fā)布DeepSeek智一體機(jī)

    人工智能普惠化迎來里程碑式突破!澎峰科技發(fā)布業(yè)內(nèi)“首款”萬元級別DeepSeek智一體機(jī),本地運行671B滿血模型
    的頭像 發(fā)表于 02-15 16:29 ?1427次閱讀

    一體行業(yè)2024年回顧與2025年展望

    2024年,大模型技術(shù)的迅猛發(fā)展成為人工智能領(lǐng)域的核心驅(qū)動力,其對硬件力和存儲效率的極致需求,促使一體技術(shù)在全球范圍內(nèi)迎來前所未有的關(guān)
    的頭像 發(fā)表于 01-23 11:24 ?944次閱讀

    開源芯片系列講座第24期:基于SRAM的高效計算架構(gòu)

    鷺島論壇開源芯片系列講座第24期「基于SRAM的高效計算架構(gòu)」明晚(27日)20:00精彩開播期待與您云相聚,共襄學(xué)術(shù)盛宴!|直播信息報告題目基于SRAM
    的頭像 發(fā)表于 11-27 01:05 ?755次閱讀
    開源<b class='flag-5'>芯片</b>系列講座第24期:基于SRAM<b class='flag-5'>存</b><b class='flag-5'>算</b>的高效計算架構(gòu)

    直播預(yù)約 |開源芯片系列講座第24期:SRAM一體:賦能高能效RISC-V計算

    鷺島論壇開源芯片系列講座第24期「SRAM一體:賦能高能效RISC-V計算」11月27日(周三)20:00精彩開播期待與您云相聚,共襄學(xué)術(shù)盛宴!|直播信息報告題目SRAM
    的頭像 發(fā)表于 11-16 01:10 ?632次閱讀
    直播預(yù)約 |開源<b class='flag-5'>芯片</b>系列講座第24期:SRAM<b class='flag-5'>存</b><b class='flag-5'>算</b><b class='flag-5'>一體</b>:賦能高能效RISC-V計算

    一體化與邊緣計算:重新定義智能計算的未來

    、人工智能(AI)技術(shù)的發(fā)展,數(shù)據(jù)量的分布性、實時性需求增加,邊緣計算也逐漸從概念走向落地。本文將介紹一體化與邊緣計算的核心思想及其發(fā)展趨勢,探討兩者在智能
    的頭像 發(fā)表于 11-12 01:05 ?716次閱讀
    <b class='flag-5'>存</b><b class='flag-5'>算</b><b class='flag-5'>一體</b>化與邊緣計算:重新定義智能計算的未來

    一體架構(gòu)創(chuàng)新助力國產(chǎn)大力AI芯片騰飛

    在灣芯展SEMiBAY2024《AI芯片與高性能計算(HPC)應(yīng)用論壇》上,億鑄科技高級副總裁徐芳發(fā)表了題為《一體架構(gòu)創(chuàng)新助力國產(chǎn)大
    的頭像 發(fā)表于 10-23 14:48 ?775次閱讀

    科技新突破:首款支持多模態(tài)一體AI芯片成功問世

    一體介質(zhì),通過存儲單元和計算單元的深度融合,采用22nm成熟工藝制程,有效把控制造成本。與傳統(tǒng)架構(gòu)下的AI芯片相比,該款芯片
    發(fā)表于 09-26 13:51 ?627次閱讀
    科技新突破:首款<b class='flag-5'>支持</b>多模態(tài)<b class='flag-5'>存</b><b class='flag-5'>算</b><b class='flag-5'>一體</b>AI<b class='flag-5'>芯片</b>成功問世

    后摩智能首款一體智駕芯片獲評突出創(chuàng)新產(chǎn)品獎

    近日,2024年6月29日,由深圳市汽車電子行業(yè)協(xié)會主辦的「第十三屆國際汽車電子產(chǎn)業(yè)峰會暨2023年度汽車電子科學(xué)技術(shù)獎頒獎典禮」在深圳寶安隆重舉行。后摩智能首款一體智駕芯片——后
    的頭像 發(fā)表于 09-24 16:51 ?826次閱讀

    蘋芯科技引領(lǐng)存一體技術(shù)革新 PIMCHIP系列芯片重塑AI計算新格局

    一體NPU和PIMCHIP-S300多模態(tài)智能感知芯片,以前沿技術(shù)加持AI與大模型推理加速各類計算任務(wù)場景,為高能效力應(yīng)用開啟新紀(jì)元。?
    發(fā)表于 08-08 17:21 ?372次閱讀
    蘋芯科技引領(lǐng)存<b class='flag-5'>算</b><b class='flag-5'>一體</b>技術(shù)革新   PIMCHIP系列<b class='flag-5'>芯片</b>重塑AI計算新格局

    一體AI芯片企業(yè)后摩智能完成數(shù)億元戰(zhàn)略融資

    近日,國內(nèi)領(lǐng)先的一體AI 芯片創(chuàng)新企業(yè)后摩智能完成數(shù)億元人民幣的戰(zhàn)略融資,由中國移動旗下北京中移數(shù)字新經(jīng)濟(jì)產(chǎn)業(yè)基金、上海中移數(shù)字轉(zhuǎn)型產(chǎn)業(yè)基金(以下統(tǒng)稱“中國移動產(chǎn)業(yè)鏈發(fā)展基金”)共
    的頭像 發(fā)表于 07-15 15:32 ?744次閱讀

    后摩智能推出邊端大模型AI芯片M30,展現(xiàn)出一體架構(gòu)優(yōu)勢

    電子發(fā)燒友網(wǎng)報道(文/李彎彎)近日,后摩智能推出基于一體架構(gòu)的邊端大模型AI芯片——后摩漫界??M30,最高
    的頭像 發(fā)表于 07-03 00:58 ?5032次閱讀
    主站蜘蛛池模板: 免费高清在线观看a网站 | 国产片一级aaa毛片视频 | 美女网色站 | 国产激情片| 全部免费特黄特色大片视频 | 午夜在线观看视频在线播放版 | 在线播放视频网站 | 五月综合激情久久婷婷 | 中文网丁香综合网 | www.天天操 | 午夜精品视频 | 欧美特黄一免在线观看 | 妹子干综合网 | 日韩av线观看 | 人人操在线播放 | 天堂网色 | 激情综合激情五月 | 国产黄mmd在线观看免费 | 日本高清不卡视频 | 福利99| 亚洲四虎在线 | 老色歌uuu26 老湿成人影院 | 97伊人| 7777奇米影视| 最近2018中文字幕免费看在线 | 一级免费看 | bt天堂中文在线 | 欧美一级做一级做片性十三 | 欧美在线专区 | 免费的色网站 | 国产盗摄女子私密保健视频 | japanese 69hdxxxx日本| 五月天婷婷一区二区三区久久 | 禁漫画羞羞动漫入口 | 国产成人高清 | 国产二区三区毛片 | 欲色综合 | 性满足久久久久久久久 | 伊人网视频在线 | 午夜在线播放视频 | 午夜伦理片免费观看在线 |