在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

算力不足和能效過低,有什么方法提高AI芯片的算力呢?

sanyue7758 ? 來源:EETOP ? 2023-10-22 09:17 ? 次閱讀

隨著ChatGPT強勢來襲,AI人工智能應(yīng)用層出不窮。智能化時代,數(shù)據(jù)量指數(shù)型增長,摩爾定律已經(jīng)不能滿足當前的數(shù)據(jù)處理需求,元器件的物理尺寸已經(jīng)接近極限。人工智能的硬件平臺面臨兩大艱巨挑戰(zhàn):算力不足和能效過低。那么,有什么方法提高芯片的算力呢?

其實關(guān)鍵還是在于系統(tǒng)設(shè)計和芯片加工。系統(tǒng)設(shè)計,重在高性能微架構(gòu)和先進算術(shù)運算,芯片加工則有賴于先進工藝制程和先進封裝制備。今年9月份的時候,EETOP曾從運算機制的角度,探討了計算芯片算力的提升。本期,我們試著從芯片架構(gòu)方面,繼續(xù)探討芯片算力提升的話題。

計算芯片架構(gòu)趨勢:存算一體

現(xiàn)在,無論是CPU還是GPU,采用的都是70年前的馮.諾伊曼體系架構(gòu)。馮諾依曼體系結(jié)構(gòu)是現(xiàn)代計算機的基礎(chǔ)。在馮諾依曼架構(gòu)中,計算和存儲功能分別由中央處理器和存儲器完成。計算機的 CPU 和存儲器是相互獨立發(fā)展的,也就是CPU和內(nèi)存是在不同芯片上的,它們之間的通信要通過總線來進行。數(shù)據(jù)量少的時候沒問題,但一旦數(shù)據(jù)變多,總線本身就會擁擠成為瓶頸。而現(xiàn)在的GPU,并行處理能力越來越強。當數(shù)據(jù)傳輸速度不夠時,就會限制算力的天花板, 嚴重影響目標應(yīng)用程序的功率和性能。

546e0790-7031-11ee-939d-92fbcf53809c.png

業(yè)界很多也都在研究相關(guān)的解決方案,以實現(xiàn)更為有效的數(shù)據(jù)運算和更大的數(shù)據(jù)吞吐量,其中“存算一體”被認為是未來計算芯片的架構(gòu)趨勢。它是把之前集中存儲在外面的數(shù)據(jù)改為存在GPU的每個計算單元內(nèi),每個計算單元既負責存儲數(shù)據(jù),又負責數(shù)據(jù)計算。

這幾天,清華大學研制出全球首顆全系統(tǒng)集成的、支持高效片上學習(機器學習能在硬件端直接完成)的憶阻器存算一體芯片,可謂刷爆行業(yè)媒體圈。這項最新的研究證明了在全集成憶阻器存算一體系統(tǒng)上實現(xiàn)矩陣向量乘法的可行性。據(jù)了解,清華大學的研究團隊對芯片算法、系統(tǒng)、架構(gòu)、電路與器件進行了全層次協(xié)同優(yōu)化設(shè)計:

器件層面,實現(xiàn)300萬個具有高模擬編程性的憶阻器與CMOS電路的單片集成;

電路層面,提出電壓模神經(jīng)元電路,支持可變精度計算、激活操作、低功耗模數(shù)轉(zhuǎn)換;

架構(gòu)層面,提出雙向TNSA(transposable neurosynaptic array)架構(gòu),以最小的面積、能耗開銷實現(xiàn)靈活的數(shù)據(jù)流重構(gòu);

系統(tǒng)層面,48個CIM核心支持多種權(quán)重映射方案,提高推理任務(wù)并行度;算法層面,利用多種硬件-算法協(xié)同優(yōu)化方案,降低硬件非理想特性對準確率的影響。

傳統(tǒng)計算系統(tǒng),其計算器件用的是場效應(yīng)晶體管,計算范式是布爾邏輯數(shù)字計算,架構(gòu)采用的是存算分離;而存算一體計算系統(tǒng)的計算器件是憶阻器,計算范式用的是物理定律模擬計算,架構(gòu)是存算一體。存算一體架構(gòu)徹底消除了數(shù)據(jù)在邏輯處理器與存儲芯片之間的搬遷問題,減少能量消耗及延遲。據(jù)公開資料顯示,相同任務(wù)下,該芯片實現(xiàn)片上學習的能耗僅為先進工藝下專用集成電路ASIC)系統(tǒng)的1/35,同時有望實現(xiàn)75倍的能效提升。

摩爾定律很好的歸納了信息技術(shù)進步的速度,但隨著半導(dǎo)體芯片技術(shù)的快速發(fā)展,摩爾定律已經(jīng)不太適用于現(xiàn)在的半導(dǎo)體芯片發(fā)展規(guī)律了。馮諾依曼架構(gòu)遇到了瓶頸,這時便需要憶阻器的魔力,來實現(xiàn)存算一體,打破傳統(tǒng)的馮諾依曼架構(gòu),開拓新的存儲器道路。談到這里,我們就必須來認識認識憶阻器這個非線性電路元件了。

憶阻器的發(fā)展

憶阻器英文名為memristor,也被稱為阻變存儲器(RRAM),用符號M表示,與電阻R,電容C,電感L構(gòu)成四種基本無源電路器件。它是連接磁通量與電荷之間關(guān)系的紐帶,同時具備電阻和存儲的性能,是一種新一代高速存儲單元。其功耗,讀寫速度都要比傳統(tǒng)的隨機存儲器優(yōu)越,是硬件實現(xiàn)人工神經(jīng)網(wǎng)絡(luò)突觸的最好方式,主要應(yīng)用于非易失存儲、邏輯運算以及類腦神經(jīng)形態(tài)計算。

54844aa0-7031-11ee-939d-92fbcf53809c.png

憶阻器全稱記憶電阻,是一種具有電荷記憶功能的非線性電阻,于1971年,由加州大學伯克利分校的華裔科學家蔡少棠教授提出。蔡教授從電路完整性角度出發(fā),從數(shù)學上推導(dǎo)出憶阻器的概念。不過,由于缺乏實驗的支撐,而且傳統(tǒng)存儲器在工藝上和摩爾定律契合的很好,一直在刷新著自己的存儲極限,所以在那之后的很長一段時間,人們認為沒有必要花費時間和金錢去研究憶阻器。

憶阻器發(fā)展的拐點,發(fā)生在2000年之后。2000-2008年,A Beck等人在Cr摻雜的SrZrO3中觀察到憶阻器滯回曲線,并指出器件具有存儲功能,2006年HP實驗室證明了Crossbar RRAM,并于2008年在《Nature》發(fā)表了“下落不明的憶阻器找到了”的相關(guān)文章,同年,HP公司制備出憶阻器。科學家們開始意識到憶阻器的優(yōu)勢和作用,全世界相關(guān)科學家都紛紛參與到憶阻器的研究中來,憶阻器研究高潮就此到來。

類腦計算及神經(jīng)形態(tài)計算是當今科研熱點之一,憶阻器是神經(jīng)元網(wǎng)絡(luò)的核心器件,它為發(fā)展信息存儲與處理融合的新型計算體系架構(gòu),突破傳統(tǒng)馮·諾伊曼架構(gòu)瓶頸,提供了可行的路線,其性能直接影響神經(jīng)元網(wǎng)絡(luò)的計算能力。

下面為大家分享一段教學視頻,是清華大學高濱教授主講的“憶阻器存算一體芯片與類腦計算”。高濱老師表示,現(xiàn)有計算系統(tǒng)普遍采用存儲和運算分離的架構(gòu),存在存儲墻與功耗墻瓶頸,嚴重制約了系統(tǒng)算力和能效的提升。存算合一的電子突觸就是憶阻器。不過,憶阻器也面臨著嚴峻的挑戰(zhàn)。核心挑戰(zhàn)之一是器件非理想特性,即憶阻器件性能存在離散性和不穩(wěn)定性,嚴重影響計算精度;另一個關(guān)鍵挑戰(zhàn)就是模擬計算的誤差累積。

清華大學高濱教授的教學視頻

高濱教授介紹,解決的辦法就是存算一體芯片的協(xié)同設(shè)計。存算一體芯片急需跨層次的協(xié)同優(yōu)化方案,單一層面的優(yōu)化已經(jīng)難以達到高性能。其實憶阻器研究的每一次推進和成功,都離不開測試設(shè)備提供的數(shù)據(jù)支持。高濱表示:“測試設(shè)備的進步,為憶阻器的研發(fā)做出了重要的貢獻!”

54a1c9f4-7031-11ee-939d-92fbcf53809c.png

高濱教授關(guān)于憶阻器研究的幾個關(guān)鍵時間點

憶阻器電學測試現(xiàn)狀與展望

存算一體技術(shù)對憶阻器特性要求非常高,測試難度也很大。通常,憶阻器的測試可分為三大類,即:

憶阻器基礎(chǔ)研究測試,包括憶阻器參數(shù)表征、分類及測試流程,以及分析器件在相應(yīng)的交流、直流、脈沖電信號作用下的憶阻特性;

憶阻器性能研究特性,旨在提高憶阻器存儲性能和模擬神經(jīng)元的性能,如功耗、擦寫速度、集成度和可靠性等各方面;

最后是憶阻器集成及應(yīng)用研究測試,憶阻器單元集成結(jié)構(gòu)是實現(xiàn)陣列憶阻器的關(guān)鍵,如1T1R、1TNR等cell及陣列結(jié)構(gòu)的測試。

如果憶阻器被用于神經(jīng)元方面的研究,其性能測試除了擦寫次數(shù)和數(shù)據(jù)保留時間外,還需要進行神經(jīng)突觸阻變動力學測試。

結(jié)束語

在 AI 算力需求暴漲下,存算一體被認為是突破算力瓶頸最有前景的新賽道。目前,國內(nèi)外很多科技企業(yè)及初創(chuàng)公司都在積極開展相關(guān)的研發(fā)。據(jù)相關(guān)預(yù)測數(shù)據(jù)顯示,到 2030 年,基于存算一體技術(shù)的芯片市場規(guī)模有望超過千億人民幣。憶阻器在數(shù)據(jù)存儲、存算一體、類腦計算等領(lǐng)域?qū)l(fā)揮越來越重要的作用。目前,憶阻器已經(jīng)具備在先進CMOS工藝平臺集成的能力。不過,憶阻器依然面臨著嚴峻的挑戰(zhàn),核心挑戰(zhàn)之一是器件非理想特性,即憶阻器件性能存在離散性和不穩(wěn)定性,嚴重影響計算精度;另一個關(guān)鍵挑戰(zhàn)就是模擬計算的誤差累積。

基于憶阻器的存算一體變革性技術(shù)正成為學術(shù)界和產(chǎn)業(yè)界關(guān)注的前沿熱點。未來仍期待在多通道快切換、高時間分辨等方面取得更大進步。期待***走的更遠、更高、更好!







審核編輯:劉清

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 場效應(yīng)晶體管
    +關(guān)注

    關(guān)注

    6

    文章

    394

    瀏覽量

    19924
  • 人工智能
    +關(guān)注

    關(guān)注

    1804

    文章

    48750

    瀏覽量

    246702
  • 憶阻器
    +關(guān)注

    關(guān)注

    8

    文章

    75

    瀏覽量

    20307
  • CMOS電路
    +關(guān)注

    關(guān)注

    0

    文章

    49

    瀏覽量

    11778
  • ChatGPT
    +關(guān)注

    關(guān)注

    29

    文章

    1588

    瀏覽量

    8811
收藏 人收藏

    評論

    相關(guān)推薦
    熱點推薦

    芯片的生態(tài)突圍與革命

    電子發(fā)燒友網(wǎng)報道(文 / 李彎彎)大芯片,即具備強大計算能力的集成電路芯片,主要應(yīng)用于高性能計算(HPC)、人工智能(AI)、數(shù)據(jù)中心、
    的頭像 發(fā)表于 04-13 00:02 ?1505次閱讀

    DeepSeek推動AI需求:800G光模塊的關(guān)鍵作用

    隨著人工智能技術(shù)的飛速發(fā)展,AI需求正以前所未有的速度增長。DeepSeek等大模型的訓練與推理任務(wù)對的需求持續(xù)攀升,直接推動了服務(wù)
    發(fā)表于 03-25 12:00

    GPU租用平臺什么好處

    當今,GPU租用平臺為科研機構(gòu)、企業(yè)乃至個人開發(fā)者提供了靈活高效的解決方案。下面,AI部落小編帶您深入探討GPU
    的頭像 發(fā)表于 02-07 10:39 ?373次閱讀

    DeepSeek對芯片的影響

    DeepSeek模型,尤其是其基于MOE(混合專家)架構(gòu)的DeepSeek-V3,對芯片的要求產(chǎn)生了深遠影響。為了更好地理解這一影響,我們可以從幾個方面進行分析。一.MOE架構(gòu)對
    的頭像 發(fā)表于 02-07 10:02 ?1000次閱讀
    DeepSeek對<b class='flag-5'>芯片</b><b class='flag-5'>算</b><b class='flag-5'>力</b>的影響

    中心的如何衡量?

    (ComputationalPower)是指智中心通過其內(nèi)部的計算設(shè)備(如CPU、GPU、AI芯片等)對數(shù)據(jù)進行處理和計算的能力。它體現(xiàn)了智中心在單位時間內(nèi)能夠完成的計算任務(wù)量,
    的頭像 發(fā)表于 01-16 14:03 ?1925次閱讀
    <b class='flag-5'>算</b>智<b class='flag-5'>算</b>中心的<b class='flag-5'>算</b><b class='flag-5'>力</b>如何衡量?

    科技云報到:要更要“利”,“精裝”觸發(fā)大模型產(chǎn)業(yè)新變局?

    科技云報到:要更要“利”,“精裝”觸發(fā)大模型產(chǎn)業(yè)新變局?
    的頭像 發(fā)表于 01-16 10:24 ?385次閱讀

    中心會取代通用中心嗎?

    隨著人工智能(AI)技術(shù)的飛速發(fā)展,計算需求不斷攀升,數(shù)據(jù)中心行業(yè)正經(jīng)歷著前所未有的變革。傳統(tǒng)的通用中心與新興的智中心之間的競爭日益激烈。那么,在這樣的背景下,通用
    的頭像 發(fā)表于 01-06 14:45 ?496次閱讀
    智<b class='flag-5'>算</b>中心會取代通用<b class='flag-5'>算</b><b class='flag-5'>力</b>中心嗎?

    企業(yè)AI租賃模式的好處

    構(gòu)建和維護一個高效、可擴展的AI基礎(chǔ)設(shè)施,不僅需要巨額的初期投資,還涉及復(fù)雜的運維管理和持續(xù)的技術(shù)升級。而AI
    的頭像 發(fā)表于 12-24 10:49 ?1139次閱讀

    企業(yè)AI租賃是什么

    企業(yè)AI租賃是指企業(yè)通過互聯(lián)網(wǎng)向?qū)I(yè)的提供商租用所需的計算資源,以滿足其AI應(yīng)用的需求。
    的頭像 發(fā)表于 11-14 09:30 ?2320次閱讀

    GPU開發(fā)平臺是什么

    隨著AI技術(shù)的廣泛應(yīng)用,需求呈現(xiàn)出爆發(fā)式增長。AI租賃作為一種新興的服務(wù)模式,正逐漸成為
    的頭像 發(fā)表于 10-31 10:31 ?582次閱讀

    【「芯片 | 高性能 CPU/GPU/NPU 微架構(gòu)分析」閱讀體驗】--全書概覽

    、GPU、NPU,給我們剖析了芯片的微架構(gòu)。書中有對芯片方案商處理器的講解,理論聯(lián)系實際,使讀者更好理解
    發(fā)表于 10-15 22:08

    大模型時代的需求

    現(xiàn)在AI已進入大模型時代,各企業(yè)都爭相部署大模型,但如何保證大模型的,以及相關(guān)的穩(wěn)定性和性能,是一個極為重要的問題,帶著這個極為重要的問題,我需要在此書中找到答案。
    發(fā)表于 08-20 09:04

    力系列基礎(chǔ)篇——與計算機性能:解鎖超能力的神秘力量!

    的?要想提高,都有哪些方法?一、的關(guān)鍵因素從
    的頭像 發(fā)表于 07-11 08:04 ?104次閱讀
    <b class='flag-5'>算</b>力系列基礎(chǔ)篇——<b class='flag-5'>算</b><b class='flag-5'>力</b>與計算機性能:解鎖超能力的神秘力量!

    基礎(chǔ)設(shè)施的風險與挑戰(zhàn)

    編者按網(wǎng)絡(luò)一個美好的愿景,就是希望網(wǎng),
    的頭像 發(fā)表于 06-13 08:27 ?872次閱讀
    <b class='flag-5'>算</b><b class='flag-5'>力</b>基礎(chǔ)設(shè)施的風險與挑戰(zhàn)
    主站蜘蛛池模板: 影院在线观看免费 | 色婷婷基地 | 激情97| 网站啪啪 | 成人综合婷婷国产精品久久免费 | 国模吧2021新入口 | 国产视频日本 | 福利视频一区二区 | 久久天天躁夜夜躁狠狠 | 婷婷亚洲五月琪琪综合 | 免费被视频网站在线观看 | 超级乱淫小黄文小说 | 2019偷偷狠狠的日日 | 亚洲一区二区免费在线观看 | 热99视频| 户外露出精品视频国产 | 中文字幕色 | 国产怡红院 | 伦理片第一页 | 日日爱夜夜爱 | 欧美性猛交xxxx乱大交中文 | 欧美一区二区三区成人看不卡 | 美女操网站 | 黄色一级视频欧美 | 美女无遮挡拍拍拍免费视频 | 人人人干 | 午夜宅男在线 | 日产精品卡二卡三卡四卡乱码视频 | 欧美性野久久久久久久久 | 国产亚洲精品久久久久久午夜 | 毛片视频网址 | 婷婷综合久久狠狠色99h | 天堂一区二区三区在线观看 | 久久国产乱子伦精品免费看 | 双性受粗大撑开白浊 | 成人三级网址 | 四虎影院永久在线观看 | 久久精品国产乱子伦多人 | 狠狠色噜噜狠狠狠狠狠色综合久久 | 免费色片网站 | h小视频在线观看 |