在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

AI芯片什么是AI芯片的架構(gòu)、分類及關(guān)鍵技術(shù)概述

h1654155973.6121 ? 來源:未知 ? 2019-01-05 09:15 ? 次閱讀

人工智能芯片目前有兩種發(fā)展路徑:一種是延續(xù)傳統(tǒng)計算架構(gòu),加速硬件計算能力,主要以 3 種類型的芯片為代表,即GPUFPGAASIC,但CPU依舊發(fā)揮著不可替代的作用;另一種是顛覆經(jīng)典的馮·諾依曼計算架構(gòu),采用類腦神經(jīng)結(jié)構(gòu)來提升計算能力,以IBM TrueNorth芯片為代表。

傳統(tǒng) CPU

計算機工業(yè)從1960年代早期開始使用CPU這個術(shù)語。迄今為止,CPU從形態(tài)、設(shè)計到實現(xiàn)都已發(fā)生了巨大的變化,但是其基本工作原理卻一直沒有大的改變。 通常 CPU 由控制器和運算器這兩個主要部件組成。 傳統(tǒng)的 CPU 內(nèi)部結(jié)構(gòu)圖如圖所示:

傳統(tǒng)CPU內(nèi)部結(jié)構(gòu)圖(ALU計算模塊)

從圖中我們可以看到:實質(zhì)上僅單獨的ALU模塊(邏輯運算單元)是用來完成數(shù)據(jù)計算的,其他各個模塊的存在都是為了保證指令能夠一條接一條的有序執(zhí)行。這種通用性結(jié)構(gòu)對于傳統(tǒng)的編程計算模式非常適合,同時可以通過提升CPU主頻(提升單位時間內(nèi)執(zhí)行指令的條數(shù))來提升計算速度。 但對于深度學習中的并不需要太多的程序指令、 卻需要海量數(shù)據(jù)運算的計算需求, 這種結(jié)構(gòu)就顯得有些力不從心。尤其是在功耗限制下, 無法通過無限制的提升 CPU 和內(nèi)存的工作頻率來加快指令執(zhí)行速度, 這種情況導致 CPU 系統(tǒng)的發(fā)展遇到不可逾越的瓶頸。

并行加速計算的GPU

GPU 作為最早從事并行加速計算的處理器,相比 CPU 速度快, 同時比其他加速器芯片編程靈活簡單。

傳統(tǒng)的 CPU 之所以不適合人工智能算法的執(zhí)行,主要原因在于其計算指令遵循串行執(zhí)行的方式,沒能發(fā)揮出芯片的全部潛力。與之不同的是, GPU 具有高并行結(jié)構(gòu),在處理圖形數(shù)據(jù)和復雜算法方面擁有比 CPU 更高的效率。對比 GPU 和 CPU 在結(jié)構(gòu)上的差異, CPU大部分面積為控制器和寄存器,而 GPU 擁有更ALU(邏輯運算單元)用于數(shù)據(jù)處理,這樣的結(jié)構(gòu)適合對密集型數(shù)據(jù)進行并行處理, CPU 與 GPU 的結(jié)構(gòu)對比如圖 所示。

CPU及GPU結(jié)構(gòu)對比圖

程序在 GPU系統(tǒng)上的運行速度相較于單核 CPU往往提升幾十倍乃至上千倍。隨著英偉達AMD 等公司不斷推進其對 GPU 大規(guī)模并行架構(gòu)的支持,面向通用計算的GPU(即GPGPU,通用計算圖形處理器)已成為加速可并行應用程序的重要手段,GPU 的發(fā)展歷程可分為 3 個階段:

第一代GPU(1999年以前),部分功能從CPU分離 , 實現(xiàn)硬件加速 , 以GE(GEOMETRY ENGINE)為代表,只能起到 3D 圖像處理的加速作用,不具有軟件編程特性。

第二代 GPU(1999-2005 年), 實現(xiàn)進一步的硬件加速和有限的編程性。 1999年,英偉達發(fā)布了“專為執(zhí)行復雜的數(shù)學和幾何計算的” GeForce256 圖像處理芯片,將更多的晶體管用作執(zhí)行單元, 而不是像 CPU 那樣用作復雜的控制單元和緩存,將(TRANSFORM AND LIGHTING)等功能從 CPU 分離出來,實現(xiàn)了快速變換,這成為 GPU 真正出現(xiàn)的標志。之后幾年, GPU 技術(shù)快速發(fā)展,運算速度迅速超過 CPU。 2001年英偉達和ATI 分別推出的GEFORCE3和RADEON 8500,圖形硬件的流水線被定義為流處理器,出現(xiàn)了頂點級可編程性,同時像素級也具有有限的編程性,但 GPU 的整體編程性仍然比較有限。

第三代 GPU(2006年以后), GPU實現(xiàn)方便的編程環(huán)境創(chuàng)建, 可以直接編寫程序。 2006年英偉達與ATI分別推出了CUDA (Compute United Device Architecture,計算統(tǒng)一設(shè)備架構(gòu))編程環(huán)境和CTM(CLOSE TO THE METAL)編程環(huán)境, 使得 GPU 打破圖形語言的局限成為真正的并行數(shù)據(jù)處理超級加速器。

2008年,蘋果公司提出一個通用的并行計算編程平臺 OPENCL(開放運算語言),與CUDA綁定在英偉達的顯卡上不同,OPENCL 和具體的計算設(shè)備無關(guān)。

GPU芯片的發(fā)展階段

目前, GPU 已經(jīng)發(fā)展到較為成熟的階段。谷歌、 FACEBOOK、微軟、 Twtter和百度等公司都在使用GPU 分析圖片、視頻音頻文件,以改進搜索和圖像標簽等應用功能。此外,很多汽車生產(chǎn)商也在使用GPU芯片發(fā)展無人駕駛。 不僅如此, GPU也被應用于VR/AR 相關(guān)的產(chǎn)業(yè)。

但是 GPU也有一定的局限性。 深度學習算法分為訓練和推斷兩部分, GPU 平臺在算法訓練上非常高效。但在推斷中對于單項輸入進行處理的時候,并行計算的優(yōu)勢不能完全發(fā)揮出來。

半定制化的FPGA

FPGA 是在PAL、 GAL、 CPLD等可編程器件基礎(chǔ)上進一步發(fā)展的產(chǎn)物。用戶可以通過燒入 FPGA 配置文件來定義這些門電路以及存儲器之間的連線。這種燒入不是一次性的,比如用戶可以把 FPGA 配置成一個微控制器 MCU,使用完畢后可以編輯配置文件把同一個FPGA 配置成一個音頻編解碼器。因此, 它既解決了定制電路靈活性的不足,又克服了原有可編程器件門電路數(shù)有限的缺點。

FPGA可同時進行數(shù)據(jù)并行和任務并行計算,在處理特定應用時有更加明顯的效率提升。對于某個特定運算,通用 CPU可能需要多個時鐘周期,而 FPGA 可以通過編程重組電路,直接生成專用電路,僅消耗少量甚至一次時鐘周期就可完成運算。

此外,由于 FPGA的靈活性,很多使用通用處理器或 ASIC難以實現(xiàn)的底層硬件控制操作技術(shù), 利用 FPGA 可以很方便的實現(xiàn)。這個特性為算法的功能實現(xiàn)和優(yōu)化留出了更大空間。同時FPGA 一次性成本(光刻掩模制作成本)遠低于ASIC,在芯片需求還未成規(guī)模、深度學習算法暫未穩(wěn)定, 需要不斷迭代改進的情況下,利用 FPGA 芯片具備可重構(gòu)的特性來實現(xiàn)半定制的人工智能芯片是最佳選擇之一。

功耗方面,從體系結(jié)構(gòu)而言, FPGA 也具有天生的優(yōu)勢。傳統(tǒng)的馮氏結(jié)構(gòu)中,執(zhí)行單元(如 CPU 核)執(zhí)行任意指令,都需要有指令存儲器、譯碼器、各種指令的運算器及分支跳轉(zhuǎn)處理邏輯參與運行, 而FPGA每個邏輯單元的功能在重編程(即燒入)時就已經(jīng)確定,不需要指令,無需共享內(nèi)存,從而可以極大的降低單位執(zhí)行的功耗,提高整體的能耗比。

由于 FPGA 具備靈活快速的特點, 因此在眾多領(lǐng)域都有替代ASIC 的趨勢。 FPGA 在人工智能領(lǐng)域的應用如圖所示。

FPGA 在人工智能領(lǐng)域的應用

全定制化的ASIC

目前以深度學習為代表的人工智能計算需求,主要采用GPU、FPGA等已有的適合并行計算的通用芯片來實現(xiàn)加速。在產(chǎn)業(yè)應用沒有大規(guī)模興起之時,使用這類已有的通用芯片可以避免專門研發(fā)定制芯片(ASIC)的高投入和高風險。但是,由于這類通用芯片設(shè)計初衷并非專門針對深度學習,因而天然存在性能、 功耗等方面的局限性。隨著人工智能應用規(guī)模的擴大,這類問題日益突顯。

GPU作為圖像處理器, 設(shè)計初衷是為了應對圖像處理中的大規(guī)模并行計算。因此,在應用于深度學習算法時,有三個方面的局限性:

第一:應用過程中無法充分發(fā)揮并行計算優(yōu)勢。深度學習包含訓練和推斷兩個計算環(huán)節(jié), GPU 在深度學習算法訓練上非常高效, 但對于單一輸入進行推斷的場合, 并行度的優(yōu)勢不能完全發(fā)揮。

第二:無法靈活配置硬件結(jié)構(gòu)。GPU 采用 SIMT 計算模式, 硬件結(jié)構(gòu)相對固定。 目前深度學習算法還未完全穩(wěn)定,若深度學習算法發(fā)生大的變化, GPU 無法像 FPGA 一樣可以靈活的配制硬件結(jié)構(gòu)。

第三:運行深度學習算法能效低于FPGA。

盡管 FPGA 倍受看好,甚至新一代百度大腦也是基于 FPGA 平臺研發(fā),但其畢竟不是專門為了適用深度學習算法而研發(fā),實際應用中也存在諸多局限:

第一:基本單元的計算能力有限。為了實現(xiàn)可重構(gòu)特性, FPGA 內(nèi)部有大量極細粒度的基本單元,但是每個單元的計算能力(主要依靠 LUT 查找表)都遠遠低于 CPU 和 GPU 中的 ALU 模塊。

第二:計算資源占比相對較低。為實現(xiàn)可重構(gòu)特性, FPGA 內(nèi)部大量資源被用于可配置的片上路由與連線。

第三:速度和功耗相對專用定制芯片(ASIC)仍然存在不小差距。

第四,:FPGA 價格較為昂貴。在規(guī)模放量的情況下單塊 FPGA 的成本要遠高于專用定制芯片。

因此,隨著人工智能算法和應用技術(shù)的日益發(fā)展,以及人工智能專用芯片 ASIC產(chǎn)業(yè)環(huán)境的逐漸成熟, 全定制化人工智能 ASIC也逐步體現(xiàn)出自身的優(yōu)勢,從事此類芯片研發(fā)與應用的國內(nèi)外比較有代表性的公司如圖所示。

人工智能專用芯片研發(fā)情況一覽

深度學習算法穩(wěn)定后, AI 芯片可采用ASIC設(shè)計方法進行全定制, 使性能、功耗和面積等指標面向深度學習算法做到最優(yōu)。

類腦芯片

類腦芯片不采用經(jīng)典的馮·諾依曼架構(gòu), 而是基于神經(jīng)形態(tài)架構(gòu)設(shè)計,以IBM Truenorth為代表。IBM 研究人員將存儲單元作為突觸、計算單元作為神經(jīng)元、傳輸單元作為軸突搭建了神經(jīng)芯片的原型。

目前, Truenorth用三星 28nm功耗工藝技術(shù),由54億個晶體管組成的芯片構(gòu)成的片上網(wǎng)絡(luò)有4096個神經(jīng)突觸核心,實時作業(yè)功耗僅為70mW。由于神經(jīng)突觸要求權(quán)重可變且要有記憶功能, IBM采用與CMOS工藝兼容的相變非易失存儲器(PCM)的技術(shù)實驗性的實現(xiàn)了新型突觸,加快了商業(yè)化進程。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • FPGA
    +關(guān)注

    關(guān)注

    1640

    文章

    21907

    瀏覽量

    611537
  • asic
    +關(guān)注

    關(guān)注

    34

    文章

    1237

    瀏覽量

    121670
  • gpu
    gpu
    +關(guān)注

    關(guān)注

    28

    文章

    4880

    瀏覽量

    130331
  • AI
    AI
    +關(guān)注

    關(guān)注

    87

    文章

    33415

    瀏覽量

    273940

原文標題:什么是AI芯片:架構(gòu)、分類及關(guān)鍵技術(shù)

文章出處:【微信號:xinlun99,微信公眾號:芯論】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關(guān)推薦

    risc-v多核芯片AI方面的應用

    處理器的性能,使其在處理復雜的AI任務時具有更高的效率。同時,RISC-V允許任何人免費設(shè)計、制造和銷售RISC-V芯片和軟件,無需像ARM那樣購買昂貴的架構(gòu)許可證,這進一步降低了RISC-V多核
    發(fā)表于 04-28 09:20

    首創(chuàng)開源架構(gòu),天璣AI開發(fā)套件讓端側(cè)AI模型接入得心應手

    倍,可見天璣的AI開發(fā)者解決方案已經(jīng)被開發(fā)者高度認可,天璣AI生態(tài)圈正在飛速成長起來。 聯(lián)發(fā)科與OPPO深度合作,共同研發(fā),借助天璣AI開發(fā)套件中支持DeepSeek的四大關(guān)鍵技術(shù),快
    發(fā)表于 04-13 19:52

    AI芯片哪里買?

    AI芯片
    芯廣場
    發(fā)布于 :2024年05月31日 16:58:19

    手把手教你設(shè)計人工智能芯片及系統(tǒng)--(全階設(shè)計教程+AI芯片FPGA實現(xiàn)+開發(fā)板)

    `` 為什么發(fā)起AI芯片設(shè)計眾籌 ?1、傳統(tǒng)指令驅(qū)動的處理器(CPU和GPU)已經(jīng)無法支持數(shù)據(jù)驅(qū)動的AI技術(shù),專用AI
    發(fā)表于 07-19 11:54

    GPS芯片關(guān)鍵技術(shù)是什么

    談到GPS芯片主要關(guān)鍵技術(shù),這包括負責訊號處理─基頻(Baseband)及接收訊號─射頻(RF)。由于GPS訊號頻率(1,575.42MHz)來自于距離地面2萬公里的高空,訊號十分不穩(wěn)定,因此當天
    發(fā)表于 07-30 06:52

    AI發(fā)展對芯片技術(shù)有什么影響?

    現(xiàn)在說AI是未來人類技術(shù)進步的一大方向,相信大家都不會反對。說到AI芯片技術(shù)的關(guān)系,我覺得主要體現(xiàn)在兩個方面:第一,
    發(fā)表于 08-12 06:38

    AI芯片怎么分類

    AI芯片作為產(chǎn)業(yè)核心,也是技術(shù)要求和附加值最高的環(huán)節(jié),在AI產(chǎn)業(yè)鏈中的產(chǎn)業(yè)價值和戰(zhàn)略地位遠遠大于應用層創(chuàng)新。騰訊發(fā)布的《中美兩國人工智能產(chǎn)業(yè)發(fā)展全面解讀》報告顯示,基礎(chǔ)層的處理器/
    發(fā)表于 08-13 08:42

    【免費直播】AI芯片專家陳小柏博士,帶你解析AI算法及其芯片操作系統(tǒng)。

    。并且跟大家從多個視角暢聊展望人工智能芯片的未來發(fā)展趨勢。適合各類對AI芯片感興趣的學員們,歡迎大家屆時來聽。直播主題:【第2期】AI芯片
    發(fā)表于 11-07 14:03

    AI芯片熱潮和架構(gòu)創(chuàng)新有什么作用

    魏少軍談AI芯片熱潮和架構(gòu)創(chuàng)新 透露清華Thinker芯片將獨立融資
    發(fā)表于 04-23 14:59

    AI芯片熱潮和架構(gòu)創(chuàng)新是什么

    魏少軍談AI芯片熱潮和架構(gòu)創(chuàng)新 透露清華Thinker芯片將獨立融資
    發(fā)表于 04-24 11:29

    鯤鵬920芯片是布局云端計算的關(guān)鍵技術(shù)

    華為推出鯤鵬920芯片:布局云端計算的關(guān)鍵技術(shù)之一
    發(fā)表于 01-25 07:05

    清華出品:最易懂的AI芯片報告!人才技術(shù)趨勢都在這里 精選資料分享

    , 數(shù)據(jù)量呈現(xiàn)爆炸性增長態(tài)勢,而傳統(tǒng)的計算架構(gòu)又無法支撐深度學習的大規(guī)模并行計算需求, 于是研究界對 AI 芯片進行了新一輪的技術(shù)研發(fā)與應用研究。
    發(fā)表于 07-23 09:19

    什么是HarmonyOS?鴻蒙OS架構(gòu)關(guān)鍵技術(shù)是什么?

    什么是HarmonyOS?鴻蒙OS架構(gòu)關(guān)鍵技術(shù)是什么?
    發(fā)表于 09-23 09:02

    為何AI需要新的芯片架構(gòu)

    、處理器架構(gòu)類型、技術(shù)、應用、垂直行業(yè)等。不過,AI芯片主要應用于兩個領(lǐng)域,即終端應用(例如手機和智能手表中的芯片)和數(shù)據(jù)中心應用(用于深度
    的頭像 發(fā)表于 05-13 04:45 ?1082次閱讀

    ai芯片技術(shù)架構(gòu)有哪些

    ai芯片技術(shù)可以分為不同的體系架構(gòu)。下面將對ai芯片技術(shù)
    的頭像 發(fā)表于 08-09 14:28 ?1946次閱讀
    主站蜘蛛池模板: 色倩网站| 亚洲高清色图 | 可以看黄色的网站 | 成人毛片一区二区三区 | 欧美极品bbbbⅹxxxx | 免费观看欧美成人1314w色 | 天堂视频免费 | 日日拍夜夜嗷嗷叫狠狠 | 中文字幕va一区二区三区 | 欧美人与zoxxxx另类 | 免费伦费一区二区三区四区 | 欧美极品另类 | 亚洲狠狠网站色噜噜 | 日本妞xxxxxxxxx69| 日韩第五页 | 人人揉揉香蕉大青草 | 五月婷婷六月综合 | 99久久香蕉国产综合影院 | 美欧毛片 | 色多多免费观看在线 | 色性网| 天堂网www天堂在线资源链接 | 欧美人另类zooz | 最近最新中文字幕6页 | 色色色色色色网 | 欧美一级看片免费观看视频在线 | 三级三级三级网站网址 | 久久中文字幕一区二区三区 | 色老头成人免费综合视频 | 波多野结衣在线视频免费观看 | 成人午夜性视频欧美成人 | 人成电影免费观看在线 | 琪琪see色原网一区二区 | 一色屋成人免费精品网站 | 综合六月 | 久久久久久久影院 | 欧美高清一区二区 | 丁香六月激情综合 | 三级黄网站 | 国产私密| 777欧美|