在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

Nature:人工智能芯片!

旺材芯片 ? 來源:納米人 ? 2023-09-05 16:13 ? 次閱讀

具有數(shù)十億參數(shù)的人工智能AI)模型可以在一系列任務(wù)中實(shí)現(xiàn)高精度,但它們加劇了傳統(tǒng)通用處理器(例如圖形處理單元或中央處理單元)的低能效。模擬內(nèi)存計(jì)算(模擬 AI)可以通過在“內(nèi)存塊”上并行執(zhí)行矩陣向量乘法來提供更好的能源效率。然而,模擬人工智能尚未在需要許多此類圖塊以及圖塊之間神經(jīng)網(wǎng)絡(luò)激活的有效通信的模型上證明軟件等效(SWeq)準(zhǔn)確性。

有鑒于此,美國IBM 研究中心S. Ambrogio(一作兼通訊)等人展示了一款14 nm的模擬 AI 芯片,該芯片結(jié)合了跨 34 個區(qū)塊的 3500 萬個相變存儲器件、大規(guī)模并行區(qū)塊間通信和模擬低功耗外圍電路,可實(shí)現(xiàn)12.4 萬億次 / 秒 / 瓦運(yùn)算性能,能效是傳統(tǒng)數(shù)字計(jì)算機(jī)芯片的14倍。作者展示了小型關(guān)鍵字識別網(wǎng)絡(luò)的完全端到端 SWeq 精度,以及更大的 MLPerf 循環(huán)神經(jīng)網(wǎng)絡(luò)傳感器 (RNNT) 上接近 SWeq 的精度,其中超過4500萬個權(quán)重映射到跨越5個芯片的1.4億個相變存儲器件上。

芯片架構(gòu)

作者展示了芯片的顯微照片,突出顯示了34個模擬塊的 2D 網(wǎng)格,每個塊都有512×2048PCM 交叉陣列。當(dāng)持續(xù)時間向量從模擬快發(fā)送到OLP時,芯片有效地實(shí)現(xiàn)了基于斜坡的模數(shù)轉(zhuǎn)換器ADC)。所有權(quán)重配置、MAC操作和路由方案均由每個圖塊上可用的用戶可配置本地控制器(LC) 定義。本地SRAM存儲定義數(shù)百個控制信號的時間序列的所有指令,從而實(shí)現(xiàn)高度靈活的測試并簡化設(shè)計(jì)驗(yàn)證,與預(yù)定義狀態(tài)機(jī)相比,面積損失較小。作者驗(yàn)證了持續(xù)時間可以在整個芯片上可靠地傳輸,最大誤差等于5ns(較短持續(xù)時間為 3ns)。

d0bbf1c2-4bba-11ee-a25d-92fbcf53809c.png

圖 芯片架構(gòu)

d10ba60e-4bba-11ee-a25d-92fbcf53809c.png

圖 可重構(gòu)架構(gòu)和路由

KWS任務(wù)

為了演示芯片在端到端網(wǎng)絡(luò)中的性能,實(shí)現(xiàn)了多類KWS任務(wù)。作者采用了 FC網(wǎng)絡(luò),實(shí)現(xiàn)了 86.75% 的分類準(zhǔn)確度。為了在芯片上實(shí)現(xiàn)完全端到端的傳輸,作者進(jìn)行了一系列修改,最終端到端實(shí)現(xiàn)總共使用四個圖塊。為了提高M(jìn)AC精度并補(bǔ)償外圍電路的不對稱性,引入了MAC不對稱平衡(AB)方法,測得的KWS精度為86.14%,完全在 MLPerf SWeq“等精度”極限 85.88%之內(nèi)。

d15d399c-4bba-11ee-a25d-92fbcf53809c.png

圖 端到端 KWS 任務(wù)

芯片上的 RNNT 映射

作者實(shí)施了MLPerf數(shù)據(jù)中心網(wǎng)絡(luò)RNNT作為行業(yè)相關(guān)的工作負(fù)載演示。當(dāng) RNNT等大型DNN以降低的數(shù)字精度實(shí)現(xiàn)時,整個網(wǎng)絡(luò)的最佳精度選擇可能會有所不同。研究表明即使使用激進(jìn)的量化,不易受影響的層或整個網(wǎng)絡(luò)塊仍將提供較低的 WER,而高度敏感的塊即使對于少量的權(quán)重量化也將表現(xiàn)出較高的 WER。對每個單獨(dú)的層重復(fù)此過程以識別最敏感的層,接著將 MLPerf 權(quán)重映射到分布在5個芯片上的142個圖塊上。在總共 45,321,309 個網(wǎng)絡(luò)權(quán)重和偏差參數(shù)中,45,261,568 個被映射到模擬存儲器(權(quán)重的 99.9%)。

d1a90020-4bba-11ee-a25d-92fbcf53809c.png

圖 用于語音轉(zhuǎn)錄的 MLPerf RNNT 網(wǎng)絡(luò)

準(zhǔn)確度結(jié)果

作者展示了2513個音頻查詢的完整 Librispeech 驗(yàn)證數(shù)據(jù)集的權(quán)重映射和編程后的實(shí)驗(yàn)WER。總WER為9.475%,與SW 基線相比總體下降了 2.02%。在本實(shí)驗(yàn)中,通過芯片推斷完整的Librispeech驗(yàn)證數(shù)據(jù)集并保存輸出結(jié)果。然后將這些輸入到芯片 2 中,依此類推,輸入到所有 5 個芯片中。即使在PCM漂移超過1周后重復(fù)進(jìn)行,且沒有任何重新校準(zhǔn)或重量重新編程,RNNT WER 也僅下降了 0.4%。

d1eebab6-4bba-11ee-a25d-92fbcf53809c.png

圖 在 MLPerf RNNT上使用Librispeech進(jìn)行WER實(shí)驗(yàn)

電源和系統(tǒng)性能

作者還測量了推理操作期間每個芯片的全部功耗。所有控制和通信電路均以 0.8V 驅(qū)動。芯片最佳功率性能 為12.40 TOPS/W。通過將積分時間減半,芯片的 TOPS/W 可以再提高 25%,但 WER 會額外降低1%。隨著重量的增加,使用本文報道的芯片的模擬人工智能系統(tǒng)可以在3.57W的功率下實(shí)現(xiàn)6.704TOPS/W,比MLPerf的最佳能效提高了14 倍,WER 為 9.258%。

d1f4fde0-4bba-11ee-a25d-92fbcf53809c.png

圖 MLPerf RNNT功率和系統(tǒng)性能

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 芯片
    +關(guān)注

    關(guān)注

    459

    文章

    52253

    瀏覽量

    436996
  • 人工智能
    +關(guān)注

    關(guān)注

    1804

    文章

    48788

    瀏覽量

    246950
  • 存儲器件
    +關(guān)注

    關(guān)注

    1

    文章

    32

    瀏覽量

    9838

原文標(biāo)題:Nature:人工智能芯片!

文章出處:【微信號:wc_ysj,微信公眾號:旺材芯片】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關(guān)推薦
    熱點(diǎn)推薦

    開售RK3576 高性能人工智能主板

    ,HDMI-4K 輸出,支 持千兆以太網(wǎng),WiFi,USB 擴(kuò)展/重力感應(yīng)/RS232/RS485/IO 擴(kuò)展/I2C 擴(kuò)展/MIPI 攝像頭/紅外遙控 器等功能,豐富的接口,一個全新八核擁有超強(qiáng)性能的人工智能
    發(fā)表于 04-23 10:55

    蘋果或與博通攜手研發(fā)人工智能芯片

    據(jù)消息人士透露,蘋果公司正在與博通公司攜手研發(fā)一款人工智能芯片,并計(jì)劃于2026年啟動生產(chǎn)。蘋果的高級機(jī)器學(xué)習(xí)和人工智能總監(jiān)Benoit Dupin最近表示,該公司正在考慮使用亞馬遜最新的人工
    的頭像 發(fā)表于 12-12 14:01 ?519次閱讀

    嵌入式和人工智能究竟是什么關(guān)系?

    嵌入式和人工智能究竟是什么關(guān)系? 嵌入式系統(tǒng)是一種特殊的系統(tǒng),它通常被嵌入到其他設(shè)備或機(jī)器中,以實(shí)現(xiàn)特定功能。嵌入式系統(tǒng)具有非常強(qiáng)的適應(yīng)性和靈活性,能夠根據(jù)用戶需求進(jìn)行定制化設(shè)計(jì)。它廣泛應(yīng)用于各種
    發(fā)表于 11-14 16:39

    《AI for Science:人工智能驅(qū)動科學(xué)創(chuàng)新》第6章人AI與能源科學(xué)讀后感

    幸得一好書,特此來分享。感謝平臺,感謝作者。受益匪淺。 在閱讀《AI for Science:人工智能驅(qū)動科學(xué)創(chuàng)新》的第6章后,我深刻感受到人工智能在能源科學(xué)領(lǐng)域中的巨大潛力和廣泛應(yīng)用。這一章詳細(xì)
    發(fā)表于 10-14 09:27

    AI for Science:人工智能驅(qū)動科學(xué)創(chuàng)新》第4章-AI與生命科學(xué)讀后感

    很幸運(yùn)社區(qū)給我一個閱讀此書的機(jī)會,感謝平臺。 《AI for Science:人工智能驅(qū)動科學(xué)創(chuàng)新》第4章關(guān)于AI與生命科學(xué)的部分,為我們揭示了人工智能技術(shù)在生命科學(xué)領(lǐng)域中的廣泛應(yīng)用和深遠(yuǎn)影響。在
    發(fā)表于 10-14 09:21

    《AI for Science:人工智能驅(qū)動科學(xué)創(chuàng)新》第一章人工智能驅(qū)動的科學(xué)創(chuàng)新學(xué)習(xí)心得

    周末收到一本新書,非常高興,也非常感謝平臺提供閱讀機(jī)會。 這是一本挺好的書,包裝精美,內(nèi)容詳實(shí),干活滿滿。 《AI for Science:人工智能驅(qū)動科學(xué)創(chuàng)新》這本書的第一章,作為整個著作的開篇
    發(fā)表于 10-14 09:12

    risc-v在人工智能圖像處理應(yīng)用前景分析

    RISC-V在人工智能圖像處理領(lǐng)域的應(yīng)用前景十分廣闊,這主要得益于其開源性、靈活性和低功耗等特點(diǎn)。以下是對RISC-V在人工智能圖像處理應(yīng)用前景的詳細(xì)分析: 一、RISC-V的基本特點(diǎn) RISC-V
    發(fā)表于 09-28 11:00

    人工智能ai 數(shù)電 模電 模擬集成電路原理 電路分析

    人工智能ai 數(shù)電 模電 模擬集成電路原理 電路分析 想問下哪些比較容易學(xué) 不過好像都是要學(xué)的
    發(fā)表于 09-26 15:24

    SK海力士開始先進(jìn)人工智能芯片生產(chǎn)

    SK海力士宣布,公司已正式踏入人工智能芯片生產(chǎn)的新階段,批量生產(chǎn)業(yè)界領(lǐng)先的12層HBM3E芯片。這款芯片不僅代表了SK海力士在內(nèi)存技術(shù)上的重大突破,更以36GB的超大容量刷新了現(xiàn)有HB
    的頭像 發(fā)表于 09-26 14:24 ?554次閱讀

    人工智能ai4s試讀申請

    目前人工智能在繪畫對話等大模型領(lǐng)域應(yīng)用廣闊,ai4s也是方興未艾。但是如何有效利用ai4s工具助力科研是個需要研究的課題,本書對ai4s基本原理和原則,方法進(jìn)行描訴,有利于總結(jié)經(jīng)驗(yàn),擬按照要求準(zhǔn)備相關(guān)體會材料。看能否有助于入門和提高ss
    發(fā)表于 09-09 15:36

    名單公布!【書籍評測活動NO.44】AI for Science:人工智能驅(qū)動科學(xué)創(chuàng)新

    芯片設(shè)計(jì)的自動化水平、優(yōu)化半導(dǎo)體制造和封測的工藝和水平、尋找新一代半導(dǎo)體材料等方面提供幫助。 第6章介紹了人工智能在化石能源科學(xué)研究、可再生能源科學(xué)研究、能源轉(zhuǎn)型三個方面的落地應(yīng)用。 第7章從環(huán)境監(jiān)測
    發(fā)表于 09-09 13:54

    報名開啟!深圳(國際)通用人工智能大會將啟幕,國內(nèi)外大咖齊聚話AI

    8月28日至30日,2024深圳(國際)通用人工智能大會暨深圳(國際)通用人工智能產(chǎn)業(yè)博覽會將在深圳國際會展中心(寶安)舉辦。大會以“魅力AI·無限未來”為主題,致力于打造全球通用人工智能領(lǐng)域集產(chǎn)品
    發(fā)表于 08-22 15:00

    FPGA在人工智能中的應(yīng)用有哪些?

    FPGA(現(xiàn)場可編程門陣列)在人工智能領(lǐng)域的應(yīng)用非常廣泛,主要體現(xiàn)在以下幾個方面: 一、深度學(xué)習(xí)加速 訓(xùn)練和推理過程加速:FPGA可以用來加速深度學(xué)習(xí)的訓(xùn)練和推理過程。由于其高并行性和低延遲特性
    發(fā)表于 07-29 17:05

    人工智能芯片與服務(wù)器芯片的區(qū)別

    人工智能芯片(AI芯片)與服務(wù)器芯片在多個方面存在顯著差異,這些差異主要體現(xiàn)在設(shè)計(jì)目標(biāo)、功能特性、應(yīng)用場景以及技術(shù)發(fā)展趨勢上。以下是對兩者區(qū)別的詳細(xì)分析。
    的頭像 發(fā)表于 07-12 18:21 ?2406次閱讀

    人工智能神經(jīng)網(wǎng)絡(luò)芯片的介紹

    人工智能神經(jīng)網(wǎng)絡(luò)芯片是一類專門為深度學(xué)習(xí)和神經(jīng)網(wǎng)絡(luò)算法設(shè)計(jì)的處理器。它們具有高性能、低功耗、可擴(kuò)展等特點(diǎn),廣泛應(yīng)用于圖像識別、語音識別、自然語言處理等領(lǐng)域。以下是關(guān)于人工智能神經(jīng)網(wǎng)絡(luò)芯片
    的頭像 發(fā)表于 07-04 09:33 ?1316次閱讀
    主站蜘蛛池模板: 免费在线黄网站 | 美女扒开腿让男生桶爽网站 | 国产免费一级在线观看 | 国产一级一级片 | 一卡二卡三卡四卡无卡在线 | 一级aa 毛片高清免费看 | 黄色免费网站在线播放 | 美女被艹视频网站 | 五月桃花网婷婷亚洲综合 | 久久久久免费观看 | 欧美大片一区二区 | 天天插在线视频 | 免费观看在线观看 | 午夜老司机福利 | 天天看天天爽天天摸天天添 | 国产欧美日韩综合精品无毒 | 男人的亚洲天堂 | 亚洲毛片大全 | 午夜三级视频 | 免费一区二区 | 天堂在线视频 | 色丁香六月 | 欧美黄页| 亚洲免费视频观看 | 国产精品秒播无毒不卡 | 91精品福利久久久 | 免费一级特黄特色大片在线观看看 | 狠狠色噜噜狠狠狠97影音先锋 | 国产三级毛片视频 | 又大又粗进出白浆直流动态图 | 美女18黄| fenfencao在线观看免费视频 | 色偷偷亚洲综合网亚洲 | 天天视频国产免费入口 | 激情九月婷婷 | 一区二区三区四区在线不卡高清 | 欧美一级免费 | 欧美色图28p | 欧美性久久 | 最好看最新的中文字幕1 | 日韩卡1卡2卡三卡四卡二卡免 |