在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

聚焦 | 什么是AI芯片“存儲墻”的解決方案?

SSDFans ? 來源:YXQ ? 2019-06-18 15:12 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

在2016年威海參加中國體系結(jié)構(gòu)年會的時候,孫所也說了一句調(diào)侃的話:“現(xiàn)在的AI很火,大家都往那邊去,沒有人太關(guān)心體系結(jié)構(gòu)了,我要告訴那些追AI熱點的,它都死了三回了!” 的確,作為從小學(xué)馬列的中國人,我們最熟悉螺旋式上升的概念。對于計算和I/O來講,和中國經(jīng)濟調(diào)控一樣,都是“ 水多了加面,面多了加水”螺旋式上升。

Google在2017年發(fā)布了TPU V1之后,現(xiàn)在已經(jīng)有越來越多的AI startup的芯片出現(xiàn),大家基本上都是用標(biāo)準(zhǔn)的Resnet50,Googlenetv3 等網(wǎng)絡(luò)為benchmark, 一次一次地刷新性能和功耗比,個人覺得很有可能在一天,AI芯片的性能和功耗比在特定的imagenet的任務(wù)上超過人腦,現(xiàn)在AI在準(zhǔn)確率和性能上都超過了。對于AI的芯片來講,有一個指標(biāo)也是大家討論比較多的。Roofline model

Y軸是P,代表算力,用來FLOP/s來表示,現(xiàn)在新出的AI ASIC往往在FLOP/s并不發(fā)力,因為從功耗比的角度上,算力肯定不是越高越好,而且大家都很難高過老黃的核彈。

代表了一個特定的計算平臺的peak performance,就是最大算力。

就是特定的計算平臺的I內(nèi)存/O帶寬,這個和該計算平臺使用的DDR類型有關(guān)。

X軸是I,代表計算強度,就是在一個Byte上的計算量。因為對于一個特定的平臺,我可以知道它的最大算力和帶寬,我們就可以知道它的最大的計算強度。

因此,和圖上顯示的一樣,在點(Imax,),這個計算平臺達(dá)到了完美。在它的左邊,說明memory受限,在它的右邊說明計算受限。

因此,對于我們之前分析的Alexnet這個網(wǎng)絡(luò),我們就知道了它的總的計算量就是:

內(nèi)存訪問量 計算量
Conv1 770235 105415200
Maxpool1 430368
Conv2 1057632 223948800
Maxpool2 273152
Conv3 1057792 149520384
Conv4 1521792 112140288
Conv5 1036160 74760192
Maxpool3 61696
FC1 37766144 37748736
FC2 16789504 16777216
FC3 4102096 4096000
SUM 65021158 724406816

因為對于每一次訪存都是32位的Float Point,因此整個內(nèi)存的占用就是 260MB左右,而計算量是724MFLOPs,因此Alexnet的計算強度就是724/260=2.7 operation/byte。

對于一個特定的平臺,比如老黃家的新的GTX2080Ti 系列來講:

對于計算性能,先不管老黃加各種Tensor Core,RTcore,從CUDA Core本身來講,他是100TLOP/s,

它的內(nèi)存帶寬如下:

因此,作為2080Ti, 它的Imax就是166Operation/Byte.

可能到這個,就可以看出,對于Alex的2.7 來講,遠(yuǎn)遠(yuǎn)沒有達(dá)到2080ti的計算強度,主要是受限于內(nèi)存帶寬了。

在Google的TPU中,有一個圖經(jīng)常被大家引用。

大家基本上可以看到,google的Imax差不多在1000左右,基本上沒有什么網(wǎng)絡(luò)可以完全用滿TPU的peak performance。

怎么辦,內(nèi)存帶寬的解決方案就是HBM,HBM2, HBM3不斷加大帶寬。記得在2017年的CNCC上,謝源教授講,他在2010年左右提出了HBM的概念,他很快就看到了AMD,Nvidia以及Xilinx和Intel都在芯片上使用了HBM,證明了這條道路的正確性。他認(rèn)為目前應(yīng)該在AI芯片上擺脫這種”水多了加面,面多了加水“,in-memory 計算應(yīng)該是下一個方向。

這個就引出了在Memory+會議上來自平頭哥的段立德博士的topic,”Processing Near or In memory for deep learning".

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 芯片
    +關(guān)注

    關(guān)注

    459

    文章

    52350

    瀏覽量

    438637
  • AI
    AI
    +關(guān)注

    關(guān)注

    88

    文章

    34778

    瀏覽量

    277015

原文標(biāo)題:什么是AI芯片“存儲墻”的解決方案?

文章出處:【微信號:SSDFans,微信公眾號:SSDFans】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    曙光存儲全新升級AI存儲方案

    近日,曙光存儲全新升級AI存儲方案,秉持“AI加速”理念,面向AI訓(xùn)練、
    的頭像 發(fā)表于 03-31 11:27 ?453次閱讀

    STM32L431RCT6主芯片 搭配 SD NAND-動態(tài)心電圖設(shè)備存儲解決方案

    貼片式SD卡存儲解決方案,通過硬件與軟件的深度協(xié)同,全面提升了動態(tài)心電圖設(shè)備的性能。 1)大容量存儲,滿足數(shù)據(jù)需求 MKDV08GCL-STPA存儲芯片提供了8Gb的
    發(fā)表于 03-27 10:56

    華為發(fā)布AI WAN解決方案

    在MWC25巴塞羅那期間,華為數(shù)據(jù)通信產(chǎn)品線總裁王雷在產(chǎn)品與解決方案發(fā)布會上正式發(fā)布了AI WAN解決方案。他表示,運營商加速網(wǎng)絡(luò)與AI融合,AI
    的頭像 發(fā)表于 03-05 10:18 ?608次閱讀

    啟明智顯AI解決方案,用AI生活助手角度打開AI智能體的一天

    啟明智顯AI解決方案打造AI生活助手,用AI智能體的角度看AI解決方案能實現(xiàn)哪些功能
    的頭像 發(fā)表于 02-26 14:43 ?582次閱讀
    啟明智顯<b class='flag-5'>AI</b><b class='flag-5'>解決方案</b>,用<b class='flag-5'>AI</b>生活助手角度打開<b class='flag-5'>AI</b>智能體的一天

    廣和通正式推出AI玩具大模型解決方案

    廣和通近期推出了一款創(chuàng)新的AI玩具大模型解決方案,該方案深度融合了豆包等AI大模型,并內(nèi)置了廣和通Cat.1模組,為智能玩具的AI化升級提供
    的頭像 發(fā)表于 01-24 10:36 ?1151次閱讀

    廣和通發(fā)布AI玩具大模型解決方案

    近日,廣和通推出了一項專為AI玩具設(shè)計的創(chuàng)新解決方案——AI玩具大模型解決方案。該方案深度融合了豆包等領(lǐng)先的
    的頭像 發(fā)表于 01-21 14:45 ?1159次閱讀

    廣和通推出AI玩具大模型解決方案

    廣和通推出AI玩具大模型解決方案,該方案深度融合豆包等AI大模型、內(nèi)置廣和通Cat.1模組,助力智能玩具實現(xiàn)AI化升級。該
    的頭像 發(fā)表于 01-21 10:27 ?725次閱讀

    黑芝麻智能與RockAI發(fā)布AI Agent解決方案

    黑芝麻智能與RockAI聯(lián)合發(fā)布基于武當(dāng)C1200家族芯片AI Agent解決方案,該方案將部署于未來的智能座艙應(yīng)用中。
    的頭像 發(fā)表于 01-10 16:33 ?721次閱讀

    企業(yè)AI解決方案包括哪些內(nèi)容

    企業(yè)AI解決方案是一種集成了人工智能技術(shù)的綜合性方案,旨在提高企業(yè)運營效率、降低成本、優(yōu)化業(yè)務(wù)流程,并提升企業(yè)的整體競爭力。那么,企業(yè)AI解決方案
    的頭像 發(fā)表于 01-10 10:15 ?452次閱讀

    聚焦AI芯片,角逐芯未來

    國產(chǎn)AI芯片規(guī)模壯大 在科技高速發(fā)展的今天,算力已成為驅(qū)動行業(yè)創(chuàng)新與變革的核心引擎。中信證券發(fā)布的最新研報,聚焦于國產(chǎn)AI芯片市場的蓬勃發(fā)展
    的頭像 發(fā)表于 01-08 09:10 ?543次閱讀

    中興通訊推出AI FWA全棧解決方案

    近日,在土耳其伊斯坦布爾舉辦的終端用戶大會上,作為全球領(lǐng)先的綜合信息與通信技術(shù)解決方案提供商中興通訊,首次聚焦固定無線接入(FWA)與移動寬帶(MBB)業(yè)務(wù)領(lǐng)域,并隆重推出了業(yè)界首創(chuàng)的AI FWA全
    的頭像 發(fā)表于 11-18 17:10 ?1285次閱讀

    emc存儲解決方案的優(yōu)勢

    在當(dāng)今這個數(shù)據(jù)驅(qū)動的時代,企業(yè)對于數(shù)據(jù)存儲的需求日益增長。EMC,作為全球領(lǐng)先的數(shù)據(jù)存儲解決方案提供商,以其創(chuàng)新的技術(shù)、高性能的產(chǎn)品和全面的服務(wù),幫助企業(yè)實現(xiàn)數(shù)據(jù)的高效管理和利用。 1. 高性能和可
    的頭像 發(fā)表于 11-01 15:16 ?990次閱讀

    基于分布式存儲系統(tǒng)醫(yī)療影像數(shù)據(jù)存儲解決方案

    基于分布式存儲系統(tǒng)醫(yī)療影像數(shù)據(jù)存儲解決方案
    的頭像 發(fā)表于 09-14 09:53 ?654次閱讀
    基于分布式<b class='flag-5'>存儲</b>系統(tǒng)醫(yī)療影像數(shù)據(jù)<b class='flag-5'>存儲</b><b class='flag-5'>解決方案</b>

    基于CSS融合存儲系統(tǒng)的自動化制造服務(wù)平臺存儲解決方案

    基于CSS融合存儲系統(tǒng)的自動化制造服務(wù)平臺存儲解決方案
    的頭像 發(fā)表于 09-10 10:15 ?587次閱讀
    基于CSS融合<b class='flag-5'>存儲</b>系統(tǒng)的自動化制造服務(wù)平臺<b class='flag-5'>存儲</b><b class='flag-5'>解決方案</b>

    憶聯(lián)SSD存儲解決方案亮相2024中國國際金融展

    數(shù)智化時代的存儲解決方案”為主題發(fā)表演講,分享憶聯(lián)如何以高效能SSD存儲解決方案助力AI時代下的金融科技產(chǎn)業(yè)實現(xiàn)存力飛躍。
    的頭像 發(fā)表于 07-22 10:52 ?1053次閱讀
    憶聯(lián)SSD<b class='flag-5'>存儲</b><b class='flag-5'>解決方案</b>亮相2024中國國際金融展
    主站蜘蛛池模板: 色婷婷狠狠 | 激情久久久久久久久久 | www三级| 日韩有色 | 中文字幕一二三四区 | 亚洲国产女人aaa毛片在线 | 欧美精品videofree720p | 999久久久免费精品国产牛牛 | 成人亚洲网| videosxxoo18在线 | 香蕉爱爱网 | 一区二区三区四区精品 | www.免费| 四月激情网 | 美女网站在线观看视频18 | 亚洲成在人线中文字幕 | 手机在线观看a | 久久亚洲国产视频 | 亚洲欧美在线视频免费 | 狠狠操狠狠干 | 黄免费看| 国产拍拍拍免费视频网站 | 日本成人视屏 | 日本理论午夜中文字幕第一页 | 欧美二区三区 | 福利片午夜 | 免费一看一级毛片全播放 | 中文字幕欧美日韩 | 欧美性色视频 | 日日操夜夜爱 | 欧美高清性色生活 | 午夜影院18| 日日射夜夜 | 热re久久精品国产99热 | 天天看天天射天天碰 | 一丝不遮视频免费观看 | 精品国产一二三区 | 天天综合干 | 四虎院影永久在线观看 | 痴女中文字幕在线视频 | 美女网色站|