在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內(nèi)不再提示

一文了解CPU、GPU和TPU的區(qū)別

dKBf_eetop_1 ? 來源:未知 ? 作者:胡薇 ? 2018-09-06 16:53 ? 次閱讀

很多讀者可能分不清楚 CPUGPU 和 TPU 之間的區(qū)別,因此 Google Cloud 將在這篇博客中簡要介紹它們之間的區(qū)別,并討論為什么 TPU 能加速深度學習

張量處理單元(TPU)是一種定制化的 ASIC 芯片,它由谷歌從頭設計,并專門用于機器學習工作負載。TPU 為谷歌的主要產(chǎn)品提供了計算支持,包括翻譯、照片、搜索助理和 Gmail 等。Cloud TPU 將 TPU 作為可擴展的云計算資源,并為所有在 Google Cloud 上運行尖端 ML 模型的開發(fā)者與數(shù)據(jù)科學家提供計算資源。在 Google Next’18 中,我們宣布 TPU v2 現(xiàn)在已經(jīng)得到用戶的廣泛使用,包括那些免費試用用戶,而 TPU v3 目前已經(jīng)發(fā)布了內(nèi)部測試版。

第三代 Cloud TPU

如上為 tpudemo.com 截圖,該網(wǎng)站 PPT 解釋了 TPU 的特性與定義。在本文中,我們將關注 TPU 某些特定的屬性。

神經(jīng)網(wǎng)絡如何運算

在我們對比 CPU、GPU 和 TPU 之前,我們可以先了解到底機器學習或神經(jīng)網(wǎng)絡需要什么樣的計算。如下所示,假設我們使用單層神經(jīng)網(wǎng)絡識別手寫數(shù)字。

如果圖像為 28×28 像素的灰度圖,那么它可以轉化為包含 784 個元素的向量。神經(jīng)元會接收所有 784 個值,并將它們與參數(shù)值(上圖紅線)相乘,因此才能識別為「8」。其中參數(shù)值的作用類似于用「濾波器」從數(shù)據(jù)中抽取特征,因而能計算輸入圖像與「8」之間的相似性:

這是對神經(jīng)網(wǎng)絡做數(shù)據(jù)分類最基礎的解釋,即將數(shù)據(jù)與對應的參數(shù)相乘(上圖兩種顏色的點),并將它們加在一起(上圖右側收集計算結果)。如果我們能得到最高的預測值,那么我們會發(fā)現(xiàn)輸入數(shù)據(jù)與對應參數(shù)非常匹配,這也就最可能是正確的答案。

簡單而言,神經(jīng)網(wǎng)絡在數(shù)據(jù)和參數(shù)之間需要執(zhí)行大量的乘法和加法。我們通常會將這些乘法與加法組合為矩陣運算,這在我們大學的線性代數(shù)中會提到。所以關鍵點是我們該如何快速執(zhí)行大型矩陣運算,同時還需要更小的能耗。

CPU 如何運行

因此 CPU 如何來執(zhí)行這樣的大型矩陣運算任務呢?一般 CPU 是基于馮諾依曼架構的通用處理器,這意味著 CPU 與軟件和內(nèi)存的運行方式如下:

CPU 如何運行:該動圖僅展示了概念性原理,并不反映 CPU 的實際運算行為。

CPU 最大的優(yōu)勢是靈活性。通過馮諾依曼架構,我們可以為數(shù)百萬的不同應用加載任何軟件。我們可以使用 CPU 處理文字、控制火箭引擎、執(zhí)行銀行交易或者使用神經(jīng)網(wǎng)絡分類圖像。

但是,由于 CPU 非常靈活,硬件無法一直了解下一個計算是什么,直到它讀取了軟件的下一個指令。CPU 必須在內(nèi)部將每次計算的結果保存到內(nèi)存中(也被稱為寄存器或 L1 緩存)。內(nèi)存訪問成為 CPU 架構的不足,被稱為馮諾依曼瓶頸。雖然神經(jīng)網(wǎng)絡的大規(guī)模運算中的每一步都是完全可預測的,每一個 CPU 的算術邏輯單元(ALU,控制乘法器和加法器的組件)都只能一個接一個地執(zhí)行它們,每一次都需要訪問內(nèi)存,限制了總體吞吐量,并需要大量的能耗。

GPU 如何工作

為了獲得比 CPU 更高的吞吐量,GPU 使用一種簡單的策略:在單個處理器中使用成千上萬個 ALU?,F(xiàn)代 GPU 通常在單個處理器中擁有 2500-5000 個 ALU,意味著你可以同時執(zhí)行數(shù)千次乘法和加法運算。

GPU 如何工作:這個動畫僅用于概念展示。并不反映真實處理器的實際工作方式。

這種 GPU 架構在有大量并行化的應用中工作得很好,例如在神經(jīng)網(wǎng)絡中的矩陣乘法。實際上,相比 CPU,GPU 在深度學習的典型訓練工作負載中能實現(xiàn)高幾個數(shù)量級的吞吐量。這正是為什么 GPU 是深度學習中最受歡迎的處理器架構。

但是,GPU 仍然是一種通用的處理器,必須支持幾百萬種不同的應用和軟件。這又把我們帶回到了基礎的問題,馮諾依曼瓶頸。在每次幾千個 ALU 的計算中,GPU 都需要訪問寄存器或共享內(nèi)存來讀取和保存中間計算結果。因為 GPU 在其 ALU 上執(zhí)行更多的并行計算,它也會成比例地耗費更多的能量來訪問內(nèi)存,同時也因為復雜的線路而增加 GPU 的物理空間占用。

TPU 如何工作

當谷歌設計 TPU 的時候,我們構建了一種領域特定的架構。這意味著,我們沒有設計一種通用的處理器,而是專用于神經(jīng)網(wǎng)絡工作負載的矩陣處理器。TPU 不能運行文本處理軟件、控制火箭引擎或執(zhí)行銀行業(yè)務,但它們可以為神經(jīng)網(wǎng)絡處理大量的乘法和加法運算,同時 TPU 的速度非???、能耗非常小且物理空間占用也更小。

其主要助因是對馮諾依曼瓶頸的大幅度簡化。因為該處理器的主要任務是矩陣處理,TPU 的硬件設計者知道該運算過程的每個步驟。因此他們放置了成千上萬的乘法器和加法器并將它們直接連接起來,以構建那些運算符的物理矩陣。這被稱作脈動陣列(Systolic Array)架構。在 Cloud TPU v2 的例子中,有兩個 128X128 的脈動陣列,在單個處理器中集成了 32768 個 ALU 的 16 位浮點值。

我們來看看一個脈動陣列如何執(zhí)行神經(jīng)網(wǎng)絡計算。首先,TPU 從內(nèi)存加載參數(shù)到乘法器和加法器的矩陣中。

然后,TPU 從內(nèi)存加載數(shù)據(jù)。當每個乘法被執(zhí)行后,其結果將被傳遞到下一個乘法器,同時執(zhí)行加法。因此結果將是所有數(shù)據(jù)和參數(shù)乘積的和。在大量計算和數(shù)據(jù)傳遞的整個過程中,不需要執(zhí)行任何的內(nèi)存訪問。

這就是為什么 TPU 可以在神經(jīng)網(wǎng)絡運算上達到高計算吞吐量,同時能耗和物理空間都很小。

好處:成本降低至 1/5

因此使用 TPU 架構的好處就是:降低成本。以下是截至 2018 年 8 月(寫這篇文章的時候)Cloud TPU v2 的使用價格。

Cloud TPU v2 的價格,截至 2018 年 8 月。

斯坦福大學發(fā)布了深度學習和推理的基準套裝 DAWNBench。你可以在上面找到不同的任務、模型、計算平臺以及各自的基準結果的組合。

在 DAWNBench 比賽于 2018 年 4 月結束的時候,非 TPU 處理器的最低訓練成本是 72.40 美元(使用現(xiàn)場實例訓練 ResNet-50 達到 93% 準確率)。而使用 Cloud TPU v2 搶占式計價,你可以在 12.87 美元的價格完成相同的訓練結果。這僅相當于非 TPU 的不到 1/5 的成本。這正是神經(jīng)網(wǎng)絡領域特定架構的威力之所在。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • cpu
    cpu
    +關注

    關注

    68

    文章

    10904

    瀏覽量

    213023
  • gpu
    gpu
    +關注

    關注

    28

    文章

    4776

    瀏覽量

    129358
  • TPU
    TPU
    +關注

    關注

    0

    文章

    143

    瀏覽量

    20783

原文標題:CPU、GPU 和 TPU 都是如何工作的?有什么區(qū)別?TPU為什能碾壓GPU? 這篇說的最清楚!

文章出處:【微信號:eetop-1,微信公眾號:EETOP】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    理清CPUGPUTPU的關系

    很多讀者可能分不清楚 CPUGPUTPU 之間的區(qū)別,因此 Google Cloud 將在這篇博客中簡要介紹它們之間的區(qū)別,并討論為
    的頭像 發(fā)表于 09-04 11:12 ?4529次閱讀

    CPU、GPU再到TPU,Google的AI芯片是如何步步進化過來的?

    計算中大量的重復處理過程有著天生的優(yōu)勢。這就好比在畫幅畫的時候CPU是用支筆筆的來畫,而GPU
    發(fā)表于 03-15 11:40

    GPUCPU區(qū)別是什么

    GPU是如何工作的GPU與DSP區(qū)別GPUCPU區(qū)別是什么
    發(fā)表于 01-05 06:15

    CPU,GPU,TPU,NPU都是什么

    嵌入式算法移植優(yōu)化學習筆記5——CPU,GPU,TPU,NPU都是什么、什么是CPU?二、什么是GPU
    發(fā)表于 12-15 06:07

    搞懂 CPU、GPUTPU

    張量處理單元(TPU)是種定制化的 ASIC 芯片,它由谷歌從頭設計,并專門用于機器學習工作負載。TPU 為谷歌的主要產(chǎn)品提供了計算支持,包括翻譯、照片、搜索助理和 Gmail 等。 在本文中,我們將關注
    的頭像 發(fā)表于 09-15 10:46 ?4.4w次閱讀

    TPUGPU的帶寬模型

    帶寬模型最大的限制就是這些計算是針對特定矩陣大小的,計算的難度在各種尺寸之間都不同。例如,如果你的batch size是128,那么GPU的速度會比TPU稍快點。如果batch size小于128
    的頭像 發(fā)表于 10-21 09:20 ?4410次閱讀

    CPUGPUTPU是如何工作的到底有什么區(qū)別

    很多讀者可能分不清楚 CPU、GPUTPU 之間的區(qū)別,因此 Google Cloud 將在這篇博客中簡要介紹它們之間的區(qū)別,并討論為
    的頭像 發(fā)表于 01-20 11:57 ?5739次閱讀

    知道CPUGPU區(qū)別

    對于GPU,大家想必也十分熟悉。但是,大家真的了解GPU嗎?譬如,GPU和顯卡是同個東西嗎?CPU
    的頭像 發(fā)表于 11-23 10:14 ?5855次閱讀

    GPUCPU有什么區(qū)別GPU的詳細介紹

    對于GPU,大家想必也十分熟悉。但是,大家真的了解GPU嗎?譬如,GPU和顯卡是同個東西嗎?CPU
    的頭像 發(fā)表于 11-28 11:23 ?2.4w次閱讀

    CPU、GPU、TPU、NPU等的講解

    CPUGPUTPU、NPU等的講解
    的頭像 發(fā)表于 01-05 14:54 ?1.1w次閱讀

    CPUGPU區(qū)別有哪些

    CPUGPU區(qū)別有哪些呢?接下來簡單給大家介紹下關于GPUCPU
    的頭像 發(fā)表于 01-06 17:07 ?3.1w次閱讀

    什么是CPUGPU、TPU、DPU、NPU、BPU?有什么區(qū)別

    技術日新月異,物聯(lián)網(wǎng)、人工智能、深度學習等遍地開花,各類芯片名詞GPU, TPU, NPU,DPU層出不窮…它們都是什么鬼?又有什么不樣? 01 CPU
    的頭像 發(fā)表于 06-30 08:48 ?1.7w次閱讀
    什么是<b class='flag-5'>CPU</b>、<b class='flag-5'>GPU</b>、<b class='flag-5'>TPU</b>、DPU、NPU、BPU?有什么<b class='flag-5'>區(qū)別</b>?

    gpucpu有什么區(qū)別

    gpucpu有什么區(qū)別GPUCPU是電腦中兩個重要的計算器件。如果想要了解這兩個設備的
    的頭像 發(fā)表于 08-09 16:15 ?1.3w次閱讀

    CPUGPUTPU之間有什么區(qū)別?

    CPUGPUTPU之間有什么區(qū)別? CPU(Central Processing Unit,中央處理器)是
    的頭像 發(fā)表于 12-15 10:10 ?6926次閱讀

    gpu是什么和cpu區(qū)別

    GPUCPU是兩種常見的計算機處理器,它們在結構和功能上有很大的區(qū)別。在這篇文章中,我們將探討GPUCPU
    的頭像 發(fā)表于 02-20 11:24 ?1.9w次閱讀
    主站蜘蛛池模板: 午夜毛片在线观看 | 免费男女 | 天堂bt| 午夜视频久久 | brazzers720欧美丰满 | 天天干天天射天天舔 | 国产亚洲自在精品久久 | 亚洲精品二区中文字幕 | 婷婷色六月 | 男人在线视频 | 欧美性受一区二区三区 | 日本xxxxxxx69xx| 日韩一区二区三区免费 | 欲色淫香 | 日本不卡免费新一区二区三区 | 成人18毛片| 69性成熟xxxxhd| 欧美刺激午夜性久久久久久久 | 欧美美女福利视频 | 久久青草免费免费91线频观看 | 午夜视频网 | 免费在线观看你懂的 | 久久精品久久久 | 国产18到20岁美女毛片 | 成人欧美一区二区三区小说 | 日本免费不卡视频一区二区三区 | 色婷婷六月天 | 亚洲婷婷综合网 | 亚洲狠狠婷婷综合久久久久图片 | 国产女人18毛片水真多18精品 | 亚洲精品午夜久久aaa级久久久 | 黄色成人在线 | 日本免费xxxx色视频 | 激情在线视频 | 亚洲性后网| 成 人在线观看视频网站 | 四虎最新紧急入口4hu | 欧美极品另类xxx | 九九热精品在线观看 | 国产精品福利午夜一级毛片 | 狠狠色噜噜狠狠狠狠色综合久 |