在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

谷歌全新AI架構(gòu),單芯片每秒1000萬億次運算

獨愛72H ? 來源:機器之心Pro ? 作者:機器之心Pro ? 2019-11-18 17:19 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

(文章來源:機器之心Pro)

2016 年底,谷歌 TPU 團隊的十位核心開發(fā)者中的八位悄悄離職,創(chuàng)辦了一家名為 Groq 的機器學習系統(tǒng)公司。在此后的三年里,這家公司一直很低調(diào)。但最近,他們帶著一款名為 TSP 的芯片架構(gòu)出現(xiàn)在公眾視野里。

TSP 的全稱是 Tensor Streaming Processor,專為機器學習等 AI 相關(guān)需求打造。該架構(gòu)在單塊芯片上可以實現(xiàn)每秒 1000 萬億(10 的 15 次方)次運算,是全球首個實現(xiàn)該級別性能的架構(gòu),其浮點運算性能可達每秒 250 萬億次(TFLOPS)。在摩爾定律走向消亡的背景下,這一架構(gòu)的問世標志著芯片之爭從晶體管轉(zhuǎn)向架構(gòu)。

250 TFLOPS 浮點運算性能是什么概念?目前的世界第一超級計算機 Summit,其峰值算力為 200,794.9 TFLOPS,它的背后是 28,000 塊英偉達 Volta GPU。如果 TSP 達到了類似的效率,僅需 803 塊就可以實現(xiàn)同樣的性能。Groq 在一份白皮書中介紹了這項全新的架構(gòu)設(shè)計。此外,他們還將在于美國丹佛舉辦的第 23 屆國際超算高峰論壇上展示這一成果。

我們?yōu)檫@一行業(yè)和我們的客戶感到興奮,Groq 的聯(lián)合創(chuàng)始人和 CEO Jonathan Ross 表示。頂級 GPU 公司都在宣稱他們有望在未來幾年向用戶交付一款每秒百萬億次運算性能的產(chǎn)品,但 Groq 現(xiàn)在就做到了,而且建立了一個新的性能標準。就低延遲和推理速度而言,Groq 的架構(gòu)比其他任何用于推理的架構(gòu)都要快許多倍。我們與用戶的互動證明了這一點。

Groq 的 TSP 架構(gòu)是專為計算機視覺、機器學習和其他 AI 相關(guān)工作負載的性能要求設(shè)計的。對于一大批需要深度學習推理運算的應(yīng)用來說,Groq 的解決方案是非常理想的選擇,Groq 的首席架構(gòu)師 Dennis Abts 表示,但除此之外,Groq 的架構(gòu)還能用于廣泛的工作負載。它的性能和簡潔性使其成為所有高性能即數(shù)據(jù)和計算密集型工作復(fù)雜的理想平臺。

Groq 的這款架構(gòu)受到軟件優(yōu)先(software first)理念的啟發(fā)。它在 Groq 開發(fā)的 TSP 中實現(xiàn),為實現(xiàn)計算靈活性和大規(guī)模并行計算提供了一種新的范式,但沒有傳統(tǒng) GPU 和 CPU 架構(gòu)的限制和溝通開銷。在 Groq 的架構(gòu)中,Groq 編譯器負責編碼所有內(nèi)容:數(shù)據(jù)流入芯片,并在正確的時間和正確的地點插入,以確保計算實時進行,沒有停頓。執(zhí)行規(guī)劃由軟件負責,這樣就可以釋放出原本要用于動態(tài)指令執(zhí)行的寶貴硬件資源。

在傳統(tǒng)的體系架構(gòu)中,將數(shù)據(jù)從 DRAM 移動到處理器需要大量的算力和時間,而且相同工作負載上的處理性能也是可變的。在典型的工作流中,開發(fā)人員通過反復(fù)運行工作負載或程序來對其進行配置和測試,以驗證和度量其平均處理性能。由于處理器接收和發(fā)送數(shù)據(jù)的方式不同,這種處理可能會得到略有差別的結(jié)果,而開發(fā)人員的工作就是手動調(diào)整程序以達到預(yù)定的可靠性級別。

但有了 Groq 的硬件和軟件,編譯器就可以準確地知道芯片的工作方式以及執(zhí)行每個計算所需的時間。編譯器在正確的時間將數(shù)據(jù)和指令移動到正確的位置,這樣就不會有延遲。到達硬件的指令流是完全編排好的,使得處理速度更快,而且可預(yù)測。

為了滿足深度學習等計算密集型任務(wù)的需求,芯片的設(shè)計似乎正在變得越來越復(fù)雜。但 Groq 認為,這種趨勢從根本上就是錯誤的。他們在白皮書中指出,當前處理器架構(gòu)的復(fù)雜性已經(jīng)成為阻礙開發(fā)者生產(chǎn)和 AI 應(yīng)用部署的主要障礙。當前處理器的復(fù)雜性降低了開發(fā)者工作效率,再加上摩爾定律逐漸變慢,實現(xiàn)更高的計算性能變得越來越困難。

Groq 的芯片設(shè)計降低了傳統(tǒng)硬件開發(fā)的復(fù)雜度,因此開發(fā)者可以更加專注于算法(或解決其他問題),而不是為了硬件調(diào)整自己的解決方案。有了這種更加簡單的硬件設(shè)計,開發(fā)者無需進行剖析研究(profiling),因此可以節(jié)省資源,更容易大規(guī)模部署 AI 應(yīng)用。與基于 CPU、GPU 和 FPGA 的傳統(tǒng)復(fù)雜架構(gòu)相比,Groq 的芯片還簡化了認證和部署,使客戶能夠簡單而快速地實現(xiàn)可擴展、單瓦高性能的系統(tǒng)。

Groq 的張量流架構(gòu)可以在任何需要的地方提供算力。與當前領(lǐng)先的 GPU、CPU 相比,Groq 處理器的每個晶體管可以實現(xiàn) 3-6 倍的性能提升。這一改進意味著交付性能的提升、延遲的下降以及成本的降低。結(jié)果是,Groq 的架構(gòu)使用起來更加簡單,而且性能高于傳統(tǒng)計算平臺。

(責任編輯:fqj)

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 芯片
    +關(guān)注

    關(guān)注

    459

    文章

    52443

    瀏覽量

    439800
  • 谷歌
    +關(guān)注

    關(guān)注

    27

    文章

    6231

    瀏覽量

    107995
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    40+TOPS NPU,AI PC處理器開卷算力

    的人工智能任務(wù)。同時,微軟還提出,這款全新電腦搭配擁有全新神經(jīng)處理單元NPU的芯片,可實現(xiàn)每秒超過40萬億
    的頭像 發(fā)表于 07-14 01:11 ?6294次閱讀
    40+TOPS NPU,<b class='flag-5'>AI</b> PC處理器開卷算力

    首創(chuàng)開源架構(gòu),天璣AI開發(fā)套件讓端側(cè)AI模型接入得心應(yīng)手

    套件2.0,打造了一整套圍繞AI開發(fā)效率與落地路徑展開的“系統(tǒng)性解法”,為開發(fā)者提供了AI應(yīng)用開發(fā)工具全家桶。同時,全新升級的旗艦5G智能體AI芯片
    發(fā)表于 04-13 19:52

    谷歌新一代 TPU 芯片 Ironwood:助力大規(guī)模思考與推理的 AI 模型新引擎?

    電子發(fā)燒友網(wǎng)報道(文 / 李彎彎)日前,谷歌在 Cloud Next 大會上,隆重推出了最新一代 TPU AI 加速芯片 ——Ironwood。據(jù)悉,該芯片預(yù)計于今年晚些時候面向 Go
    的頭像 發(fā)表于 04-12 00:57 ?2363次閱讀

    、多次對話與RTC對話AI交互模式,如何各顯神通?

    在這個充滿無限可能的AI時代,這些奇妙場景正逐步走進我們的生活。你可曾想象過,有一天家里的智能設(shè)備會化身相聲演員,和你幽默對答?或者,你的玩具能像知心好友一樣,陪你暢聊心事?對話、多次對話
    的頭像 發(fā)表于 04-02 18:18 ?570次閱讀
    <b class='flag-5'>單</b><b class='flag-5'>次</b>、多次對話與RTC對話<b class='flag-5'>AI</b>交互模式,如何各顯神通?

    曙光存儲全新升級AI存儲方案

    近日,曙光存儲全新升級AI存儲方案,秉持“AI加速”理念,面向AI訓(xùn)練、AI推理和AI成本等需求
    的頭像 發(fā)表于 03-31 11:27 ?488次閱讀

    寶馬發(fā)布全新一代智能電子電氣架構(gòu)

    "超級大腦"賦能寶馬新世代車型智能駕駛樂趣 全新一代電子電氣架構(gòu)搭載新世代車型,覆蓋全動力系統(tǒng)和全細分車型 全新一代電子電氣架構(gòu)集成算力提升20倍,支持
    的頭像 發(fā)表于 03-13 15:42 ?300次閱讀

    驅(qū)動 AI 邊緣計算新時代!高性能 i.MX 95 應(yīng)用平臺引領(lǐng)未來

    TOPS (每秒萬億運算) 的運算能力。這使得推理計算的時間大幅縮短,例如,在運行常見的物體檢測模型 YOLOv5 時,處理單張圖片僅需
    的頭像 發(fā)表于 03-11 08:59 ?469次閱讀
    驅(qū)動 <b class='flag-5'>AI</b> 邊緣計算新時代!高性能 i.MX 95 應(yīng)用平臺引領(lǐng)未來

    谷歌加速AI部門整合:AI Studio團隊并入DeepMind

    近日,谷歌正緊鑼密鼓地推進其人工智能(AI)部門的整合工作。據(jù)谷歌AI Studio主管Logan Kilpatrick在領(lǐng)英頁面上的透露,谷歌
    的頭像 發(fā)表于 01-13 14:40 ?697次閱讀

    《算力芯片 高性能 CPUGPUNPU 微架構(gòu)分析》第3篇閱讀心得:GPU革命:從圖形引擎到AI加速器的蛻變

    在數(shù)據(jù)挖掘工作中,我經(jīng)常需要處理海量數(shù)據(jù)的深度學習任務(wù),這讓我對GPU架構(gòu)和張量運算充滿好奇。閱讀《算力芯片》第7-9章,讓我對這些關(guān)鍵技術(shù)有了全新認識。 GPU
    發(fā)表于 11-24 17:12

    炬芯科技發(fā)布全新端側(cè)AI音頻芯片

    近日,搭載炬芯科技藍牙音頻SoC芯片的新一代AI智能藍牙耳機全新上市!
    的頭像 發(fā)表于 11-21 14:41 ?899次閱讀

    Orin芯片的嵌入式系統(tǒng)

    需求而設(shè)計的,它不僅提供了強大的計算能力,還集成了先進的AI功能,為嵌入式系統(tǒng)的發(fā)展帶來了革命性的變化。 一、Orin芯片的核心技術(shù) Orin芯片基于NVIDIA的Ampere架構(gòu),擁
    的頭像 發(fā)表于 10-27 16:43 ?1318次閱讀

    Orin芯片功耗分析

    是NVIDIA推出的一款專為自動駕駛設(shè)計的系統(tǒng)級芯片(SoC),它基于Arm架構(gòu),采用了先進的制程技術(shù)。Orin芯片集成了多個高性能的CPU核心、GPU核心以及深度學習加速器(DLA),能夠提供高達200 TOPS(
    的頭像 發(fā)表于 10-27 15:45 ?2036次閱讀

    基于迅為RK3588開發(fā)板的AI圖像識別方案

    源源不斷的動力。 ■ 無與倫比的視覺盛宴最高支持8K編碼+8K解碼,能夠同時處理多路視頻流,確保每一幀畫面都流暢如絲,細膩入微。 ■ 智馭未來的AI力量RK3588內(nèi)置了6Tops(即每秒處理6萬億
    發(fā)表于 08-13 11:26

    蘋果承認使用谷歌芯片來訓(xùn)練AI

    蘋果公司最近在一篇技術(shù)論文中披露,其先進的人工智能系統(tǒng)Apple Intelligence背后的兩個關(guān)鍵AI模型,是在谷歌設(shè)計的云端芯片上完成預(yù)訓(xùn)練的。這一消息標志著在尖端AI訓(xùn)練領(lǐng)域
    的頭像 發(fā)表于 07-30 17:03 ?906次閱讀

    解析OrangePi AIpro:什么是 TOPS,為什么它對?AI?PC很重要?

    )的處理器(CPU),以提升人工智能特定性能。TOPS是“TeraOperationsPerSecond”(每秒萬億運算)的縮寫,它表示系統(tǒng)每秒
    的頭像 發(fā)表于 07-29 14:50 ?993次閱讀
    解析OrangePi AIpro:什么是 TOPS,為什么它對?<b class='flag-5'>AI</b>?PC很重要?
    主站蜘蛛池模板: 色多多视频成人影院 | 好吊色7777sao在线视频观看 | 色之综合天天综合色天天棕色 | 天天爽天天爱 | 午夜100| 国产精品一区在线播放 | 曰本裸色私人影院噜噜噜影院 | 六月婷婷精品视频在线观看 | 国产精品永久免费自在线观看 | 亚洲色图在线播放 | 甘婷婷一级毛片免费看 | 亚洲午夜在线视频 | 一级大片视频 | 天堂最新版免费观看 | 欧洲亚洲国产精华液 | 日本网站免费 | 男人一级片 | 日本三区四区免费高清不卡 | 精品三级内地国产在线观看 | 男人午夜视频 | 在线观看精品国产福利片100 | 午夜精品久久久久久久 | 国产一级做a爱免费视频 | 国产高清免费在线观看 | 日本特黄特色大片免费播放视频 | 爱爱免费视频网站 | 狠狠操天天 | 午夜看片网站 | 欧美黄色片 一级片 | 天堂视频网| 天天爽天天干 | 国产精品乳摇在线播放 | 亚洲免费看片 | 九九热在线观看 | 韩国成人毛片aaa黄 韩国床戏合集三小时hd中字 | 五月婷婷之综合激情 | 妖精视频亚洲 | 国产亚洲卡二卡3卡4卡乱码 | 免费看美女的逼 | 天天干在线免费视频 | 手机看片免费福利 |