在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線(xiàn)課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

ARM發(fā)布第一代面向AI和機(jī)器學(xué)習(xí)的處理器,架構(gòu)名為“Trillium”

DPVg_AI_era ? 來(lái)源:未知 ? 作者:李倩 ? 2018-08-27 08:32 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

ARM發(fā)布第一代面向AI機(jī)器學(xué)習(xí)處理器,架構(gòu)名為“Trillium”,吸收了從硬件、數(shù)據(jù)壓縮和編譯器方面最成功的創(chuàng)新中的優(yōu)點(diǎn),其實(shí)是一款兼采眾家之長(zhǎng)的“聚合體”。ARM表示,該處理器舍棄了高速緩存,兼具英偉達(dá)TensorCore的功能、FPGA的可編程性,以及DSP的低功耗處理能力。

在過(guò)去的幾年中,有幾家芯片創(chuàng)業(yè)公司一直致力于尋找新的方法來(lái)有效地訓(xùn)練和執(zhí)行神經(jīng)網(wǎng)絡(luò),但在現(xiàn)有技術(shù)和理念的基礎(chǔ)上,其實(shí)真的必要從頭做起嗎?

本周,在一年一度的Hot Chips會(huì)議上,ARM展示了其第一代機(jī)器學(xué)習(xí)處理器,預(yù)計(jì)今年晚些時(shí)候,ARM的合作伙伴就可以使用其IP。

兼采眾長(zhǎng),ARM“拼”出世界最好的AI處理器

該處理器架構(gòu)名為“Trillium”,是由一些我們并不陌生的元素與ARM的邏輯核心捆綁而來(lái)的,對(duì)于那些需要Nvidia Volta GPU的TensorCore功能的人來(lái)說(shuō),ARM這款處理器可能意義重大,比如DeePhi神經(jīng)網(wǎng)絡(luò)壓縮技術(shù)(現(xiàn)在是Xilinx的一部分)、FPGA的可編程性,以及DSP的低功耗處理能力。

換句話(huà)說(shuō),ARM可能剛剛“拼湊”出了世界上最好的AI處理器,這對(duì)于那些在大型通用設(shè)備上放置大量額外空間的芯片制造商來(lái)說(shuō),可能會(huì)帶來(lái)很大的麻煩。

ARM的技術(shù)總監(jiān)Ian Bratt本周在Hot Chips上表示,ARM首次涉足AI處理器的設(shè)計(jì)目標(biāo)是盡可能的推廣,以便能夠滿(mǎn)足服務(wù)器端AI的市場(chǎng)需求,并將自家AI處理器更多用于汽車(chē)和具有物聯(lián)網(wǎng)需求的小型設(shè)備上。

Bratt表示:

“在研發(fā)第一代機(jī)器學(xué)習(xí)處理器的過(guò)程中,我們初期出現(xiàn)了一些失誤,將舊框架套用在新問(wèn)題上。我們知道GPU、CPU和DSP是如何用于機(jī)器學(xué)習(xí)上的,但我們開(kāi)始研究如何能夠清晰地利用每一項(xiàng)技術(shù)。我們可以利用CPU的技術(shù)處理控制和可編程性問(wèn)題,用GPU的技術(shù)解決數(shù)據(jù)壓縮、數(shù)據(jù)移動(dòng)和計(jì)算密度等問(wèn)題,這些都可以提高DSP的效率和開(kāi)源軟件的開(kāi)發(fā)。”

如下圖所示,ARM的機(jī)器學(xué)習(xí)架構(gòu)并沒(méi)有什么特別之處,但值得注意的是,該架構(gòu)吸收了從硬件、壓縮和編譯器方面最成功的創(chuàng)新中的優(yōu)點(diǎn)。

搭建架構(gòu)的模塊是計(jì)算引擎,每塊為64 KB的SRAM片,共16塊。 MAC引擎(與英偉達(dá)的TensorCore不同)是執(zhí)行卷積化的地方,可編程層引擎負(fù)責(zé)處理網(wǎng)絡(luò)各層之間的大部分必要的shuffling。該架構(gòu)具有DMA引擎,用于與外部存儲(chǔ)器接口進(jìn)行通信。 ARM自己的Cortex技術(shù)負(fù)責(zé)的引擎控制。

不再需要緩存,控制流程大大簡(jiǎn)化

對(duì)于一家以創(chuàng)新為基礎(chǔ)公司而言,ARM正在走一條自己的獨(dú)特道路。公司首次涉足人工智能芯片,芯片的組件都是大家并不陌生的,ARM在用于神經(jīng)網(wǎng)絡(luò)的點(diǎn)積(dot product)引擎上做出了一些關(guān)鍵性創(chuàng)新,提升了執(zhí)行效率、降低了網(wǎng)絡(luò)噪音。

我們很可能忽略的一個(gè)要素是,靜態(tài)調(diào)度(static scheduling)的價(jià)值,這是影響芯片整體性能和效率的關(guān)鍵部分。

存儲(chǔ)器的訪(fǎng)問(wèn)模式完全是可靜態(tài)分析的,并且很容易理解和映射,但是許多設(shè)備沒(méi)有利用這一點(diǎn)。 CPU具有復(fù)雜的高速緩存層次結(jié)構(gòu),可以用于非確定性存儲(chǔ)器訪(fǎng)問(wèn)進(jìn)行優(yōu)化,但對(duì)于確定性的神經(jīng)網(wǎng)絡(luò),可以提前將所有內(nèi)容放在內(nèi)存中。然后,編譯器為不同的組件生成命令流(由ARM控制處理器進(jìn)行編配),到達(dá)寄存器以控制這些組件。

簡(jiǎn)而言之就是:不需要緩存。此外還有一個(gè)好處是流量控制流程被大大簡(jiǎn)化,可以進(jìn)一步降低能耗,提升處理器性能的可預(yù)測(cè)性。

處理卷積化的方式可以進(jìn)一步提高效率。下圖中的SRAM突出了編譯器是如何為輸入特征映射和壓縮模型分配部分資源的。每個(gè)計(jì)算引擎都將使用跨越不同計(jì)算引擎的不同特征映射。

ARM的MAC引擎可以做8個(gè)16×16點(diǎn)積。我們已經(jīng)討論了這一點(diǎn)的重要性,但是在這些操作中有很多零,可以在MAC引擎中進(jìn)行檢測(cè)和調(diào)整,以避免浪費(fèi)更多的能量。

ARM芯片還具備可編程層引擎,旨在通過(guò)可編程性“預(yù)見(jiàn)”處理器的。它使用Cortex CPU技術(shù)來(lái)支持非卷積運(yùn)算符,以及向量和神經(jīng)網(wǎng)絡(luò)擴(kuò)展。

使用機(jī)器學(xué)習(xí)處理器特征映射壓縮技術(shù)可以獲得更高的效率,這些技術(shù)聽(tīng)起來(lái)和DeePhi在CNN壓縮上的作用類(lèi)似。

打造通用平臺(tái),實(shí)現(xiàn)機(jī)器學(xué)習(xí)與現(xiàn)有流程的整合

Bratt表示,目前ARM的機(jī)器學(xué)習(xí)業(yè)務(wù)部門(mén)擁有150名員工,隨著對(duì)機(jī)器學(xué)習(xí)需求的不斷增長(zhǎng),這一數(shù)字也會(huì)不斷增加,并將機(jī)器學(xué)習(xí)整合到新的和現(xiàn)有的工作流程和配置中。他表示,我們的目標(biāo)是讓這項(xiàng)工作橫跨一系列細(xì)分市場(chǎng),但是要為一類(lèi)用戶(hù)提供一個(gè)具備其所需全部功能的通用平臺(tái)并不簡(jiǎn)單。

不用高速緩存、精簡(jiǎn)壓縮流程、使用混合精度算法,并與精簡(jiǎn)化的SRAM片上計(jì)算相結(jié)合,將其移植到密集的點(diǎn)積引擎上,這些都使得ARM的芯片IP成為市場(chǎng)上的一個(gè)引人注目的焦點(diǎn),而且可以針對(duì)關(guān)鍵的工作負(fù)載做進(jìn)一步的細(xì)化。

與某些AI專(zhuān)用處理器相比,ARM處理器增加了高帶寬內(nèi)存(HMC)可能使其更容易識(shí)別,但是需要授權(quán)用戶(hù)了解這些組件系統(tǒng)中協(xié)同工作的方式。 ARM工程師真正從生態(tài)系統(tǒng)中汲取了最佳的AI處理器技術(shù),并使用開(kāi)源軟件掛鉤,可能大幅擴(kuò)大授權(quán)許可范圍。

上圖所示為Inception V3上的8X8塊,突出表示了通過(guò)零/非零濾波方法實(shí)施的無(wú)損壓縮結(jié)果,顯著降低了神經(jīng)網(wǎng)絡(luò)的規(guī)模。壓縮結(jié)果保留在內(nèi)部SRAM中,并且在SRAM中保留了網(wǎng)絡(luò)修剪技術(shù),以便在需要時(shí)使用。

對(duì)這類(lèi)技術(shù)進(jìn)行授權(quán)時(shí)的選擇并不多,同時(shí)ARM也要確定,在現(xiàn)有的神經(jīng)網(wǎng)絡(luò)處理器中有哪些最成功的、值得汲取的技術(shù)和組件。

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • ARM
    ARM
    +關(guān)注

    關(guān)注

    134

    文章

    9347

    瀏覽量

    377068
  • 編譯器
    +關(guān)注

    關(guān)注

    1

    文章

    1661

    瀏覽量

    50164
  • 機(jī)器學(xué)習(xí)

    關(guān)注

    66

    文章

    8501

    瀏覽量

    134520

原文標(biāo)題:Arm首代AI架構(gòu)如此彪悍!集英偉達(dá)、英特爾、賽靈思三位優(yōu)勢(shì)于一體

文章出處:【微信號(hào):AI_era,微信公眾號(hào):新智元】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    第一代半導(dǎo)體被淘汰了嗎

    在半導(dǎo)體產(chǎn)業(yè)的百年發(fā)展歷程中,“第一代半導(dǎo)體是否被淘汰”的爭(zhēng)議從未停歇。從早期的鍺晶體管到如今的硅基芯片,以硅為代表的第一代半導(dǎo)體材料,始終以不可替代的產(chǎn)業(yè)基石角色,支撐著全球95%以上的電子設(shè)備
    的頭像 發(fā)表于 05-14 17:38 ?329次閱讀
    <b class='flag-5'>第一代</b>半導(dǎo)體被淘汰了嗎

    芯馳科技重磅發(fā)布最新一代AI座艙芯片X10

    近日,上海國(guó)際車(chē)展期間,芯馳科技重磅發(fā)布最新一代AI座艙芯片X10。在X9系列智能座艙產(chǎn)品數(shù)百萬(wàn)片量產(chǎn)交付的基礎(chǔ)上,芯馳以X10卓越的性能、創(chuàng)新的架構(gòu)以及豐富的
    的頭像 發(fā)表于 04-27 15:56 ?531次閱讀

    面向AI機(jī)器學(xué)習(xí)應(yīng)用的開(kāi)發(fā)平臺(tái) AMD/Xilinx Versal? AI Edge VEK280

    AMD/Xilinx Versal? AI Edge VEK280評(píng)估套件是面向AI機(jī)器學(xué)習(xí)
    的頭像 發(fā)表于 04-11 18:33 ?1273次閱讀
    <b class='flag-5'>面向</b><b class='flag-5'>AI</b>與<b class='flag-5'>機(jī)器</b><b class='flag-5'>學(xué)習(xí)</b>應(yīng)用的開(kāi)發(fā)平臺(tái) AMD/Xilinx Versal? <b class='flag-5'>AI</b> Edge VEK280

    芯原推出新一代集成AI的ISP9000圖像信號(hào)處理器,賦能智能視覺(jué)應(yīng)用

    芯原股份今日發(fā)布其ISP9000系列圖像信號(hào)處理器(ISP)IP——面向日益增長(zhǎng)的智能視覺(jué)應(yīng)用需求而打造的新一代AI ISP解決方案。ISP
    的頭像 發(fā)表于 04-02 10:43 ?373次閱讀

    Arm發(fā)布基于Armv9架構(gòu)的Cortex-A320處理器

    邊緣 AI 需要更卓越的計(jì)算性能、更強(qiáng)大的安全性,以及更出色的軟件靈活性。隨著軟件愈發(fā)復(fù)雜化,Armv9 架構(gòu)應(yīng)運(yùn)而生,以提供先進(jìn)的機(jī)器學(xué)習(xí) (ML) 和
    的頭像 發(fā)表于 02-27 17:10 ?778次閱讀

    文詳解Arm架構(gòu)Armv9.6-A中的最新功能

    Arm CPU 是當(dāng)今人工智能 (AI) 賦能軟件的關(guān)鍵,它可解釋、處理和執(zhí)行指令。Arm 指令集架構(gòu) (ISA) 作為硬件和軟件的接口,指
    的頭像 發(fā)表于 12-17 10:22 ?3426次閱讀
    <b class='flag-5'>一</b>文詳解<b class='flag-5'>Arm</b><b class='flag-5'>架構(gòu)</b>Armv9.6-A中的最新功能

    如何學(xué)習(xí)ARM

    ,編寫(xiě)些小型的程序,并進(jìn)行調(diào)試和測(cè)試。通過(guò)實(shí)踐項(xiàng)目,可以加深對(duì) ARM 處理器架構(gòu)的理解和應(yīng)用。 5.深入研究高級(jí)主題: 如果你對(duì) ARM
    發(fā)表于 10-11 10:42

    【「大模型時(shí)代的基礎(chǔ)架構(gòu)」閱讀體驗(yàn)】+ 第一、二章學(xué)習(xí)感受

    今天閱讀了《大模型時(shí)代的基礎(chǔ)架構(gòu)》前兩章,還是比較輕松舒適的;再就是本書(shū)知識(shí)和我的工作領(lǐng)域沒(méi)有任何關(guān)聯(lián),切都是新鮮的,似乎每讀頁(yè)都會(huì)有所收獲,這種快樂(lè)的學(xué)習(xí)過(guò)程感覺(jué)也挺不錯(cuò)的。
    發(fā)表于 10-10 10:36

    ARM處理器和CPU有什么區(qū)別

    ARM處理器和CPU(中央處理器)之間的關(guān)系及區(qū)別,可以從多個(gè)維度進(jìn)行深入探討。首先,需要明確的是,ARM處理器并非
    的頭像 發(fā)表于 09-10 11:24 ?3283次閱讀

    ARM處理器的寄存組織及功能

    ARM處理器的寄存組織是其核心架構(gòu)的重要組成部分,對(duì)于理解ARM處理器的運(yùn)行機(jī)制和性能特點(diǎn)具有
    的頭像 發(fā)表于 09-10 11:11 ?2686次閱讀

    ARM處理器和CISC處理器的區(qū)別

    ARM處理器和CISC(復(fù)雜指令集計(jì)算機(jī))處理器在多個(gè)方面存在顯著的區(qū)別。這些區(qū)別主要體現(xiàn)在架構(gòu)原理、性能與功耗、設(shè)計(jì)目標(biāo)、應(yīng)用領(lǐng)域以及市場(chǎng)生態(tài)等方面。
    的頭像 發(fā)表于 09-10 11:10 ?961次閱讀

    ARM處理器的結(jié)構(gòu)和特點(diǎn)

    ARM處理器,全稱(chēng)Advanced RISC Machines,是種基于精簡(jiǎn)指令集(RISC)架構(gòu)的微處理器。其結(jié)構(gòu)和特點(diǎn)在嵌入式系統(tǒng)、移
    的頭像 發(fā)表于 09-10 11:09 ?3402次閱讀

    ARM處理器概述和發(fā)展歷程

    ARM處理器種基于RISC(精簡(jiǎn)指令集計(jì)算機(jī))架構(gòu)的高性能微處理器,由英國(guó)公司ARM(Adv
    的頭像 發(fā)表于 09-10 11:07 ?1962次閱讀

    英特爾發(fā)布第一代車(chē)載銳炫獨(dú)立顯卡

    英特爾震撼發(fā)布第一代車(chē)載英特爾銳炫獨(dú)立顯卡,標(biāo)志著智能座艙技術(shù)邁入全新階段。這款顯卡平臺(tái)算力高達(dá)229TOPS,不僅支持多達(dá)8塊獨(dú)立顯示屏,更可流暢播放4K高清內(nèi)容,為用戶(hù)帶來(lái)前所未有的視覺(jué)盛宴。
    的頭像 發(fā)表于 08-09 14:54 ?829次閱讀

    6nm異構(gòu)多核!國(guó)內(nèi)首款Arm架構(gòu)AI PC處理器此芯P1發(fā)布

    計(jì)算平臺(tái)因此得到了廣泛的關(guān)注。現(xiàn)在,國(guó)內(nèi)公司也完成了Arm架構(gòu)AI PC處理器“破冰”,開(kāi)始揚(yáng)帆啟航。 ? 7月30日,在以“從此芯出發(fā)”為主題的此芯科技
    的頭像 發(fā)表于 08-01 01:21 ?4951次閱讀
    6nm異構(gòu)多核!國(guó)內(nèi)首款<b class='flag-5'>Arm</b><b class='flag-5'>架構(gòu)</b><b class='flag-5'>AI</b> PC<b class='flag-5'>處理器</b>此芯P1<b class='flag-5'>發(fā)布</b>
    主站蜘蛛池模板: 日本三级电影在线观看 | 在线观看免费视频 | 欧美性视频一区二区三区 | 天天爱天天射 | 国产啊v在线观看 | 久久大伊人| 日操夜操天天操 | 午夜视频免费国产在线 | 嫩草影院永久入口在线观看 | 欧美成人免费全部观看天天性色 | 日本精品高清一区二区2021 | 久久久噜噜噜久久网 | 狠狠色狠狠色综合网 | 激情综合婷婷丁香六月花 | 免费a级毛片出奶水 | 日本欧洲亚洲一区在线观看 | 99草精品视频 | 天天好比 | 国产福利资源在线 | 欧美色频| 手机看片福利盒子久久 | 免费能看的黄色网址 | 国产精品好好热在线观看 | 免费在线观看理论片 | 色婷婷狠狠久久综合五月 | 国产精品高清一区二区三区不卡 | 97影院理论在线观看 | 成人国产亚洲欧美成人综合网 | 国产亚洲婷婷香蕉久久精品 | 大尺度视频在线 | 在线免费你懂的 | h色小视频 | 4438x色| 人人舔 | 天天躁夜夜 | 97午夜影院 | 成年人激情视频 | 美女扒开尿囗给男生桶爽 | 色老头久久网 | 精品一级毛片 | 7777在线 |