在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

用于智能邊緣計(jì)算的嵌入式深度學(xué)習(xí)推理解決方案

我快閉嘴 ? 來(lái)源:千家網(wǎng) ? 作者:蒙光偉 ? 2020-09-04 12:21 ? 次閱讀

在過(guò)去的幾年中,人工智能領(lǐng)域已進(jìn)入高速增長(zhǎng)階段,這在很大程度上受諸如深度學(xué)習(xí)(DL)和強(qiáng)化學(xué)習(xí)(RL)之類的機(jī)器學(xué)習(xí)方法的推動(dòng)。這些技術(shù)的組合展示了在解決各種問(wèn)題方面的空前性能,這些問(wèn)題從以超人的角度玩Go到像專家一樣診斷癌癥。

在我們以前的博客中,智能物聯(lián)網(wǎng)和霧計(jì)算趨勢(shì)以及物聯(lián)網(wǎng)中無(wú)處不在的計(jì)算機(jī)視覺(jué)的興起,我們談到了物聯(lián)網(wǎng)中DL的一些有趣用例。應(yīng)用將是廣泛而深入的。它們將在未來(lái)幾十年內(nèi)刺激對(duì)新型處理器的需求。

深度學(xué)習(xí)工作流程概述

DL / RL創(chuàng)新正以驚人的速度發(fā)生(每年在眾多與AI相關(guān)的會(huì)議上發(fā)表數(shù)千篇有關(guān)新算法的論文)。盡管預(yù)測(cè)最終的解決方案為時(shí)尚早,但硬件公司正在爭(zhēng)相構(gòu)建處理器、工具和框架。他們?cè)噲D利用多年研究人員的經(jīng)驗(yàn)來(lái)確定DL工作流程中的痛點(diǎn)和瓶頸。

訓(xùn)練DL模型的平臺(tái)

讓我們從培訓(xùn)平臺(tái)開始。基于圖形處理單元(GPU)的系統(tǒng)通常是訓(xùn)練高級(jí)DL模型的選擇。Nvidia早已意識(shí)到將GPU用于通用高性能計(jì)算的優(yōu)勢(shì)。

GPU有數(shù)百個(gè)計(jì)算核心,它們支持大量的硬件線程和高吞吐量的浮點(diǎn)計(jì)算。 Nvidia開發(fā)了Compute Unified Device Architecture(CUDA)編程框架,使GPU友好地供科學(xué)家和機(jī)器學(xué)習(xí)專家使用。

CUDA工具鏈改善了耗時(shí)問(wèn)題,為研究人員提供了一種靈活而友好的方式來(lái)實(shí)現(xiàn)高度復(fù)雜的算法。幾年前,Nvidia恰當(dāng)?shù)匕l(fā)現(xiàn)了DL的機(jī)會(huì),并為大多數(shù)DL運(yùn)營(yíng)不斷開發(fā)CUDA支持。 Caffe、Torch和Tensorflow等標(biāo)準(zhǔn)框架均支持CUDA。

在AWS之類的云服務(wù)中,開發(fā)人員可以選擇使用CPU還是GPU(更具體地說(shuō)是Nvidia GPU)。平臺(tái)的選擇取決于神經(jīng)網(wǎng)絡(luò)的復(fù)雜性、預(yù)算和時(shí)間。基于GPU的系統(tǒng)通常可以比CPU減少訓(xùn)練時(shí)間幾倍,但價(jià)格更高。

GPU / CPU的替代品

替代品來(lái)了。 Khronos在2009年提出了OpenCL,這是一種用于在各種硬件(例如CPU、GPU、DSPFPGA)上進(jìn)行并行計(jì)算的開放標(biāo)準(zhǔn)。它將使其他處理器(如AMD GPU)進(jìn)入DL培訓(xùn)市場(chǎng),為開發(fā)人員提供更多選擇。

但是,它在DL庫(kù)支持方面仍落后于CUDA。希望這種情況在未來(lái)幾年內(nèi)會(huì)有所改善。英特爾還通過(guò)收購(gòu)Nervana開發(fā)了針對(duì)DL培訓(xùn)定制的處理器。

DL推理的競(jìng)爭(zhēng)格局

DL推理是一個(gè)競(jìng)爭(zhēng)激烈的市場(chǎng)。通常可以根據(jù)用例的要求在多個(gè)級(jí)別上部署應(yīng)用:

云/企業(yè):圖像分類、網(wǎng)絡(luò)安全、文本分析、NLP等。

智能網(wǎng)關(guān):生物識(shí)別、語(yǔ)音識(shí)別、智能代理等。

邊緣端點(diǎn):移動(dòng)設(shè)備、智能相機(jī)等。

云推理

在Google、Facebook、百度或阿里巴巴等互聯(lián)網(wǎng)巨頭的大力推動(dòng)下,云推理市場(chǎng)將實(shí)現(xiàn)巨大的增長(zhǎng)。例如,Google Cloud和Microsoft Azure提供了非常強(qiáng)大的圖像分類、自然語(yǔ)言處理和面部識(shí)別API,開發(fā)人員可以輕松地將其集成到他們的云應(yīng)用中。

云推理平臺(tái)將需要可靠地支持?jǐn)?shù)百萬(wàn)并發(fā)用戶。擴(kuò)展吞吐量的能力至關(guān)重要。此外,降低能耗是控制服務(wù)運(yùn)營(yíng)成本的另一個(gè)重中之重。

在云推理空間上,除GPU外,數(shù)據(jù)中心還使用FPGA或定制處理器來(lái)使云推理應(yīng)用更具成本效益和功效。例如,Microsoft Project Brainwave使用英特爾FPGA來(lái)證明在運(yùn)行諸如CNN、LSTM等的DL算法時(shí)的強(qiáng)大性能和靈活性。

FPGA具有優(yōu)勢(shì)。硬件邏輯、計(jì)算內(nèi)核和內(nèi)存配置可針對(duì)特定類型的神經(jīng)網(wǎng)絡(luò)進(jìn)行定制,從而使其更有效地處理預(yù)訓(xùn)練模型。但是,一個(gè)缺點(diǎn)是與CPU或CUDA相比編程困難。如上一節(jié)所述,OpenCL將有助于使FPGA對(duì)軟件開發(fā)人員更加友好。

除了FPGA之外,Google還制造了定制的處理器,稱為TPU。它是一種專注于高效矩陣計(jì)算的ASIC。但是,僅Google自己的服務(wù)支持該功能。

用于智能邊緣計(jì)算的嵌入式DL推理

在邊緣,DL推理解決方案需要解決針對(duì)不同用例和市場(chǎng)的多種需求。

自動(dòng)駕駛平臺(tái)

自動(dòng)駕駛平臺(tái)目前是最熱門的市場(chǎng),最新的DL和RL方法正在應(yīng)用中,以實(shí)現(xiàn)最高水平的自動(dòng)駕駛。 Nvidia一直領(lǐng)導(dǎo)著從Tegra到Xavier的幾類DL SoC市場(chǎng)。 例如,Xavier SoC內(nèi)置于Nvidia的Drive PX平臺(tái)中,該平臺(tái)可實(shí)現(xiàn)多達(dá)320個(gè)TFLOP。 它的目標(biāo)是5級(jí)自動(dòng)駕駛。

移動(dòng)處理器

另一個(gè)快速增長(zhǎng)的領(lǐng)域是移動(dòng)應(yīng)用處理器。 DL啟用了智能手機(jī)上以前無(wú)法實(shí)現(xiàn)的新功能。 一個(gè)例子是蘋果將神經(jīng)引擎集成到A11 Bionic芯片中,從而使其能夠在iPhone X上添加高精度面部鎖定。

中國(guó)芯片制造海思半導(dǎo)體還發(fā)布了麒麟970處理器,該處理器具有神經(jīng)處理單元(NPU)。 華為的一些最新智能手機(jī)(圖4)已經(jīng)使用新的DL處理器進(jìn)行了設(shè)計(jì)。 例如,使用NPU,智能手機(jī)相機(jī)會(huì)“知道”正在查看的內(nèi)容,并會(huì)根據(jù)場(chǎng)景的主體(例如人、植物、風(fēng)景等)自動(dòng)調(diào)整相機(jī)設(shè)置。

新架構(gòu)

值得一提的是,有一類新的處理器,稱為神經(jīng)形態(tài)處理器,它緊密模仿人類大腦神經(jīng)元和突觸的機(jī)制。他們可以實(shí)現(xiàn)一種稱為“脈沖神經(jīng)網(wǎng)絡(luò)(SNN)”的神經(jīng)網(wǎng)絡(luò),它可以在空間和時(shí)間域中學(xué)習(xí)。

原則上,與現(xiàn)有的DL架構(gòu)相比,它們具有更高的能源效率,并且在解決在線機(jī)器學(xué)習(xí)問(wèn)題方面具有優(yōu)勢(shì)。

IBM的TrueNorth和英特爾的Loihi基于神經(jīng)形態(tài)架構(gòu)。研究人員正在探索這些芯片的功能,顯示出一些潛力。目前尚不清楚何時(shí)將新型處理器準(zhǔn)備用于廣泛的商業(yè)用途。諸如Applied Brain Research和Brainchip之類的許多初創(chuàng)公司也專注于這一領(lǐng)域,開發(fā)工具和IP。

這是一個(gè)有趣的時(shí)代

在短短的幾年內(nèi),AI / DL / RL / ML已成為許多行業(yè)的重要工具。從IP、處理器、系統(tǒng)設(shè)計(jì)到工具鏈和軟件方法論的底層生態(tài)系統(tǒng)已經(jīng)進(jìn)入了快速的創(chuàng)新周期。新的處理器將支持許多以前無(wú)法實(shí)現(xiàn)的新物聯(lián)網(wǎng)應(yīng)用。

但是,物聯(lián)網(wǎng)和機(jī)器學(xué)習(xí)應(yīng)用仍在不斷發(fā)展。芯片設(shè)計(jì)人員和開發(fā)人員將需要幾代處理器才能提出正確的架構(gòu)組合,從而滿足各種市場(chǎng)的需求。在以后的文章中,我們將更深入地研究各種垂直領(lǐng)域的計(jì)算平臺(tái)。
責(zé)任編輯:tzh

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 處理器
    +關(guān)注

    關(guān)注

    68

    文章

    19491

    瀏覽量

    231564
  • 物聯(lián)網(wǎng)
    +關(guān)注

    關(guān)注

    2914

    文章

    45076

    瀏覽量

    378639
  • 機(jī)器學(xué)習(xí)

    關(guān)注

    66

    文章

    8458

    瀏覽量

    133246
  • 深度學(xué)習(xí)
    +關(guān)注

    關(guān)注

    73

    文章

    5523

    瀏覽量

    121731
收藏 人收藏

    評(píng)論

    相關(guān)推薦

    嵌入式機(jī)器學(xué)習(xí)的應(yīng)用特性與軟件開發(fā)環(huán)境

    設(shè)備和智能傳感器)上,這些設(shè)備通常具有有限的計(jì)算能力、存儲(chǔ)空間和功耗。本文將您介紹嵌入式機(jī)器學(xué)習(xí)的應(yīng)用特性,以及常見(jiàn)的機(jī)器學(xué)習(xí)開發(fā)軟件與開發(fā)
    的頭像 發(fā)表于 01-25 17:05 ?231次閱讀
    <b class='flag-5'>嵌入式</b>機(jī)器<b class='flag-5'>學(xué)習(xí)</b>的應(yīng)用特性與軟件開發(fā)環(huán)境

    新手怎么學(xué)嵌入式?

    基本的概念。嵌入式系統(tǒng)是一種將計(jì)算機(jī)技術(shù)嵌入到特定設(shè)備中的系統(tǒng),它通常具有特定的功能和有限的資源。你需要學(xué)習(xí)一些計(jì)算機(jī)基礎(chǔ)知識(shí),如數(shù)據(jù)結(jié)構(gòu)、
    發(fā)表于 12-12 10:51

    什么是嵌入式人工智能

    嵌入式人工智能是指將人工智能技術(shù)應(yīng)用于嵌入式系統(tǒng)中的一種技術(shù)。嵌入式系統(tǒng)是
    的頭像 發(fā)表于 12-11 09:23 ?487次閱讀
    什么是<b class='flag-5'>嵌入式</b>人工<b class='flag-5'>智能</b>

    嵌入式和人工智能究竟是什么關(guān)系?

    、連接主義和深度學(xué)習(xí)等不同的階段。目前,人工智能已經(jīng)廣泛應(yīng)用于各種領(lǐng)域,如自然語(yǔ)言處理、計(jì)算機(jī)視覺(jué)、智能
    發(fā)表于 11-14 16:39

    嵌入式學(xué)習(xí)建議

    很多彎路,也會(huì)使你對(duì)嵌入式系統(tǒng)感到畏懼。等你軟件硬件基礎(chǔ)打好了,再學(xué)習(xí)就感到容易理解。實(shí)際上,許多嵌入式應(yīng)用并不需要操作系統(tǒng)。也可以根據(jù)實(shí)際項(xiàng)目需要,再
    發(fā)表于 10-22 11:41

    為何嵌入式控制器首選ARMxy?深度解析

    嵌入式ARM控制器是一種基于ARM架構(gòu)的嵌入式系統(tǒng)控制器,廣泛應(yīng)用于各種嵌入式系統(tǒng)中,包括工業(yè)物聯(lián)網(wǎng)關(guān)、邊緣
    的頭像 發(fā)表于 09-21 10:09 ?407次閱讀
    為何<b class='flag-5'>嵌入式</b>控制器首選ARMxy?<b class='flag-5'>深度</b>解析

    AMD分析嵌入式邊緣AI的發(fā)展

    隨著人工智能( AI )技術(shù)廣泛應(yīng)用于各行各業(yè),從云到邊緣解決方案逐漸成為信息技術(shù)領(lǐng)域新的熱點(diǎn)。嵌入式
    的頭像 發(fā)表于 09-18 09:30 ?417次閱讀
    AMD分析<b class='flag-5'>嵌入式</b><b class='flag-5'>邊緣</b>AI的發(fā)展

    ARMxy ARM嵌入式計(jì)算機(jī)搭載 1 TOPS NPU支持深度學(xué)習(xí)

    ARMxy ARM嵌入式計(jì)算機(jī)BL410系列內(nèi)置了1TOPS算力 NPU,它每秒可以執(zhí)行高達(dá)一萬(wàn)億次的浮點(diǎn)運(yùn)算,這為復(fù)雜的圖像處理和深度學(xué)習(xí)任務(wù)提供了充足的計(jì)算資源。在產(chǎn)品缺陷檢測(cè)領(lǐng)域
    的頭像 發(fā)表于 08-20 11:53 ?499次閱讀
    ARMxy ARM<b class='flag-5'>嵌入式計(jì)算</b>機(jī)搭載 1 TOPS NPU支持<b class='flag-5'>深度</b><b class='flag-5'>學(xué)習(xí)</b>

    深度學(xué)習(xí)算法在嵌入式平臺(tái)上的部署

    隨著人工智能技術(shù)的飛速發(fā)展,深度學(xué)習(xí)算法在各個(gè)領(lǐng)域的應(yīng)用日益廣泛。然而,將深度學(xué)習(xí)算法部署到資源受限的
    的頭像 發(fā)表于 07-15 10:03 ?1878次閱讀

    嵌入式系統(tǒng)怎么學(xué)?

    一系列課程和技術(shù),包括但不限于以下內(nèi)容: 1、基礎(chǔ)知識(shí):學(xué)習(xí)計(jì)算機(jī)組成原理、數(shù)字電路、模擬電路等基礎(chǔ)知識(shí),建立對(duì)計(jì)算機(jī)硬件的認(rèn)知與理解。 2、編程語(yǔ)言:掌握至少一種
    發(fā)表于 07-02 10:10

    AI引爆邊緣計(jì)算變革,塑造嵌入式產(chǎn)業(yè)新未來(lái)AI引爆邊緣計(jì)算變革,塑造嵌入式產(chǎn)業(yè)新未來(lái)——2024研華嵌入式

    中國(guó)北京,2024年5月30日?- 2024年研華嵌入式產(chǎn)業(yè)合作伙伴會(huì)議在北京·中關(guān)村皇冠假日酒店成功舉辦,現(xiàn)場(chǎng)參會(huì)嘉賓逾300人。會(huì)議以“AI引爆邊緣計(jì)算變革,塑造嵌入式產(chǎn)業(yè)新未來(lái)”
    發(fā)表于 05-31 13:53 ?395次閱讀
    AI引爆<b class='flag-5'>邊緣</b><b class='flag-5'>計(jì)算</b>變革,塑造<b class='flag-5'>嵌入式</b>產(chǎn)業(yè)新未來(lái)AI引爆<b class='flag-5'>邊緣</b><b class='flag-5'>計(jì)算</b>變革,塑造<b class='flag-5'>嵌入式</b>產(chǎn)業(yè)新未來(lái)——2024研華<b class='flag-5'>嵌入式</b>

    嵌入式學(xué)習(xí)-飛凌嵌入式ElfBoard ELF 1板卡-如何移植NCNN?

    計(jì)算機(jī)視覺(jué)和深度學(xué)習(xí)領(lǐng)域,NCNN(Netural Network Computer Vision)是一個(gè)輕量級(jí)的神經(jīng)網(wǎng)絡(luò)計(jì)算框架,被廣泛應(yīng)用于
    發(fā)表于 05-29 17:24

    AMD Versal SoC刷新邊緣AI性能,單芯片方案驅(qū)動(dòng)嵌入式系統(tǒng)

    電子發(fā)燒友網(wǎng)報(bào)道(文/黃晶晶)邊緣AI應(yīng)用需要更多的高性能計(jì)算和算力的支持,AMD的Versal和Zynq系列產(chǎn)品一直支持醫(yī)療、交通、智能零售、智能工廠、
    的頭像 發(fā)表于 04-11 09:06 ?3890次閱讀
    AMD Versal SoC刷新<b class='flag-5'>邊緣</b>AI性能,單芯片<b class='flag-5'>方案</b>驅(qū)動(dòng)<b class='flag-5'>嵌入式</b>系統(tǒng)

    AMD Versal SoC全新升級(jí)邊緣AI性能,單芯片方案驅(qū)動(dòng)嵌入式系統(tǒng)

    電子發(fā)燒友網(wǎng)報(bào)道(文/黃晶晶)邊緣AI應(yīng)用需要更多的高性能計(jì)算和算力的支持,AMD的Versal和Zynq系列產(chǎn)品一直支持醫(yī)療、交通、智能零售、智能工廠、
    的頭像 發(fā)表于 04-09 21:32 ?1188次閱讀
    AMD Versal SoC全新升級(jí)<b class='flag-5'>邊緣</b>AI性能,單芯片<b class='flag-5'>方案</b>驅(qū)動(dòng)<b class='flag-5'>嵌入式</b>系統(tǒng)

    嵌入式fpga是什么意思

    嵌入式FPGA是指將FPGA技術(shù)集成到嵌入式系統(tǒng)中的一種解決方案嵌入式系統(tǒng)是一種為特定應(yīng)用而設(shè)計(jì)的計(jì)算機(jī)系統(tǒng),它通常包括處理器、內(nèi)存、外設(shè)
    的頭像 發(fā)表于 03-15 14:29 ?1479次閱讀
    主站蜘蛛池模板: 亚洲国产成人精品青青草原100 | 欧美97色| 免费一级特黄3大片视频 | 成人人免费夜夜视频观看 | 久久六月丁香婷婷婷 | 免费公开视频人人人人人人人 | 成人伊人青草久久综合网 | 中文字幕在线视频第一页 | www.色图| 婷婷性 | 国产乱理论片在线观看理论 | 亚洲一级毛片中文字幕 | 天天网综合| www.爽| 免费一级特黄视频 | 国产一区二区三区毛片 | 深夜在线视频免费网址 | 天天躁夜夜躁 | 九九国产精品视频 | 欧美午夜一区 | 99热久久精品最新 | 丁香五月网久久综合 | 你懂的免费在线视频 | 欧美一级在线全免费 | 日本一视频一区视频二区 | 国产成人精品一区二区三区 | 日本网站免费观看 | 久久精品亚洲精品国产色婷 | 久热福利 | 久久久国产乱子伦精品 | 欧美深夜福利 | 午夜高清在线 | 正在播放淫亚洲 | 天天视频国产免费入口 | 日日干夜夜爽 | 午夜无遮挡怕怕怕免费视频 | 色视频色露露永久免费观看 | 性欧美大战久久久久久久野外 | 欧美三j片 | 在线观看天堂 | 久久激情五月 |