在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線(xiàn)課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

AI走入應(yīng)用場(chǎng)景:底層算力如何建構(gòu)?

新思科技 ? 來(lái)源:未知 ? 2023-05-23 22:25 ? 次閱讀

本文轉(zhuǎn)載自《半導(dǎo)體行業(yè)觀察》感謝《半導(dǎo)體行業(yè)觀察》對(duì)新思科技的關(guān)注 如今,人工智能應(yīng)用正在滲透入大眾生活的方方面面,自動(dòng)駕駛技術(shù)的行人檢測(cè)、數(shù)碼相機(jī)的圖像質(zhì)量增強(qiáng)、AI美顏、語(yǔ)音識(shí)別……這些人工智能應(yīng)用的背后離不開(kāi)硬件的支持。雖然神經(jīng)網(wǎng)絡(luò)處理器(NPU)在性能、效率和算法靈活性方面已優(yōu)于可編程DSP,但這并不意味著 AI 處理中不需要 DSP。恰恰相反,對(duì)于許多應(yīng)用的AI子系統(tǒng)來(lái)說(shuō),神經(jīng)網(wǎng)絡(luò)處理器(NPU)與矢量DSP是絕佳組合。 哪些應(yīng)用需要用到DSP?NPU和DSP該如何更好的配置?行業(yè)內(nèi)是否有現(xiàn)成的解決方案可供選擇?本文將針對(duì)這些問(wèn)題一一進(jìn)行講解。

DSP在AI應(yīng)用中發(fā)揮重要作用

從眾多神經(jīng)網(wǎng)絡(luò)處理需求來(lái)看,例如卷積神經(jīng)網(wǎng)絡(luò) (CNN) 或轉(zhuǎn)換器,任何可以執(zhí)行乘法運(yùn)算并移動(dòng)大量數(shù)據(jù)的處理器最終都可以執(zhí)行這些計(jì)算密集型模型。借助先進(jìn)的量化技術(shù),經(jīng)過(guò)訓(xùn)練的神經(jīng)網(wǎng)絡(luò)的32位浮點(diǎn)輸出可以在 8 位整數(shù)控制器或處理器上運(yùn)行,而且精度幾乎沒(méi)有降低。這意味著可以在 CPUGPU、DSP 甚至MCU上處理CNN推理,準(zhǔn)確度不受影響。

目前在行業(yè)內(nèi)通常用TOPS(每秒萬(wàn)億次運(yùn)算)來(lái)衡量AI處理器的性能,也稱(chēng)之為“算力”。TOPS 的計(jì)算方式為:一個(gè)周期內(nèi)可以完成的運(yùn)算次數(shù)(一次乘積累加視為兩次運(yùn)算)x最大頻率。這是很好的首次性能估算,因?yàn)榇蟛糠钟?jì)算由對(duì)矩陣乘法的需求驅(qū)動(dòng),而矩陣乘法需要乘積累加運(yùn)算。

按照這種計(jì)算方法,讓我們來(lái)看下不同處理器類(lèi)型的理想TOPS。具有DSP擴(kuò)展的CPU可以每個(gè)時(shí)鐘周期執(zhí)行一次乘積累加 (MAC) 并以 2GHz的速度運(yùn)行,其運(yùn)算能力為:2GHz x 2次運(yùn)算(包括乘積和累加)x 1 MAC/周期 = 4 GOPS 或 0.004 TOPS(1TOPS等于1000 GOPS)。以此類(lèi)推,矢量DSP的理想TOPS為1.2,高端的NPU將達(dá)到255.6 TOPS。如表1中所示,從理想的算力能力上來(lái)看,神經(jīng)處理單元 (NPU) 是獲得最高計(jì)算能力的最佳選擇。

603ebe3a-f975-11ed-90ce-dac502259ad0.png

表1:各種處理器的大致性能范圍

誠(chéng)然,計(jì)算能力固然重要,但一些應(yīng)用對(duì)實(shí)時(shí)性能的要求也很高。如在汽車(chē)應(yīng)用中,當(dāng)一輛汽車(chē)以 70 英里/小時(shí)的速度沖向行人,需要迅速?zèng)Q定是否要?jiǎng)x車(chē)。多攝像頭配置、高分辨率、最低延遲,這些因素都對(duì)計(jì)算效率提出了更高要求,以幫助汽車(chē)做出生死攸關(guān)的決定。因此,我們需要更謹(jǐn)慎地選擇用于處理AI推理的處理器。

GPU在AI計(jì)算中也可以提供高性能,但由于其功耗和面積成本很高,對(duì)于實(shí)時(shí)應(yīng)用來(lái)說(shuō)難以接受,所以并未在上表中列出。事實(shí)上,上表中所列的每種處理器都需要不同級(jí)別的功率和面積才能達(dá)到所需的運(yùn)算能力。對(duì)于實(shí)時(shí)應(yīng)用來(lái)說(shuō),功耗和面積(與成本和可制造性直接相關(guān))幾乎與性能同樣重要。理論上來(lái)說(shuō),NPU經(jīng)過(guò)設(shè)計(jì)和優(yōu)化,是執(zhí)行神經(jīng)網(wǎng)絡(luò)算法時(shí)性能、功耗和面積效率最高的處理器。

但是,并非每個(gè)AI應(yīng)用都需要NPU提供的最高級(jí)別的神經(jīng)網(wǎng)絡(luò)性能。如下圖1所示,不同的AI應(yīng)用涵蓋從幾GOPS到數(shù)千TOPS的各種性能要求。當(dāng)你的AI應(yīng)用所需算力小于1 TOPS時(shí),具有DSP擴(kuò)展的CPU或者矢量DSP是比較理想的選擇;而當(dāng)算力要求高于1 TOPS時(shí),NPU的 AI 性能效率、功耗效率和面積效率毋庸置疑。

NPU 的最佳效率來(lái)自每個(gè)周期可以完成的大量乘積,以及一些專(zhuān)用于其他神經(jīng)網(wǎng)絡(luò)運(yùn)算(例如激活函數(shù))的硬件。NPU 面臨的挑戰(zhàn)是如何實(shí)現(xiàn)最大硬件加速,從而最大限度地提高神經(jīng)網(wǎng)絡(luò)效率,還要保持一定程度的可編程性。雖然現(xiàn)在全硬件神經(jīng)網(wǎng)絡(luò)ASIC比可編程 NPU更高效,但AI技術(shù)發(fā)展迅速,AI SoC的生產(chǎn)周期很長(zhǎng),因此保持一定程度的可編程性至關(guān)重要。

而且,NPU是專(zhuān)用的神經(jīng)處理器引擎,只能執(zhí)行AI計(jì)算。如果將矢量DSP和NPU結(jié)合使用,利用矢量DSP對(duì)NPU進(jìn)行支持,就可以提供最高性能和額外的可編程性。例如,在自動(dòng)駕駛汽車(chē)中,需要利用NPU來(lái)尋找行人、識(shí)別街道標(biāo)志、使用神經(jīng)網(wǎng)絡(luò)進(jìn)行雷達(dá)處理,在這些多應(yīng)用處理中,系統(tǒng)可利用矢量DSP來(lái)為NPU進(jìn)行額外篩選、雷達(dá)或LiDAR處理以及預(yù)處理和后處理。

NPU+DSP的三種配置方式

圖2顯示了在 AI 應(yīng)用中將NPU和矢量DSP結(jié)合使用的各種可能性。在圖中所示的三種情況下,高分辨率圖像幀位于DDR內(nèi)存中,等待在下一幀到達(dá)之前得到處理。

60a42dec-f975-11ed-90ce-dac502259ad0.png

圖2:矢量DSP和神經(jīng)網(wǎng)絡(luò)性能的不同組合

在第一種配置中(左側(cè)),矢量 DSP本身既可用于DSP處理也可用于一部分AI處理,這屬于運(yùn)算能力低于 1 TOPS 的用例,這種配置需要大型DSP+小型AI。這種配置的具體示例是為永磁同步電機(jī) (PMSM) 執(zhí)行無(wú)傳感器磁場(chǎng)定向控制 (FOC) 的矢量 DSP。基于 DSP 的電機(jī)控制通過(guò) AI 處理實(shí)現(xiàn)擴(kuò)展,AI 處理的作用是執(zhí)行位置監(jiān)控,并將相關(guān)信息反饋到控制回路。AI 模型的采樣率和計(jì)算復(fù)雜性使其能夠與矢量DSP的AI功能相適應(yīng)。

在第二種配置中(中間),AI SoC 需要很高的矢量DSP性能和AI 性能,這種配置是大型 AI+大型 DSP。當(dāng)矢量DSP處理高度依賴(lài)DSP的任務(wù)時(shí),需要用NPU為AI密集型任務(wù)提供的神經(jīng)網(wǎng)絡(luò)加速作為補(bǔ)充。數(shù)碼相機(jī)就是這種配置,矢量 DSP 可以對(duì) NPU 執(zhí)行視覺(jué)處理以及預(yù)處理和后處理支持,而 NPU 則專(zhuān)用于對(duì)高分辨率圖像進(jìn)行 CNN 或轉(zhuǎn)換器處理(對(duì)象檢測(cè)、語(yǔ)義分割、超分辨率等)。這些用例需要緊密集成的矢量 DSP 和 NPU 解決方案,而且可進(jìn)行擴(kuò)展以適應(yīng)性能目標(biāo)。

第三個(gè)配置是小型 DSP+大型 AI。所有的處理都集中在神經(jīng)網(wǎng)絡(luò)上,雖然這些神經(jīng)網(wǎng)絡(luò)通常可以在 NPU 中執(zhí)行,但有一些更復(fù)雜的神經(jīng)網(wǎng)絡(luò)模型需要矢量 DSP 的支持來(lái)執(zhí)行浮點(diǎn)運(yùn)算,如Mask-RCNN 的 ROI 池化和 ROI 對(duì)齊,或 Deeplab v3 使用的非整數(shù)比例因子。即使 AI SoC 不需要任何額外的 DSP 處理,納入一定程度的矢量 DSP 性能來(lái)支持 NPU 還是有好處的,這可以更好地適應(yīng)未來(lái)的發(fā)展需求。

新思科技ARC EV7x能夠?qū)崿F(xiàn)

矢量DSP和NPU緊密耦合

雖然市場(chǎng)上有多種矢量DSP和NPU供選擇,但對(duì)于第二種和第三種配置,最好選擇包含緊密集成處理器的 AI 解決方案。一些神經(jīng)網(wǎng)絡(luò)加速器將矢量DSP嵌入到神經(jīng)網(wǎng)絡(luò)解決方案中,這樣限制了矢量DSP用于外部編程。

而新思科技的ARC EV7x 視覺(jué)處理器是異構(gòu)處理器,它將矢量DSP與可選的神經(jīng)網(wǎng)絡(luò)引擎緊密耦合。為了提高客戶(hù)的靈活性和可編程性,ARC EV7x系列正在發(fā)展成為 ARC VPX 矢量 DSP 系列和 ARC NPX NPU 系列。VPX 和 NPX 是緊密耦合的 AI 解決方案。圖 3 顯示了這兩種處理器的粗略框圖及其互連方式。

60df1fce-f975-11ed-90ce-dac502259ad0.png

圖3:新思科技 ARC VPX5 和 ARC NPX6 的緊密耦合型組合

ARC VPX DSP IP在基于超長(zhǎng)指令字 (VLIW)/單指令多數(shù)據(jù) (SIMD) 架構(gòu)的并行 DSP 處理方面表現(xiàn)出色,并針對(duì)嵌入式工作負(fù)載的功耗、性能和面積 (PPA) 要求進(jìn)行了優(yōu)化。可將 VPX 系列配置為支持浮點(diǎn)和多種整數(shù)格式(包括用于 AI 推理的 INT8 運(yùn)算)。VPX 系列在 128 位(VPX2、VPX2FS)、256 位(VPX3、VPX3FS)和 512 位(VPX5、VPX5FS)矢量字上運(yùn)行,因此可提供多種性能,還可以從單核擴(kuò)展到四核。這樣可以每個(gè)周期提供 16 個(gè) INT8 MAC 至 512 個(gè) INT8 MAC(在四核 VPX5 上使用雙 MAC 配置)。

ARC NPX NPU IP專(zhuān)用于 NN 處理,還針對(duì)實(shí)時(shí)應(yīng)用的 PPA 要求進(jìn)行了優(yōu)化。該系列從每個(gè)周期 4096 個(gè) MAC 的版本擴(kuò)展到每個(gè)周期 96000 個(gè) MAC 的版本,然后可以擴(kuò)展到多個(gè)實(shí)例。NXP6 系列在單個(gè) SoC 上的 AI 性能可從 1 TOPS 擴(kuò)展到 1000 TOPS。它還針對(duì) CNN 的最新神經(jīng)網(wǎng)絡(luò)模型和新興的轉(zhuǎn)換器模型類(lèi)別進(jìn)行了優(yōu)化。

如圖 3 所示,VPX 和 NPX 系列緊密集成。ARCsync 是額外的 RTL,可在處理器之間提供中斷控制。數(shù)據(jù)通過(guò)外部 NOC 或 AXI 總線(xiàn)傳遞,這類(lèi)總線(xiàn)通常已在 SoC 系統(tǒng)中存在。雖然兩個(gè)處理器可以完全獨(dú)立運(yùn)行,但 VPX5 能夠根據(jù)需要訪(fǎng)問(wèn) NPX6 的 L2 內(nèi)存。

通用軟件開(kāi)發(fā)工具鏈 ARC MetaWare MX 也支持 VPX5 和 NPX6 的緊密集成,該工具鏈支持 NXP 和 VPX 的任意組合。SoC 架構(gòu)師可以使用這些可擴(kuò)展處理器系列選擇 DSP 性能和 AI 性能的正確組合,以最大限度地提高性能并減少面積開(kāi)銷(xiāo)。對(duì)于高度依賴(lài) AI 的工作負(fù)載,“大型 AI,小型 DSP”配置的經(jīng)驗(yàn)法則是,每 8000 或 16000 個(gè) MAC 為 NPX 配備一個(gè) VPX5(具體取決于模型和工作負(fù)載)。對(duì)于 NPX6-64K 配置,建議至少使用四個(gè) VPX5 內(nèi)核。

結(jié)語(yǔ)

誠(chéng)然,對(duì)于特定任務(wù)(例如行人對(duì)象檢測(cè)),神經(jīng)網(wǎng)絡(luò)處理已經(jīng)取代了 DSP 處理,但矢量 DSP 的 SIMD 功能與 DSP 支持功能和 AI 支持功能相結(jié)合,可使其成為 AI 系統(tǒng)的重要組成部分。隨著嵌入式應(yīng)用對(duì) AI 處理的需求持續(xù)增長(zhǎng),要實(shí)現(xiàn)靈活設(shè)計(jì),建議的最佳做法是結(jié)合使用 NPU 和矢量 DSP,前者用于AI處理,后者用于提供對(duì)NPU支持和DSP處理,這樣有助于為快速發(fā)展的AI提供具有前瞻性的AI SoC。


聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 新思科技
    +關(guān)注

    關(guān)注

    5

    文章

    847

    瀏覽量

    51091

原文標(biāo)題:AI走入應(yīng)用場(chǎng)景:底層算力如何建構(gòu)?

文章出處:【微信號(hào):Synopsys_CN,微信公眾號(hào):新思科技】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    智能基建:RAKsmart如何賦能下一代AI開(kāi)發(fā)工具

    當(dāng)今,AI模型的復(fù)雜化與規(guī)模化對(duì)提出了前所未有的要求。然而,傳統(tǒng)的基礎(chǔ)設(shè)施在靈活性、成本效率和可擴(kuò)展性上逐漸顯露出瓶頸。而RAKsm
    的頭像 發(fā)表于 05-07 09:40 ?77次閱讀

    點(diǎn)動(dòng)科技戰(zhàn)略聚焦AI,領(lǐng)航服務(wù)新征程

    點(diǎn)動(dòng)科技戰(zhàn)略聚焦,AI領(lǐng)域取得階段性成果 點(diǎn)動(dòng)科技近日宣布完成戰(zhàn)略重心全面轉(zhuǎn)向AI領(lǐng)域,以“
    的頭像 發(fā)表于 05-07 09:29 ?114次閱讀

    AI與云端生產(chǎn)結(jié)合應(yīng)用場(chǎng)景及技術(shù)解析(2025)

    AI與云端生產(chǎn)結(jié)合應(yīng)用場(chǎng)景及技術(shù)解析(2025) 一、核心技術(shù)架構(gòu)? 云原生與智能網(wǎng)絡(luò)? 采用容器化、微服務(wù)等云原生技術(shù)實(shí)現(xiàn)應(yīng)用敏捷開(kāi)
    的頭像 發(fā)表于 04-15 08:41 ?210次閱讀
    <b class='flag-5'>AI</b>與云端生產(chǎn)<b class='flag-5'>力</b>結(jié)合應(yīng)<b class='flag-5'>用場(chǎng)景</b>及技術(shù)解析(2025)

    芯片的生態(tài)突圍與革命

    據(jù)的爆發(fā)式增長(zhǎng),大芯片已成為科技競(jìng)爭(zhēng)的核心領(lǐng)域之一。 ? 大芯片的核心應(yīng)用場(chǎng)景豐富多樣。在人工智能訓(xùn)練與推理方面,大模型(如 GPT
    的頭像 發(fā)表于 04-13 00:02 ?1413次閱讀

    智能最具潛力的行業(yè)領(lǐng)域

    智能最具潛力的行業(yè)領(lǐng)域 一、金融行業(yè) 智能風(fēng)控與精準(zhǔn)服務(wù)?:大型銀行通過(guò)集群(6.27萬(wàn)臺(tái)服務(wù)器)支撐AI模型訓(xùn)練,實(shí)現(xiàn)風(fēng)險(xiǎn)預(yù)警、智
    的頭像 發(fā)表于 04-11 08:20 ?180次閱讀
    智能<b class='flag-5'>算</b><b class='flag-5'>力</b>最具潛力的行業(yè)領(lǐng)域

    DeepSeek推動(dòng)AI需求:800G光模塊的關(guān)鍵作用

    隨著人工智能技術(shù)的飛速發(fā)展,AI需求正以前所未有的速度增長(zhǎng)。DeepSeek等大模型的訓(xùn)練與推理任務(wù)對(duì)的需求持續(xù)攀升,直接推動(dòng)了服務(wù)
    發(fā)表于 03-25 12:00

    科通技術(shù)推出DeepSeek+AI芯片全場(chǎng)景方案

    2025年,隨著DeepSeek新版本的開(kāi)源,AI技術(shù)掀起了全球普及的浪潮。在這股浪潮中,AI芯片作為關(guān)鍵支撐,其應(yīng)用場(chǎng)景不斷拓展,從云
    的頭像 發(fā)表于 03-24 10:33 ?530次閱讀

    中心的如何衡量?

    作為當(dāng)下科技發(fā)展的重要基礎(chǔ)設(shè)施,其的衡量關(guān)乎其能否高效支撐人工智能、大數(shù)據(jù)分析等智能應(yīng)用的運(yùn)行。以下是對(duì)智中心算衡量的詳細(xì)闡述:一、
    的頭像 發(fā)表于 01-16 14:03 ?1694次閱讀
    <b class='flag-5'>算</b>智<b class='flag-5'>算</b>中心的<b class='flag-5'>算</b><b class='flag-5'>力</b>如何衡量?

    中心會(huì)取代通用中心嗎?

    所取代呢??jī)烧叩奶攸c(diǎn)及其適用場(chǎng)景有什么不同呢?一、什么是智中心智中心是專(zhuān)門(mén)為處理AI相關(guān)任務(wù)而設(shè)計(jì)的數(shù)據(jù)中心。這些設(shè)施配備了如GPU、TPU等高性能加速器,并
    的頭像 發(fā)表于 01-06 14:45 ?463次閱讀
    智<b class='flag-5'>算</b>中心會(huì)取代通用<b class='flag-5'>算</b><b class='flag-5'>力</b>中心嗎?

    企業(yè)AI租賃模式的好處

    構(gòu)建和維護(hù)一個(gè)高效、可擴(kuò)展的AI基礎(chǔ)設(shè)施,不僅需要巨額的初期投資,還涉及復(fù)雜的運(yùn)維管理和持續(xù)的技術(shù)升級(jí)。而AI
    的頭像 發(fā)表于 12-24 10:49 ?1084次閱讀

    企業(yè)AI租賃是什么

    企業(yè)AI租賃是指企業(yè)通過(guò)互聯(lián)網(wǎng)向?qū)I(yè)的提供商租用所需的計(jì)算資源,以滿(mǎn)足其AI應(yīng)用的需求。
    的頭像 發(fā)表于 11-14 09:30 ?2183次閱讀

    GPU開(kāi)發(fā)平臺(tái)是什么

    隨著AI技術(shù)的廣泛應(yīng)用,需求呈現(xiàn)出爆發(fā)式增長(zhǎng)。AI租賃作為一種新興的服務(wù)模式,正逐漸成為
    的頭像 發(fā)表于 10-31 10:31 ?533次閱讀

    青云科技強(qiáng)化AI架構(gòu),升級(jí)產(chǎn)品與服務(wù)體系

    10月9日,青云科技正式揭曉了其升級(jí)版的產(chǎn)品與服務(wù)陣容、行業(yè)及場(chǎng)景定制化解決方案,以及全新的生態(tài)戰(zhàn)略。該公司旨在通過(guò)AI平臺(tái)、AI
    的頭像 發(fā)表于 10-10 16:42 ?746次閱讀

    大模型時(shí)代的需求

    現(xiàn)在AI已進(jìn)入大模型時(shí)代,各企業(yè)都爭(zhēng)相部署大模型,但如何保證大模型的,以及相關(guān)的穩(wěn)定性和性能,是一個(gè)極為重要的問(wèn)題,帶著這個(gè)極為重要的問(wèn)題,我需要在此書(shū)中找到答案。
    發(fā)表于 08-20 09:04
    主站蜘蛛池模板: 特黄特色大片免费播放路01 | 天天做天天爱天天操 | 久色网 | 免费的国语一级淫片 | 亚洲 自拍 欧美 综合 | 免费一区二区三区 | 亚洲国产福利精品一区二区 | 国产成人啪精品午夜在线播放 | 广东毛片 | 亚洲444444在线观看 | 国产成人精品日本亚洲直接 | 2020天天干| 四虎影院视频在线观看 | 免费无遮挡很爽很污很黄 | 欧美激情一欧美吧 | 四虎最新紧急入口 | 首页 亚洲 欧美 制服 丝腿 | 日韩欧美视频一区 | 卡一卡二卡三国色天香永不失联 | 综合激情网站 | 成人在线免费 | 久久99热不卡精品免费观看 | 成人在线一区二区三区 | 48pao强力打造免费基地 | 野外啪啪抽搐一进一出 | 天天碰视频 | 永久免费视频网站在线观看 | 天天爱天天做天天爽夜夜揉 | 日本三级成人中文字幕乱码 | 一级黄色毛片免费看 | www.天天干| 亚洲国产成人久久一区久久 | 黄色大片视频网站 | 黄网观看| 五月六月婷婷 | 特黄特色网站 | 欧美午夜精品一区二区三区 | 日本不卡毛片一二三四 | 国产成人a毛片 | 在线播放一区二区精品产 | 你懂的在线观看网址 |