在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

如何打通機器學(xué)習(xí)的“三大玄關(guān)”,你該這樣Get新技能!

穎脈Imgtec ? 2023-08-05 08:31 ? 次閱讀

來源:FPGA之家

隨著時下智能時代的發(fā)展,機器學(xué)習(xí)已成為不少專業(yè)人士的“必備技能”。盡管如此,可它在實用性上仍然存在一些問題。因而設(shè)計師們采取了架構(gòu)精簡、壓縮、以及硬件加速等三種途徑。都有啥特點呢?請往下看~

精簡架構(gòu)設(shè)計,輸入/輸出的極致簡化設(shè)計師減少層數(shù)或網(wǎng)絡(luò)中各層之間連接數(shù)量的任何努力,都會直接降低推理的內(nèi)存要求和計算量。因此,我們很難預(yù)測指定網(wǎng)絡(luò)設(shè)計在指定問題和訓(xùn)練集上的作用,除非有經(jīng)驗可供參考。確定您是否需要特定深度學(xué)習(xí)網(wǎng)絡(luò)設(shè)計中全部 16 層的唯一方法,是以網(wǎng)絡(luò)的數(shù)層為樣本對其進行訓(xùn)練和測試。但由于此類探索工作的費用較高,設(shè)計師往往更傾向于使用他們熟悉的網(wǎng)絡(luò)架構(gòu);當(dāng)然,探索也可能有助于節(jié)省大量成本。

讓我們以 ImageNet 當(dāng)前面臨的眾所周知的靜態(tài)圖像分類挑戰(zhàn)為例。深度學(xué)習(xí)網(wǎng)絡(luò)一般從上一層的每個節(jié)點為自身的每個節(jié)點獲取加權(quán)輸入,而圖像分類研究人員有了重大發(fā)現(xiàn),即使用卷積神經(jīng)網(wǎng)絡(luò) (CNN) 可以化繁為簡(圖1)。

在其初層中,CNN 使用較少的卷積引擎替代完全連接的節(jié)點。卷積引擎并不為每項輸入提供權(quán)重,僅具有小型卷積核心。它可使用輸入圖像對核心進行卷積處理,生成特征圖—一種 2D 數(shù)組,表示圖像和圖像各點處核心之間的相似度。然后,特征圖可收到非線性化信息。卷積層的輸出是一個三維數(shù)組:該層中每個節(jié)點的 2D 特征圖。然后,該數(shù)組將經(jīng)過池化運算降低分辨率,從而縮減 2D 特征圖的大小。

7732857c-3327-11ee-bbcf-dac502259ad0.png

圖1.遞歸神經(jīng)網(wǎng)絡(luò)通常只是將其部分中間狀態(tài)或輸出饋送回輸入的簡單神經(jīng)網(wǎng)絡(luò)

現(xiàn)代 CNN 可能具有許多卷積層,每個卷積層跟著一個池化層。在靠近網(wǎng)絡(luò)輸出端的位置,卷積和池化層終止,其余層是完全連接的。因此,網(wǎng)絡(luò)從輸入端到輸出端逐漸變細,最終形成一個完全連接的層,其寬度剛好足以為每個所需的標(biāo)記生成一個輸出。與具有相似深度的完全連接的深度學(xué)習(xí)網(wǎng)絡(luò)相比,該網(wǎng)絡(luò)能夠大幅減少權(quán)重、連接數(shù)和節(jié)點數(shù)。“壓縮”技術(shù),突破推理的上限機器學(xué)習(xí)社區(qū)使用壓縮表示與卷積數(shù)據(jù)壓縮截然不同的概念。該語境下的壓縮包含一系列技術(shù),用于減少生成推理所需的計算數(shù)量并降低其難度,修剪便是此類技術(shù)之一。在進行修剪時,深度學(xué)習(xí)網(wǎng)絡(luò)訓(xùn)練通常會在權(quán)重矩陣中產(chǎn)生多個零或非常小的數(shù)值。實際上,這意味著無需計算將乘以權(quán)重的輸入。因此,表示推理計算的數(shù)據(jù)流圖表可被剪下一整個分支。經(jīng)驗表明,如果一個網(wǎng)絡(luò)被修剪后再重新訓(xùn)練,其精度實際上可以提高。

另一種壓縮方法是減少權(quán)重中的位數(shù)。雖然數(shù)據(jù)中心服務(wù)器可能將所有值保持在單精度浮點中,但研究人員發(fā)現(xiàn),更低的權(quán)重精度和幾個位足以實現(xiàn)與 32 位浮點幾乎相同的精度。同樣,在應(yīng)用非線性之后,節(jié)點的輸出可能只需要幾個位。如果推理模型將在服務(wù)器上執(zhí)行,這幾乎沒有幫助。然而,該方法在一個 MCU 上非常有用,一個能夠非常有效地實施 2 位或 3 位乘法器的 FPGA 加速器可以充分利用這種壓縮形式。

總之,在某些情況下,修剪技術(shù)、大幅減少位數(shù)和相關(guān)技術(shù)已經(jīng)被證明可以減少 20 到 50 倍的推理工作。這些技術(shù)可以把經(jīng)過訓(xùn)練的網(wǎng)絡(luò)的推理工作控制在一些邊緣計算平臺的范圍內(nèi)。當(dāng)壓縮不足以達成目的時,設(shè)計師可以轉(zhuǎn)向硬件加速,而且硬件加速有越來越多的替代方案。

硬件加速的新風(fēng)標(biāo)!推理所需的計算既不多樣也不復(fù)雜,主要包括許多乘積和 — 乘積累加 (MAC) — 運算,用于將輸入乘以權(quán)重和在每個節(jié)點將結(jié)果相加。該計算任務(wù)還包括所謂的修正線性單元 (ReLU) — 用于將所有負值設(shè)置為零 — 等非線性函數(shù)、雙曲正切或 sigmoid 函數(shù) — 用于注入非線性 — 以及用于池化的最大值函數(shù)。總之,該計算任務(wù)看起來很像一個典型的線性代數(shù)工作負載。

應(yīng)用超級計算領(lǐng)域的硬件思想。最簡單的方法是將輸入、權(quán)重和輸出作為向量進行組織,并使用內(nèi)置到大型 CPU 中的向量 SIMD 單元。為了提高速度,設(shè)計師在 GPU 中使用了大量著色引擎。通過在 GPU 的內(nèi)存層次結(jié)構(gòu)中安排輸入、權(quán)重和輸出數(shù)據(jù)避免抖動或高缺失率,(絕非無足輕重的小問題,)但這并沒有阻止 GPU 成為數(shù)據(jù)中心深度學(xué)習(xí)領(lǐng)域使用最廣泛的非 CPU 硬件。最近幾代的 GPU 取得了長足進步,增加了更小的數(shù)據(jù)類型和矩陣數(shù)學(xué)塊來補充浮點著色單元,能夠更好地適應(yīng)該應(yīng)用。

這些調(diào)整說明了加速硬件設(shè)計師使用的基本策略:減少或消除指令獲取和解碼,減少數(shù)據(jù)移動,盡可能多地使用并行性,以及利用壓縮。難點在于確保這些操作在實施時不會互相干擾。

使用這些策略有幾種架構(gòu)方法:

1、在芯片上對大量的乘法器、加法器和小型 SRAM 塊進行實例化,并通過片上網(wǎng)絡(luò)將它們鏈接起來。這為執(zhí)行推理提供了原始資源,但存在一個關(guān)鍵挑戰(zhàn),即從計算元件中高效獲取數(shù)據(jù),以及將數(shù)據(jù)傳輸至計算元件及程序員。這些設(shè)計是過去許多大規(guī)模并行計算芯片的后繼者,所有這些芯片都遭遇了難以攻克的編程挑戰(zhàn)。

2、Google 張量處理單元(TPU)等芯片采用了進一步依托應(yīng)用的方法,按照深層學(xué)習(xí)網(wǎng)絡(luò)的固有結(jié)構(gòu)組織計算元件。這類架構(gòu)將網(wǎng)絡(luò)的輸入權(quán)重乘法視為非常大的矩陣乘法,并創(chuàng)建硬件矩陣乘法器來執(zhí)行它們。在 TPU 中,乘法是在一個收縮乘法器數(shù)組中完成的,在這個數(shù)組中,操作數(shù)自然地從一個單元流到另一個單元。數(shù)組被緩沖區(qū)包圍,以饋入激活和權(quán)重值,后面是激活函數(shù)和池化硬件。

通過對芯片進行特定的組織在一定程度上自動實施矩陣運算,TPU 可讓程序員免于通過計算元件和 SRAM 對數(shù)據(jù)移動進行精細安排。編程變得非常簡單,基本就包括將輸入和權(quán)重分組成矩陣并按下按鈕,但存在一個問題。如上所述,修剪會產(chǎn)生非常稀疏的矩陣,簡單地將這些矩陣饋入像 TPU 一樣的設(shè)備會導(dǎo)致大量毫無意義的乘法和加法。在模型開發(fā)的壓縮階段,可能需要將這些稀疏矩陣重新排列為更小的密集矩陣,以便充分利用硬件。

3、將推理任務(wù)作為一系列矩陣乘法建模,而非作為數(shù)據(jù)流圖表建模。加速器被設(shè)計成一個數(shù)據(jù)流引擎,數(shù)據(jù)從一側(cè)進入,通過可配置的鏈接流經(jīng)一個類似于圖表的處理元件網(wǎng)絡(luò),然后進行輸出。這種加速器可以配置為僅執(zhí)行所修剪網(wǎng)絡(luò)需要的操作。

一旦選擇了架構(gòu),接下來的問題就是實施。在開發(fā)過程中,許多架構(gòu)源于 FPGA,以滿足成本和調(diào)度要求。在一些情況下,一些架構(gòu)將留在 FPGA 中——例如,當(dāng)深度學(xué)習(xí)網(wǎng)絡(luò)模型預(yù)計會發(fā)生一個加速器設(shè)計無法完全處理的過多改變。但是,如果模型的改變很小,例如層排列有所不同和權(quán)重發(fā)生改變,ASIC 或 CPU 集成加速器可能是首選項。

這又回到了邊緣計算及其限制的話題。如果機器學(xué)習(xí)網(wǎng)絡(luò)要在一組服務(wù)器上執(zhí)行,那么在服務(wù)器 CPU、GPU、FPGA 或大型 ASIC 加速器芯片上執(zhí)行都是可行的選擇。但是,如果必須在一個更為有限的環(huán)境中執(zhí)行,例如車間機器、無人機或攝像頭,則需要一個小型的 FPGA 或 ASIC。

對于極其有限環(huán)境中的小型深度學(xué)習(xí)模型,例如手機,內(nèi)置于應(yīng)用處理器 SOC 中的低功耗 ASIC 或加速器塊可能是唯一的選擇。盡管到目前為止,這些限制往往會促使設(shè)計師努力設(shè)計簡單的乘法器數(shù)組,但神經(jīng)形態(tài)設(shè)計的卓越能效可能會使它們對下一代深度嵌入式加速器非常重要。

無論如何,機器學(xué)習(xí)都不再局限于數(shù)據(jù)中心范疇,推理正邁向邊緣。隨著研究人員不再聚焦當(dāng)前的傳統(tǒng)深度學(xué)習(xí)網(wǎng)絡(luò),將視線投向更多概念,邊緣的機器學(xué)習(xí)問題有望成為架構(gòu)開發(fā)的前沿課題。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 芯片
    +關(guān)注

    關(guān)注

    456

    文章

    51224

    瀏覽量

    427406
  • 硬件
    +關(guān)注

    關(guān)注

    11

    文章

    3391

    瀏覽量

    66470
  • 網(wǎng)絡(luò)
    +關(guān)注

    關(guān)注

    14

    文章

    7600

    瀏覽量

    89269
  • 機器學(xué)習(xí)
    +關(guān)注

    關(guān)注

    66

    文章

    8441

    瀏覽量

    133095
  • cnn
    cnn
    +關(guān)注

    關(guān)注

    3

    文章

    353

    瀏覽量

    22339
收藏 人收藏

    評論

    相關(guān)推薦

    選購真空共晶爐也有門道,快來get新技能

    在電子封裝領(lǐng)域,真空共晶爐作為一種重要的焊接設(shè)備,其性能直接影響到焊接質(zhì)量和生產(chǎn)效率。然而,面對市場上琳瑯滿目的真空共晶爐產(chǎn)品,如何做出明智的選擇成為了許多企業(yè)面臨的難題。本文將從真空度、漏率、加熱板材質(zhì)及冷卻方式等關(guān)鍵要素出發(fā),為您詳細闡述真空共晶爐的選擇指南。
    的頭像 發(fā)表于 01-09 11:25 ?141次閱讀
    選購真空共晶爐也有門道,快來<b class='flag-5'>get</b><b class='flag-5'>新技能</b>!

    如何選擇云原生機器學(xué)習(xí)平臺

    當(dāng)今,云原生機器學(xué)習(xí)平臺因其彈性擴展、高效部署、低成本運營等優(yōu)勢,逐漸成為企業(yè)構(gòu)建和部署機器學(xué)習(xí)應(yīng)用的首選。然而,市場上的云原生機器
    的頭像 發(fā)表于 12-25 11:54 ?164次閱讀

    什么是機器學(xué)習(xí)?通過機器學(xué)習(xí)方法能解決哪些問題?

    來源:Master編程樹“機器學(xué)習(xí)”最初的研究動機是讓計算機系統(tǒng)具有人的學(xué)習(xí)能力以便實現(xiàn)人工智能。因為沒有學(xué)習(xí)能力的系統(tǒng)很難被認為是具有智能的。目前被廣泛采用的
    的頭像 發(fā)表于 11-16 01:07 ?515次閱讀
    什么是<b class='flag-5'>機器</b><b class='flag-5'>學(xué)習(xí)</b>?通過<b class='flag-5'>機器</b><b class='flag-5'>學(xué)習(xí)</b>方法能解決哪些問題?

    麻省理工學(xué)院推出新型機器人訓(xùn)練模型

    近日,據(jù)TechCrunch報道,麻省理工學(xué)院的研究團隊展示了一種創(chuàng)新的機器人訓(xùn)練模型,模型突破了傳統(tǒng)模仿學(xué)習(xí)方法的局限,不再依賴標(biāo)準(zhǔn)數(shù)據(jù)集,而是借鑒了大型語言模型(LLM)如GPT-4等所使用的大規(guī)模信息處理方式,為
    的頭像 發(fā)表于 11-04 14:56 ?555次閱讀

    【「時間序列與機器學(xué)習(xí)」閱讀體驗】+ 鳥瞰這本書

    的交織中不斷成長。 讀者對這本書的評價普遍很高。他們稱贊作者用通俗易懂的語言將復(fù)雜的概念解釋得透徹清晰,即使是初學(xué)者也能輕松入門。同時,書中豐富的案例和詳細的步驟指導(dǎo)也讓讀者快速積累經(jīng)驗,提高實戰(zhàn)技能。甚至有讀者表示,這本書已經(jīng)成為時間序列分析、機器
    發(fā)表于 08-12 11:28

    【「時間序列與機器學(xué)習(xí)」閱讀體驗】+ 簡單建議

    這本書以其系統(tǒng)性的框架和深入淺出的講解,為讀者繪制了一幅時間序列分析與機器學(xué)習(xí)融合應(yīng)用的宏偉藍圖。作者不僅扎實地構(gòu)建了時間序列分析的基礎(chǔ)知識,更巧妙地展示了機器學(xué)習(xí)如何在這一領(lǐng)域發(fā)揮巨
    發(fā)表于 08-12 11:21

    如何理解機器學(xué)習(xí)中的訓(xùn)練集、驗證集和測試集

    理解機器學(xué)習(xí)中的訓(xùn)練集、驗證集和測試集,是掌握機器學(xué)習(xí)核心概念和流程的重要一步。這者不僅構(gòu)成了模型學(xué)習(xí)
    的頭像 發(fā)表于 07-10 15:45 ?4682次閱讀

    按照這樣學(xué)習(xí)C語言,成為卷王不是夢!

    在計算機編程領(lǐng)域,C語言被譽為一種強大而靈活的編程語言,掌握好C語言不僅可以讓輕松駕馭各種編程任務(wù),還能夠為的職業(yè)生涯打下堅實的基礎(chǔ)。但要成為C語言的“卷王”,需要一定的學(xué)習(xí)方法和技巧。下面就是
    的頭像 發(fā)表于 07-06 08:04 ?363次閱讀
    按照<b class='flag-5'>這樣</b><b class='flag-5'>學(xué)習(xí)</b>C語言,成為卷王不是夢!

    人工智能、機器學(xué)習(xí)和深度學(xué)習(xí)是什么

    在科技日新月異的今天,人工智能(Artificial Intelligence, AI)、機器學(xué)習(xí)(Machine Learning, ML)和深度學(xué)習(xí)(Deep Learning, DL)已成為
    的頭像 發(fā)表于 07-03 18:22 ?1440次閱讀

    深度學(xué)習(xí)與傳統(tǒng)機器學(xué)習(xí)的對比

    在人工智能的浪潮中,機器學(xué)習(xí)和深度學(xué)習(xí)無疑是兩大核心驅(qū)動力。它們各自以其獨特的方式推動著技術(shù)的進步,為眾多領(lǐng)域帶來了革命性的變化。然而,盡管它們都屬于機器
    的頭像 發(fā)表于 07-01 11:40 ?1547次閱讀

    蔡司坐標(biāo)測量技能提升培訓(xùn)服務(wù)

    測量設(shè)備的深刻理解,蔡司為坐標(biāo)測量領(lǐng)域的客戶提供一系列豐富的學(xué)習(xí)課程,并設(shè)計了完善的學(xué)習(xí)路徑,其中包括AUKOM理論知識學(xué)習(xí)以及基于CALYPSO軟件的各項應(yīng)用技能
    的頭像 發(fā)表于 06-18 11:47 ?441次閱讀
    蔡司<b class='flag-5'>三</b>坐標(biāo)測量<b class='flag-5'>技能</b>提升培訓(xùn)服務(wù)

    使用NVIDIA Isaac Manipulator生成抓取姿勢和機器人運動

    NVIDIA 宣布與 Intrinsic.ai 就工業(yè)機器人任務(wù)的基礎(chǔ)技能模型學(xué)習(xí)展開合作。
    的頭像 發(fā)表于 05-17 10:33 ?1470次閱讀
    使用NVIDIA Isaac Manipulator生成抓取姿勢和<b class='flag-5'>機器</b>人運動

    機器學(xué)習(xí)8大調(diào)參技巧

    今天給大家一篇關(guān)于機器學(xué)習(xí)調(diào)參技巧的文章。超參數(shù)調(diào)優(yōu)是機器學(xué)習(xí)例程中的基本步驟之一。方法也稱為超參數(shù)優(yōu)化,需要搜索超參數(shù)的最佳配置以實現(xiàn)最
    的頭像 發(fā)表于 03-23 08:26 ?709次閱讀
    <b class='flag-5'>機器</b><b class='flag-5'>學(xué)習(xí)</b>8大調(diào)參技巧

    四足機器人ANYmal展新技能:跑酷

     該團隊通過將機器學(xué)習(xí)與基于模型的控制相結(jié)合,升級了ANYmal的算法,使之能夠精確感知并跨越碎石堆中的縫隙/凹坑,從而敏捷地在各種復(fù)雜地形間穿行游刃有余。
    的頭像 發(fā)表于 03-14 14:26 ?487次閱讀

    人工智能和機器學(xué)習(xí)的頂級開發(fā)板有哪些?

    設(shè)備不必再依賴遠程服務(wù)器或云來洞察傳感器數(shù)據(jù)或用戶輸入。像TinyML這樣的軟件框架正在發(fā)展成為微控制器專用的機器學(xué)習(xí)解決方案,而傳統(tǒng)的深度學(xué)習(xí)框架也可以在功能強
    的頭像 發(fā)表于 02-29 18:59 ?912次閱讀
    人工智能和<b class='flag-5'>機器</b><b class='flag-5'>學(xué)習(xí)</b>的頂級開發(fā)板有哪些?
    主站蜘蛛池模板: 三级视频网站在线观看播放 | 乱色伦短篇小说 | 天天干人人干 | 三级在线免费观看 | 中文字幕一二三四区2021 | 18视频免费网址在线观看 | 韩国三级床戏合集 | 一区二区免费视频 | 国产精品久久久久网站 | 亚洲精品在线免费观看视频 | 五月天婷婷视频在线观看 | 免费欧美黄色 | 国产馆精品推荐在线观看 | 国产在线美女 | 色婷婷综合缴情综六月 | 免费在线观看一级毛片 | 久久国产精品免费观看 | 免费二级c片观看 | 狠狠色丁香久久婷婷 | 手机看片www xiao2b cm | 国产精品资源站 | 中文字幕在线观看一区 | 99色婷婷| 27pao强力打造高清免费高 | 成人国产精品高清在线观看 | 风流护士| 欧美性极品xxxxx | 欧美精品一区二区三区视频 | 四虎国产精品永久地址51 | 亚洲日本欧美日韩高观看 | 午夜一区二区在线观看 | 亚洲一区视频在线 | 狼人射综合| 亚洲国产精品网站久久 | 国产高清在线播放免费观看 | 成 年 人 视频在线播放 | 高清一区高清二区视频 | 国产小视频在线免费观看 | 日本黄色网址大全 | 色在线视频观看 | 天天干人人 |