在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

GPU 引領(lǐng)的深度學(xué)習(xí)

母豬會上樹 ? 2023-01-04 11:17 ? 次閱讀

早期的機(jī)器學(xué)習(xí)是基于搜索的,主要依賴于經(jīng)過一些優(yōu)化的蠻力方法。但隨著機(jī)器學(xué)習(xí)的成熟,它專注于加速成熟的統(tǒng)計(jì)方法和優(yōu)化問題。深度學(xué)習(xí)也出現(xiàn)了,它找到了一個不太可能的優(yōu)化來源。在這里,我們將了解現(xiàn)代機(jī)器學(xué)習(xí)如何找到新方法來帶來規(guī)模和速度。

人工智能的轉(zhuǎn)變

在本系列的第 1 部分中,我們探討了 AI 的一些歷史以及從 Lisp 到現(xiàn)代編程語言和深度學(xué)習(xí)等計(jì)算智能新范式的旅程。我們還討論了依賴于優(yōu)化搜索形式的早期人工智能應(yīng)用、在海量數(shù)據(jù)集上訓(xùn)練的現(xiàn)代神經(jīng)網(wǎng)絡(luò)架構(gòu),以及解決十年前認(rèn)為不可能解決的問題。今天的重點(diǎn)是雙重的;進(jìn)一步加速這些應(yīng)用程序并將它們限制在智能手機(jī)等功率優(yōu)化環(huán)境中。

今天大多數(shù)加速的重點(diǎn)是深度學(xué)習(xí)。深度學(xué)習(xí)是一種神經(jīng)網(wǎng)絡(luò)架構(gòu),它依賴于許多層次的神經(jīng)網(wǎng)絡(luò),其中層可以支持不同的特征檢測功能。這些深度神經(jīng)網(wǎng)絡(luò)依賴于可以輕松受益于并行性的向量運(yùn)算。這些架構(gòu)代表了神經(jīng)網(wǎng)絡(luò)層的分布式計(jì)算以及層內(nèi)許多神經(jīng)元的并行計(jì)算的機(jī)會。

使用 GPU 加速機(jī)器學(xué)習(xí)

加速深度學(xué)習(xí)應(yīng)用程序的不太可能的來源是圖形處理單元或 GPU。GPU 是一種特殊設(shè)備,用于加速輸出到顯示設(shè)備的幀緩沖區(qū)(內(nèi)存)的構(gòu)建。GPU 卸載幀緩沖區(qū)中的圖像渲染,而不是依賴處理器來執(zhí)行此操作。GPU 由數(shù)千個獨(dú)立內(nèi)核組成,這些內(nèi)核并行運(yùn)行并執(zhí)行特定類型的計(jì)算,例如矢量數(shù)學(xué)。盡管最初的 GPU 專為視頻應(yīng)用而設(shè)計(jì),但人們發(fā)現(xiàn)它們還可以加速科學(xué)計(jì)算中的運(yùn)算,例如矩陣乘法。

GPU 供應(yīng)商樂于提供 API,允許開發(fā)人員將 GPU 處理集成到他們的應(yīng)用程序中,但這項(xiàng)工作也可以通過適用于各種不同環(huán)境的標(biāo)準(zhǔn)包來完成。R 編程語言和環(huán)境包括與 GPU 配合使用以加速處理的包,例如gputools、gmatrix和gpuR。GPU 也可以通過各種庫(例如numba包或Theano )與 Python 一起使用。

這些軟件包使任何有意使用它們的人都可以使用 GPU 加速機(jī)器學(xué)習(xí)。但更專業(yè)的方法也在路上。2019 年,英特爾?以 20 億美元的價格收購了 Habana Labs。Habana Labs 為服務(wù)器中的各種機(jī)器學(xué)習(xí)加速器開發(fā)了定制芯片。在此之前,2017 年以 150 億美元的價格收購了 Mobileye 的自動駕駛芯片技術(shù)

定制硅和說明

除了服務(wù)器和臺式機(jī)中的 GPU 加速之外,機(jī)器學(xué)習(xí)加速器正在超越傳統(tǒng)平臺,進(jìn)入功率受限的嵌入式設(shè)備和智能手機(jī)。這些加速器采用多種形式,從 U 盤、API 到智能手機(jī)神經(jīng)網(wǎng)絡(luò)加速器,以及用于深度學(xué)習(xí)加速的矢量指令。

智能手機(jī)的深度學(xué)習(xí)

深度學(xué)習(xí)工具包已經(jīng)從 PC 發(fā)展到適用于更受限網(wǎng)絡(luò)的智能手機(jī)。TensorFlow Lite 和 Core ML 等框架已經(jīng)部署在移動設(shè)備上用于機(jī)器學(xué)習(xí)應(yīng)用程序。Apple ?最近發(fā)布了 A12 仿生芯片,其中包含一個 8 核神經(jīng)網(wǎng)絡(luò)引擎,用于開發(fā)更節(jié)能的神經(jīng)網(wǎng)絡(luò)應(yīng)用程序。這將擴(kuò)展 Apple 智能手機(jī)上的深度學(xué)習(xí)應(yīng)用程序。

Google 為 Android ? 8.1 發(fā)布了具有機(jī)器學(xué)習(xí)功能的神經(jīng)網(wǎng)絡(luò) API (NNAPI)。這些在 Google Lens 應(yīng)用程序的自然語言處理和圖像識別環(huán)境中用于 Google Assistant。NNAPI 類似于其他深度學(xué)習(xí)工具包,但專為 Android 智能手機(jī)環(huán)境及其資源限制而構(gòu)建。

深度學(xué)習(xí) USB

英特爾發(fā)布了其神經(jīng)計(jì)算棒的更新版本,以 USB 棒的形式加速深度學(xué)習(xí)應(yīng)用程序。這可以被各種機(jī)器學(xué)習(xí)框架使用,例如 TensorFlow、Caffe 和 PyTorch。當(dāng) GPU 不可用時,該設(shè)備是一個有趣的選擇,而且還允許深度學(xué)習(xí)應(yīng)用程序的快速原型設(shè)計(jì)。

深度學(xué)習(xí)說明

最后,雖然機(jī)器學(xué)習(xí)計(jì)算已從 CPU 轉(zhuǎn)移到 GPU,但英特爾已使用新指令優(yōu)化其至強(qiáng)指令集以加速深度學(xué)習(xí)。這些稱為 AVX-512 擴(kuò)展的新指令(稱為向量神經(jīng)網(wǎng)絡(luò)指令或 VNNi)提高了卷積神經(jīng)網(wǎng)絡(luò)操作的吞吐量。

概括

GPU 在機(jī)器學(xué)習(xí)中的應(yīng)用創(chuàng)造了為各種應(yīng)用程序構(gòu)建和部署大規(guī)模深度神經(jīng)網(wǎng)絡(luò)的能力。機(jī)器學(xué)習(xí)框架使構(gòu)建深度學(xué)習(xí)應(yīng)用程序變得簡單。但也不甘示弱,智能手機(jī)供應(yīng)商已經(jīng)為受限應(yīng)用程序集成了節(jié)能的神經(jīng)網(wǎng)絡(luò)加速器(以及用于自定義應(yīng)用程序使用的 API)。現(xiàn)在也可以找到其他加速器來卸載到 USB 硬件,許多新的初創(chuàng)公司正在挖掘這個加速器空間以用于未來的機(jī)器學(xué)習(xí)應(yīng)用程序。

審核編輯hhy

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • gpu
    gpu
    +關(guān)注

    關(guān)注

    28

    文章

    4923

    瀏覽量

    130829
  • 機(jī)器學(xué)習(xí)

    關(guān)注

    66

    文章

    8497

    瀏覽量

    134243
  • 深度學(xué)習(xí)
    +關(guān)注

    關(guān)注

    73

    文章

    5557

    瀏覽量

    122587
收藏 人收藏

    評論

    相關(guān)推薦
    熱點(diǎn)推薦

    GPU架構(gòu)深度解析

    GPU架構(gòu)深度解析從圖形處理到通用計(jì)算的進(jìn)化之路圖形處理單元(GPU),作為現(xiàn)代計(jì)算機(jī)中不可或缺的一部分,已經(jīng)從最初的圖形渲染專用處理器,發(fā)展成為強(qiáng)大的并行計(jì)算引擎,廣泛應(yīng)用于人工智能、科學(xué)計(jì)算
    的頭像 發(fā)表于 05-30 10:36 ?269次閱讀
    <b class='flag-5'>GPU</b>架構(gòu)<b class='flag-5'>深度</b>解析

    ARM Mali GPU 深度解讀

    ARM Mali GPU 深度解讀 ARM Mali 是 Arm 公司面向移動設(shè)備、嵌入式系統(tǒng)和基礎(chǔ)設(shè)施市場設(shè)計(jì)的圖形處理器(GPU)IP 核,憑借其異構(gòu)計(jì)算架構(gòu)、能效優(yōu)化和生態(tài)協(xié)同,成為全球移動
    的頭像 發(fā)表于 05-29 10:12 ?616次閱讀

    深度學(xué)習(xí)工作負(fù)載中GPU與LPU的主要差異

    ,一個新的競爭力量——LPU(Language Processing Unit,語言處理單元)已悄然登場,LPU專注于解決自然語言處理(NLP)任務(wù)中的順序性問題,是構(gòu)建AI應(yīng)用不可或缺的一環(huán)。 本文旨在探討深度學(xué)習(xí)工作負(fù)載中GPU
    的頭像 發(fā)表于 12-09 11:01 ?3287次閱讀
    <b class='flag-5'>深度</b><b class='flag-5'>學(xué)習(xí)</b>工作負(fù)載中<b class='flag-5'>GPU</b>與LPU的主要差異

    GPU深度學(xué)習(xí)中的應(yīng)用 GPUs在圖形設(shè)計(jì)中的作用

    隨著人工智能技術(shù)的飛速發(fā)展,深度學(xué)習(xí)作為其核心部分,已經(jīng)成為推動技術(shù)進(jìn)步的重要力量。GPU(圖形處理單元)在深度學(xué)習(xí)中扮演著至關(guān)重要的角色,
    的頭像 發(fā)表于 11-19 10:55 ?1540次閱讀

    NPU在深度學(xué)習(xí)中的應(yīng)用

    設(shè)計(jì)的硬件加速器,它在深度學(xué)習(xí)中的應(yīng)用日益廣泛。 1. NPU的基本概念 NPU是一種專門針對深度學(xué)習(xí)算法優(yōu)化的處理器,它與傳統(tǒng)的CPU和GPU
    的頭像 發(fā)表于 11-14 15:17 ?1791次閱讀

    pcie在深度學(xué)習(xí)中的應(yīng)用

    深度學(xué)習(xí)模型通常需要大量的數(shù)據(jù)和強(qiáng)大的計(jì)算能力來訓(xùn)練。傳統(tǒng)的CPU計(jì)算資源有限,難以滿足深度學(xué)習(xí)的需求。因此,GPU(圖形處理單元)和TPU
    的頭像 發(fā)表于 11-13 10:39 ?1274次閱讀

    PyTorch GPU 加速訓(xùn)練模型方法

    深度學(xué)習(xí)領(lǐng)域,GPU加速訓(xùn)練模型已經(jīng)成為提高訓(xùn)練效率和縮短訓(xùn)練時間的重要手段。PyTorch作為一個流行的深度學(xué)習(xí)框架,提供了豐富的工具和
    的頭像 發(fā)表于 11-05 17:43 ?1322次閱讀

    GPU深度學(xué)習(xí)應(yīng)用案例

    GPU深度學(xué)習(xí)中的應(yīng)用廣泛且重要,以下是一些GPU深度學(xué)習(xí)應(yīng)用案例: 一、圖像識別 圖像識別是
    的頭像 發(fā)表于 10-27 11:13 ?1212次閱讀

    AI大模型與深度學(xué)習(xí)的關(guān)系

    AI大模型與深度學(xué)習(xí)之間存在著密不可分的關(guān)系,它們互為促進(jìn),相輔相成。以下是對兩者關(guān)系的介紹: 一、深度學(xué)習(xí)是AI大模型的基礎(chǔ) 技術(shù)支撐 :深度
    的頭像 發(fā)表于 10-23 15:25 ?2767次閱讀

    深度學(xué)習(xí)GPU加速效果如何

    圖形處理器(GPU)憑借其強(qiáng)大的并行計(jì)算能力,成為加速深度學(xué)習(xí)任務(wù)的理想選擇。
    的頭像 發(fā)表于 10-17 10:07 ?569次閱讀

    FPGA做深度學(xué)習(xí)能走多遠(yuǎn)?

    。例如,在數(shù)據(jù)中心中,可以將 FPGA 與 CPU 或 GPU 結(jié)合使用,根據(jù)不同的任務(wù)需求進(jìn)行靈活的資源分配和協(xié)同計(jì)算,提高整個系統(tǒng)的性能和效率。 ? 算法優(yōu)化和創(chuàng)新:隨著深度學(xué)習(xí)算法的不斷發(fā)展和優(yōu)化
    發(fā)表于 09-27 20:53

    深度學(xué)習(xí)中的時間序列分類方法

    時間序列分類(Time Series Classification, TSC)是機(jī)器學(xué)習(xí)深度學(xué)習(xí)領(lǐng)域的重要任務(wù)之一,廣泛應(yīng)用于人體活動識別、系統(tǒng)監(jiān)測、金融預(yù)測、醫(yī)療診斷等多個領(lǐng)域。隨著深度
    的頭像 發(fā)表于 07-09 15:54 ?2017次閱讀

    深度學(xué)習(xí)中的無監(jiān)督學(xué)習(xí)方法綜述

    深度學(xué)習(xí)作為機(jī)器學(xué)習(xí)領(lǐng)域的一個重要分支,近年來在多個領(lǐng)域取得了顯著的成果,特別是在圖像識別、語音識別、自然語言處理等領(lǐng)域。然而,深度學(xué)習(xí)模型
    的頭像 發(fā)表于 07-09 10:50 ?1604次閱讀

    深度學(xué)習(xí)與nlp的區(qū)別在哪

    深度學(xué)習(xí)和自然語言處理(NLP)是計(jì)算機(jī)科學(xué)領(lǐng)域中兩個非常重要的研究方向。它們之間既有聯(lián)系,也有區(qū)別。本文將介紹深度學(xué)習(xí)與NLP的區(qū)別。 深度
    的頭像 發(fā)表于 07-05 09:47 ?1564次閱讀

    深度學(xué)習(xí)與傳統(tǒng)機(jī)器學(xué)習(xí)的對比

    在人工智能的浪潮中,機(jī)器學(xué)習(xí)深度學(xué)習(xí)無疑是兩大核心驅(qū)動力。它們各自以其獨(dú)特的方式推動著技術(shù)的進(jìn)步,為眾多領(lǐng)域帶來了革命性的變化。然而,盡管它們都屬于機(jī)器學(xué)習(xí)的范疇,但
    的頭像 發(fā)表于 07-01 11:40 ?2325次閱讀
    主站蜘蛛池模板: 天天艹天天 | 国产免费一区二区三区最新 | 亚洲成人综合网站 | 99精品久久久久久久婷婷 | 久久久久久久国产精品电影 | 99热最新在线 | 俺去插| 天天澡天天摸天天爽免费 | 六月婷婷导航福利在线 | 久久久久国产一级毛片高清板 | 2021国产成人午夜精品 | 久久精品免费观看视频 | 久久久久99精品成人片三人毛片 | 天天操夜夜操夜夜操 | 青青青青久久精品国产h | 欧美性天天影院 | 日韩欧美中文字幕在线视频 | 国产啊v在线观看 | 色偷偷网址 | 69japanese日本100 69ww免费视频播放器 | 久久免费手机视频 | 欧美日剧在线免费 | 欧美地区一二三区 | yy6080理aa级伦大片一级 | 激情综合婷婷丁香六月花 | 亚洲成a人片在线观看中 | 亚洲国产精品婷婷久久 | 国产午夜视频高清 | 天天操天天操天天操香蕉 | 黄色一级一毛片 | 中文字幕在线播放一区 | 天天干在线观看 | aaa免费视频 | 全免费午夜一级毛片真人 | 97色在线视频 | 黄网站在线播放 | 99久久国产免费 - 99久久国产免费 | 天天影视欧美综合在线观看 | 天堂在线观看视频 | 欧美亚洲综合图区在线 | 成人亚洲综合 |