91在线观看视频-91在线观看视频-91在线观看免费视频-91在线观看免费-欧美第二页-欧美第1页

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

英特爾AI實驗室推出了高性能的神經網絡壓縮工具Distiller

nlfO_thejiangme ? 來源:未知 ? 作者:李倩 ? 2018-11-06 10:05 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

近日,英特爾AI 實驗室推出了高性能的神經網絡壓縮工具Distiller,便捷地實現了更小更快更高效的神經網絡計算。Distiller目前在PyTorch中實現了一系列壓縮分析算法,包括稀疏引導算法和低精度近似算法。工具包主要由以下三個部分組成:

一套集成了剪枝、正則化與量化的算法;

一系列分析和評價壓縮表現的工具;

以及一系列前沿壓縮算法的實現樣例。

更小更快更節能

目前的絕大多數神經網絡都越來越深,其參數達到了百萬量級。如此龐大的模型即使在硬件加速的條件下也是十分消耗資源的計算密集型算法,即使只考慮推理階段也需要花費較多的時間。在某些低延時的場合,比如說自動駕駛和控制領域這樣的處理時間就會造成很多問題。同時在消費電子上較長的延時也會造成用戶體驗的下降。

大型模型同時也會消耗大量的內存,以及隨之而來的算力與能耗,這對于移動設備來說是十分重要的問題。同樣對于大型數據中心來說模型的能耗也是不同忽視的問題。同時考慮到存儲和傳輸的限制,神經網絡的壓縮具有十分重要的現實需求。在精度可以接受的條件下,壓縮的越小神經網絡需要的計算資源和帶寬就越少。由于深度神經網絡的權重矩陣具有稀疏性,通過正則化和剪枝以及量化過程可以很好的壓縮模型的體量。

稀疏的神經網絡模型表示可以被大幅度壓縮。目前很多神經網絡性能都受制于帶寬,這意味著它們的計算性能主要取決于可用的帶寬,帶寬不足的情況下硬件需要用更多的時間將數據輸入到計算單元中。全連接層、RNN和LSTM等典型的結構就受制于帶寬。如果能夠減小這些層所需要的帶寬就能大幅提高它們的速度。

通過修剪模型中的某些權重、核甚至是整個層實現減小帶寬提高速度的功能,但同時卻不影響算法最終精度的表現,也減小了功耗和延時。最后考慮到讀寫非片上存儲的能耗是片上存儲的兩個量級以上,如果較小的模型可以保存在片上存儲中,可以使性能得到質的飛躍,讓延時和能耗也隨之降低。所以同時稀疏或者壓縮表示時,可以有效提升算法的表現。

工具框架

Distiller目前的設計與PyTorch進行集成,其設計理念如下圖所示,PyTorch的訓練與Distiller進行交互。在distiller中包含了調度、算法和應用等主要模塊以及匯總、日志的輔助功能,在很多常見的科學計算包的基礎上利用jupyter實現交互功能,基于tensorboard實現模型和日志信息的展示。

算法

Distiller中集成了先進的剪枝和量化算法,幫助用戶有效的壓縮模型的體量。

剪枝算法主要分為了權重正則化、權重修剪、低精度等三種實現方式,7種具體的方法。

幅度剪枝利用閾值來將每一個權重進行二值化,小于閾值的權重將被設為0,不同的層可以設置不同的權值;

敏感度剪枝與閾值的方法類似,但使用了敏感因子s與這一層的權重分布標準差σ的乘積來作為閾值。越敏感的層(靠近輸入的)設置的s就越小;

level剪枝通過設置稀疏度來實現剪枝,這種方法相較于前面方法穩定,因為目標的稀疏程度與元素的賦值不相關。

自動梯度剪枝(AGP)

這種方法的稀疏度將會隨著初始稀疏和最終稀疏自適應的變化;

RNN剪枝

結構剪枝(通過移除整個核、濾波器甚至是整個特征圖來實現):包含了結構排序剪枝和對于較少激活特征圖的激活相關剪枝。

量化也是一類重要的壓縮算法,Distall中同時也集成了四種量化算法:

DoReFa-Net: Training Low Bitwidth Convolutional Neural Networks with Low Bitwidth Gradients

PACT: Parameterized Clipping Activation for Quantized Neural Networks

WRPN: Wide Reduced-Precision Networks

對稱線性量化

安 裝

如果想要使用這個工具的小伙伴,可以到git上下載

$ git clone https://github.com/NervanaSystems/distiller.git

$ cd distiller

然后利用你喜歡的工具創建一個python虛擬環境

$ python3 -m virtualenv env

激活環境并安裝對應的依賴包:

$ source env/bin/activate

$ pip3 install -r requirements.txt

注:這一版本依賴于CUDA8.0,會自動安裝PyTorch3.1

然后就可以愉快的使用了,可以通過運行下面的文件來熟悉工具的使用:

distiller/examples/classifier_compression/compress_classifier.py

#example

$ python3 compress_classifier.py --arch simplenet_cifar ../../../data.cifar10 -p 30 -j=1 --lr=0.01

#對于cifar10壓縮

$ time python3 compress_classifier.py -a alexnet --lr 0.005 -p 50 ../../../data.imagenet -j 44 --epochs 90 --pretrained --compress=../sensitivity-pruning/alexnet.schedule_sensitivity.yaml

#利用yaml配置文件來運行

另外example下還有多個例子可以嘗試。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 英特爾
    +關注

    關注

    61

    文章

    10197

    瀏覽量

    174753
  • 神經網絡
    +關注

    關注

    42

    文章

    4814

    瀏覽量

    103708

原文標題:英特爾推出全新可便捷實現「更小更快更高效的神經網絡計算」的壓縮工具Distiller

文章出處:【微信號:thejiangmen,微信公眾號:將門創投】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    英特爾發布全新GPU,AI和工作站迎來新選擇

    英特爾推出面向準專業用戶和AI開發者的英特爾銳炫Pro GPU系列,發布英特爾? Gaudi 3 AI
    發表于 05-20 11:03 ?1517次閱讀

    開售RK3576 高性能人工智能主板

    ZYSJ-2476B 高性能智能主板,采用瑞芯微 RK3576 高性能 AI 處理器、神經網絡處理器 NPU, Android 14.0/debian11/ubuntu20.04 操
    發表于 04-23 10:55

    神經網絡壓縮框架 (NNCF) 中的過濾器修剪統計數據怎么查看?

    無法觀察神經網絡壓縮框架 (NNCF) 中的過濾器修剪統計數據
    發表于 03-06 07:10

    英特爾?獨立顯卡與OpenVINO?工具套件結合使用時,無法運行推理怎么解決?

    使用英特爾?獨立顯卡與OpenVINO?工具套件時無法運行推理
    發表于 03-05 06:56

    英特爾推出具備高性能和能效的以太網解決方案

    網絡適配器,以及英特爾以太網控制器E610和網絡適配器,旨在滿足企業、電信、云、邊緣、科學計算(HPC)和AI等領域日益增長的需求。這些新一代解決方案可以提供強勁的
    發表于 02-25 11:17 ?230次閱讀
    <b class='flag-5'>英特爾</b><b class='flag-5'>推出</b>具備<b class='flag-5'>高性能</b>和能效的以太網解決方案

    BU-67121W實驗室航空電子接口計算機North Hills

    MIL-STD-1553和ARINC 429系統應用程序而設計。它顯著減少了從測試實驗室到被測機載1553/429接口所需的長距離布線/電線,進而降低了相關成本。優勢:編程靈活性:內置的英特爾處理器為
    發表于 02-11 09:26

    NVIDIA推出DRIVE AI安全檢測實驗室

    全新 NVIDIA 實驗室獲得美國國家標準學會國家認可委員會(ANAB)的認證,可執行自動駕駛汽車的功能安全、網絡安全和 AI 檢測。
    的頭像 發表于 01-09 16:01 ?686次閱讀

    英特爾推出全新英特爾銳炫B系列顯卡

    備受玩家青睞的價格提供卓越的性能與價值1,很好地滿足現代游戲需求,并為AI工作負載提供加速。其配備的英特爾Xe矩陣計算引擎(XMX),為新推出的XeSS 2提供強大支持。XeSS 2的
    的頭像 發表于 12-07 10:16 ?1434次閱讀
    <b class='flag-5'>英特爾</b><b class='flag-5'>推出</b>全新<b class='flag-5'>英特爾</b>銳炫B系列顯卡

    英特爾發布全新企業AI一體化方案

    近日,英特爾正式推出了全新的企業AI一體化方案。該方案以英特爾至強處理器和英特爾Gaudi 2D AI
    的頭像 發表于 12-03 11:20 ?596次閱讀

    英特爾聚焦AI座艙

    英特爾推出首款銳炫車載獨立顯卡(dGPU)和第一代英特爾軟件定義車載SoC系列,滿足當前消費者對汽車內部配備更多屏幕、獲得更高清晰度等AI座艙體驗需求。
    的頭像 發表于 10-30 16:26 ?438次閱讀

    Inflection AI攜手英特爾推出企業級AI系統

    近日,AI初創企業Inflection AI英特爾聯合宣布了一項重大合作——推出基于英特爾Gaudi 3
    的頭像 發表于 10-09 16:40 ?757次閱讀

    英特爾發布至強6性能核處理器

    近日,英特爾正式推出了其全新的英特爾? 至強? 6性能核處理器(代號Granite Rapids),旨在為AI、數據分析、科學計算等計算密集
    的頭像 發表于 09-30 16:22 ?708次閱讀

    英特爾與百度共同為AI時代打造高性能基礎設施

    2024年9月25日,北京 ?——?在2024百度云智大會上,英特爾應邀出席并披露基于英特爾?至強?6處理器的新一代云實例即將在百度智能云上推出,分享雙方在云數據中心、大模型軟件服務與生態以及
    的頭像 發表于 09-27 09:48 ?432次閱讀
    <b class='flag-5'>英特爾</b>與百度共同為<b class='flag-5'>AI</b>時代打造<b class='flag-5'>高性能</b>基礎設施

    英特爾攜手運營商伙伴,共探AI驅動通信網絡新未來

    2024年9月25日,北京?—— 今日,英特爾在2024年國際信息通信展(以下簡稱PT展)上舉辦“英特爾‘智通未來’AI通訊與網絡轉型研討會”。此次活動邀請了中國移動與中國電信兩大運營
    的頭像 發表于 09-27 09:26 ?519次閱讀
    <b class='flag-5'>英特爾</b>攜手運營商伙伴,共探<b class='flag-5'>AI</b>驅動通信<b class='flag-5'>網絡</b>新未來

    開箱即用,AISBench測試展示英特爾至強處理器的卓越推理性能

    。 中國電子技術標準化研究院賽西實驗室依據國家標準《人工智能服務器系統性能測試規范》(征求意見稿)相關要求,使用AISBench?2.0測試工具,完成了第五代英特爾至強可擴展處理器的
    的頭像 發表于 09-06 15:33 ?830次閱讀
    開箱即用,AISBench測試展示<b class='flag-5'>英特爾</b>至強處理器的卓越推理<b class='flag-5'>性能</b>
    主站蜘蛛池模板: 久久99精品久久久久久牛牛影视 | 国产美女主播在线 | 亚洲人成人77777网站 | 欧美一区二区高清 | 亚洲好骚综合 | 午夜欧美精品 | 夜夜骑日日射 | 国色天香网在线 | 在线www天堂资源网 在线播放 你懂的 | 丁香六月综合激情 | 色视频免费在线 | 麒麟色欧美影院在线播放 | 亚洲国产午夜看片 | 中文字幕av一区二区三区 | 福利你懂的 | 恐怖片大全恐怖片免费观看好看的恐怖片 | 一级骚片超级骚在线观看 | 欧美在线三级 | 天天射天天怕 | 精品色综合 | 久久99久久99精品免观看 | 伊人9| www.夜色| 午夜爽视频 | 一区二区三区四区视频在线观看 | 国产美女亚洲精品久久久综合 | 久久伦子沙发 | 亚洲第一区第二区 | 天天干天天爱天天操 | 在线小视频你懂的 | 日本特黄特色特爽大片老鸭 | 国模私拍大尺度视频在线播放 | 我不卡老子影院午夜伦我不卡四虎 | 91久久婷婷国产综合精品青草 | 激激婷婷综合五 | 成人女人a毛片在线看 | 国产精品 色 | 黄色网址中文字幕 | 综合五月婷婷 | 成人激情站 | 国产剧情麻豆三级在线观看 |