在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

斯坦福機器學習硬件加速器的課程學芯片技術機會來了

人工智能和機器人研究院 ? 2018-07-21 09:27 ? 次閱讀

芯片技術的機會來了!斯坦福大學2018秋季學期推出《機器學習硬件加速器》課程,深入介紹機器學習系統中設計訓練和推理加速器的架構技術。課程涵蓋經典的ML算法,用于ML模型推理和訓練的加速器設計等,超多專業材料和PPT,是本領域不可多得的專業課程。

本課程將深入介紹用于在機器學習系統中設計訓練和推理加速器的架構技術。本課程將涵蓋經典的ML算法,如線性回歸和支持向量機,以及DNN模型,如卷積神經網絡和遞歸神經網絡。我們將考慮這些模型的訓練和推理,并討論諸如batch size、精度、稀疏度和壓縮等參數對這些模型精度的影響。我們將介紹用于ML模型推理和訓練的加速器設計。學生將熟悉使用并行性、局部性和低精度來實現ML中使用的核心計算內核的硬件實現技術。為了設計高效節能的加速器,學生們將建立直覺,在ML模型參數和硬件實現技術之間進行權衡。學生將閱讀最近的研究論文并完成一個設計項目。

主講教師:

Kunle Olukotun

Kunle Olukotun是斯坦福大學電氣工程和計算機科學的Cadence設計系統教授,自1991年以來一直在該系任教。Olukotun以領導Stanford Hydra研究項目而著名,該項目開發了首批支持thread-level speculation的芯片多處理器

Ardavan Pedram

Ardavan Pedram是斯坦福大學電氣工程系研究助理,與Kunle Olukotun教師合作的Pervasive Prallelism Laboratory (PPL)項目的成員。

特邀講師:

Boris Ginsburg, NVIDIA

Robert Schreiber, Cerebras Systems

Mikhail Smelyanskiy, Facebook

Cliff Young, Google

課程安排和閱讀材料

第1課:簡介,摩爾定律和Dennard Scaling定律后硬件加速器的作用

閱讀:暗硅(Dark Silicon)有用嗎? Hennessy Patterson第7.1-7.2章

https://ieeexplore.ieee.org/document/6241647/

第2課:經典ML算法:回歸、SVM

閱讀:TABLA:基于統一模板的加速統計機器學習的架構

https://www.cc.gatech.edu/~hadi/doc/paper/2015-tr-tabla.pdf

第3課:線性代數基礎和加速線性代數BLAS運算

20世紀的技術:收縮陣列和MIMD,CGRAs

閱讀:為什么選擇收縮架構?

www.eecs.harvard.edu/~htk/publication/1982-kung-why-systolic-architecture.pdf

高性能GEMM的剖析

https://www.cs.utexas.edu/users/pingali/CS378/2008sp/papers/gotoPaper.pdf

第4課:評估性能、能效、并行性,局部性、內存層次,Roofline模型

閱讀:Dark Memory and Accelerator-Rich System Optimization in the Dark Silicon Era

https://arxiv.org/abs/1602.04183

第5課:真實世界的架構:將其付諸實踐

加速GEMM:定制,GPU,TPU1架構及其GEMM性能

閱讀:Google TPU

https://arxiv.org/pdf/1704.04760.pdf

Codesign Tradeoffs

https://ieeexplore.ieee.org/document/6212466/

NVIDIA Tesla V100

images.nvidia.com/content/volta-architecture/pdf/volta-architecture-whitepaper.pdf

第6課:神經網絡:MLP和CNN推理

閱讀:IEEE proceeding

Brooks’s book (Selected Chapters)

第7課:加速CNN的推理:實踐中的阻塞(Blocking)和并行(Parallelism)

DianNao, Eyeriss, TPU1

閱讀:一種阻塞卷積神經網絡的系統方法

https://arxiv.org/abs/1606.04209

Eyeriss:用于卷積神經網絡的節能數據流的空間架構

https://people.csail.mit.edu/emer/papers/2016.06.isca.eyeriss_architecture.pdf

Google TPU (see lecture 5)

第8課:使用Spatial建模神經網絡,分析性能和能量

閱讀:Spatial:一種應用程序加速器的語言和編譯器

http://arsenalfc.stanford.edu/papers/spatial18.pdf

第9課:訓練:SGD,反向傳播,統計效率,batch size

閱讀:去年的NIPS workshop:Graphcore

https://supercomputersfordl2017.github.io/Presentations/SimonKnowlesGraphCore.pdf

第10課:DNN的彈性:稀疏性和低精度網絡

閱讀:EIE:壓縮深度神經網絡的高效推斷機(Efficient Inference Engine)

https://arxiv.org/pdf/1602.01528.pdf

Flexpoint of Nervana

https://arxiv.org/pdf/1711.02213.pdf

Boris Ginsburg:卷積網絡的Large Batch訓練

https://arxiv.org/abs/1708.03888

LSTM Block Compression by Baidu?

第11課:低精度訓練

閱讀:HALP:High-Accuracy Low-Precision Training

https://arxiv.org/abs/1803.03383

Ternary or binary networks

See Boris Ginsburg's work (lecture 10)

第12課:分布式和并行系統訓練:Hogwild!,異步和硬件效率

閱讀:Deep Gradient compression

https://arxiv.org/abs/1712.01887

Hogwild!:一種并行化隨機梯度下降的Lock-Free 方法

https://people.eecs.berkeley.edu/~brecht/papers/hogwildTR.pdf

大規模分布式深度網絡

https://static.googleusercontent.com/media/research.google.com/en//archive/large_deep_networks_nips2012.pdf

第13課:FPGA和CGRAs:Catapult,Brainwave, Plasticine

Catapult

https://www.microsoft.com/en-us/research/wp-content/uploads/2016/10/Cloud-Scale-Acceleration-Architecture.pdf

Brainwave

https://www.microsoft.com/en-us/research/uploads/prod/2018/03/mi0218_Chung-2018Mar25.pdf

Plasticine

dawn.cs.stanford.edu/pubs/plasticine-isca2017.pdf

第14課:ML基準:DAWNbench,MLPerf

DawnBench

https://cs.stanford.edu/~matei/papers/2017/nips_sysml_dawnbench.pdf

MLPerf

https://mlperf.org/

第15課:Project presentations

更多閱讀材料:https://cs217.github.io/readings

課程PPT:https://cs217.github.io/lecture_slides

第一課對深度學習的發展、摩爾定律、Dennard Scaling、相關理論方法等做了較為詳盡的介紹,非常干貨,下面附上第一課的PPT。

深度學習的挑戰:深度學習存在理論嗎?

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 加速器
    +關注

    關注

    2

    文章

    819

    瀏覽量

    38692
  • 機器學習
    +關注

    關注

    66

    文章

    8473

    瀏覽量

    133736

原文標題:斯坦福2018秋季課程大放送!深入淺出帶你玩轉機器學習加速

文章出處:【微信號:gh_ecbcc3b6eabf,微信公眾號:人工智能和機器人研究院】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    無法導入硬件加速器

    嗨!我已經創建了一個硬件加速器(在vhdl中)并且合成成功完成。但是,當我使用創建和導入外圍設備向導時,它向我顯示我的包在庫中不可用,盡管它是。我能做什么 ???L'enfer,c'est l
    發表于 02-27 14:15

    斯坦福機器學習公開課筆記之單變量線性回歸

    斯坦福機器學習公開課筆記 一 --單變量線性回歸
    發表于 06-11 13:53

    機器學習實戰:GNN加速器的FPGA解決方案

    的提升,對傳統的機器學習算法設計以及其實現技術來了嚴峻的挑戰。在此背景之下,諸多基于Graph的新型機器
    發表于 10-20 09:48

    H.264解碼中CABAC硬件加速器怎么實現?

    H.264解碼中CABAC硬件加速器怎么實現?
    發表于 06-07 06:48

    問下ARM3的硬件加速器只能用verilog寫嗎?

    問下ARM3的硬件加速器只能用verilog寫嗎?
    發表于 09-30 10:45

    利用硬件加速器提高處理的性能

    處理內部集成的硬件加速器可以實現三種廣泛使用的信號處理操作:FIR(有限沖激響應)、IIR(無限沖激響應)和FFT(快速傅里葉變換)。硬件加速器減輕了核處理的負擔,能潛在的提升處理
    發表于 12-04 15:22 ?1441次閱讀

    Veloce仿真環境下的SoC端到端硬件加速器功能驗證

    很多人認為硬件加速器無非是一種速度更快的仿真而已。毫無疑問,由于硬件加速器使用物理硬件進行仿真,使用硬件加速器驗證復雜的集成電路和大型片上
    發表于 03-28 14:50 ?3986次閱讀
    Veloce仿真環境下的SoC端到端<b class='flag-5'>硬件加速器</b>功能驗證

    斯坦福大學開放課程機器學習課程》[中英雙語字幕]視頻下載

    斯坦福大學開放課程機器學習課程》[中英雙語字幕]視頻下載 來源:互聯網(轉載協議)發布日期:2011-09-13 14:30瀏覽: 10
    發表于 06-27 18:49 ?401次閱讀

    基于Xilinx FPGA的Memcached硬件加速器的介紹

    本教程討論基于Xilinx FPGA的Memcached硬件加速器技術細節,該硬件加速器可為10G以太網端口提供線速Memcached服務。
    的頭像 發表于 11-27 06:41 ?3852次閱讀

    毫米波傳感1443硬件加速器的簡單介紹

    2.6 mmWave波形傳感簡介1443硬件加速器
    的頭像 發表于 05-08 06:20 ?3525次閱讀
    毫米波傳感<b class='flag-5'>器</b>1443<b class='flag-5'>硬件加速器</b>的簡單介紹

    硬件加速器提升下一代SHARC處理的性能

    硬件加速器提升下一代SHARC處理的性能
    發表于 04-23 13:06 ?6次下載
    <b class='flag-5'>硬件加速器</b>提升下一代SHARC處理<b class='flag-5'>器</b>的性能

    OpenHarmony Dev-Board-SIG專場:OpenHarmony 新硬件加速器

    OpenHarmony Dev-Board-SIG專場:OpenHarmony 新硬件加速器
    的頭像 發表于 12-28 15:12 ?1465次閱讀
    OpenHarmony Dev-Board-SIG專場:OpenHarmony 新<b class='flag-5'>硬件加速器</b>

    什么是AI加速器 如何確需要AI加速器

    AI加速器是一類專門的硬件加速器或計算機系統旨在加速人工智能的應用,主要應用于人工智能、人工神經網絡、機器視覺和機器
    發表于 02-06 12:47 ?4915次閱讀

    用于 AI 應用的硬件加速器設計師指南

    當 AI 設計人員將硬件加速器整合到用于訓練和推理應用的定制芯片中時,應考慮以下四個因素
    發表于 08-19 11:35 ?1792次閱讀
    用于 AI 應用的<b class='flag-5'>硬件加速器</b>設計師指南

    借助硬件加速器開發您的設計

    借助硬件加速器開發您的設計
    的頭像 發表于 01-03 09:45 ?1023次閱讀
    主站蜘蛛池模板: 伊人久久大香线蕉综合爱婷婷 | 五月婷婷在线免费观看 | 瑟瑟网站免费 | 美日毛片 | 午夜寂寞影院视频观看 | 欧美特黄一免在线观看 | 一级特黄a免费大片 | 五月天婷婷色图 | 国产福利午夜 | 4438全国最大成人免费高清 | 狠狠干亚洲色图 | 好爽好大www视频在线播放 | 久久国产午夜精品理论篇小说 | 亚洲成人毛片 | 99啪啪| 日本一区二区三区不卡在线看 | 欧美综合国产精品日韩一 | 91老色批网站免费看 | 欧美在线精品一区二区三区 | 男人的天堂午夜 | 加勒比一本大道香蕉在线视频 | 毛片的网站 | 亚洲成人aaa | 夜夜骑天天操 | 天天操狠狠操夜夜操 | 91夫妻视频 | 91三级在线 | 三级黄页 | 在线资源你懂的 | 色六月丁香| 成人五级毛片免费播放 | 一二三区在线观看 | 欧美有码视频 | 国内精品久久久久影院男同志 | 欧美日韩精品一区二区在线线 | 黄网站色成年片大免费软件 | 日本三级视频在线 | 国产在线播放成人免费 | 久久性生活 | 丰满年轻岳欲乱中文字幕 | 丁香婷婷综合网 |