在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

袁進(jìn)輝:分享了深度學(xué)習(xí)框架方面的技術(shù)進(jìn)展

mK5P_AItists ? 2018-01-25 09:23 ? 次閱讀

來源:微軟研究院AI頭條

概要:1月17日,院友袁進(jìn)輝博士回到微軟亞洲研究院做了題為《打造最強深度學(xué)習(xí)引擎》的報告,分享了深度學(xué)習(xí)框架方面的技術(shù)進(jìn)展。

1月17日,院友袁進(jìn)輝博士回到微軟亞洲研究院做了題為《打造最強深度學(xué)習(xí)引擎》的報告,分享了深度學(xué)習(xí)框架方面的技術(shù)進(jìn)展。報告中主要講解了何為最強的計算引擎?專用硬件為什么快?大規(guī)模專用硬件面臨著什么問題?軟件構(gòu)架又應(yīng)該解決哪些問題?

首先,我們一起來開一個腦洞:想象一個最理想的深度學(xué)習(xí)引擎應(yīng)該是什么樣子的,或者說深度學(xué)習(xí)引擎的終極形態(tài)是什么?看看這會給深度學(xué)習(xí)框架和AI專用芯片研發(fā)帶來什么啟發(fā)。

以大家耳熟能詳?shù)木矸e神經(jīng)網(wǎng)絡(luò)CNN 為例,可以感覺一下目前訓(xùn)練深度學(xué)習(xí)模型需要多少計算力。下方這張表列出了常見CNN模型處理一張圖片需要的內(nèi)存容量和浮點計算次數(shù),譬如VGG-16網(wǎng)絡(luò)處理一張圖片就需要16Gflops。值得注意的是,基于ImageNet數(shù)據(jù)集訓(xùn)練CNN,數(shù)據(jù)集一共大約120萬張圖片,訓(xùn)練算法需要對這個數(shù)據(jù)集掃描100遍(epoch),這意味著10^18次浮點計算,即1exaFlops。簡單演算一下可發(fā)現(xiàn),基于一個主頻為2.0GHz的CPU core來訓(xùn)練這樣的模型需要好幾年的時間。

袁進(jìn)輝:分享了深度學(xué)習(xí)框架方面的技術(shù)進(jìn)展

袁進(jìn)輝:分享了深度學(xué)習(xí)框架方面的技術(shù)進(jìn)展

專用硬件比通用硬件(如CPU、GPU)快,有多種原因,主要包括:(1)通用芯片一般經(jīng)歷“取指-譯碼-執(zhí)行”(甚至包括“取數(shù)據(jù)”)的步驟才能完成一次運算,專用硬件大大減小了“取指-譯碼”等開銷,數(shù)據(jù)到達(dá)即執(zhí)行;(2)專用硬件控制電路復(fù)雜度低,可以在相同的面積下集成更多對運算有用的器件,可以在一個時鐘周期內(nèi)完成通用硬件需要數(shù)千上萬個時鐘周期才能完成的操作;(3)專用硬件和通用硬件內(nèi)都支持流水線并行,硬件利用率高;(4)專用硬件片內(nèi)帶寬高,大部分?jǐn)?shù)據(jù)在片內(nèi)傳輸。顯然,如果不考慮物理現(xiàn)實,不管什么神經(jīng)網(wǎng)絡(luò),不管問題的規(guī)模有多大,都實現(xiàn)一套專用硬件是效率最高的做法。問題是,這行得通嗎?

現(xiàn)實中,不管是通用硬件(如GPU)還是專用硬件(如TPU) 都可以通過高速互聯(lián)技術(shù)連接在一起,通過軟件協(xié)調(diào)多個設(shè)備來完成大規(guī)模計算。使用最先進(jìn)的互聯(lián)技術(shù),設(shè)備和設(shè)備之間傳輸帶寬可以達(dá)到100Gbps或者更多,這比設(shè)備內(nèi)部帶寬低上一兩個數(shù)量級,不過幸好,如果軟件“調(diào)配得當(dāng)”,在這個帶寬條件下也可能使得硬件計算飽和。當(dāng)然,“調(diào)配得當(dāng)”技術(shù)挑戰(zhàn)極大,事實上,單個設(shè)備速度越快,越難把多個設(shè)備“調(diào)配得當(dāng)”。

當(dāng)前深度學(xué)習(xí)普遍采用隨機梯度下降算法(SGD),一般一個GPU處理一小塊兒數(shù)據(jù)只需要100毫秒的時間,那么問題的關(guān)鍵就成了,“調(diào)配”算法能否在100毫秒的時間內(nèi)為GPU處理下一塊數(shù)據(jù)做好準(zhǔn)備,如果可以的話,那么GPU就會一直保持在運算狀態(tài),如果不可以,那么GPU就要間歇性的停頓,意味著設(shè)備利用率降低。理論上是可以的,有個叫運算強度(Arithmetic intensity)的概念,即flops per byte,表示一個字節(jié)的數(shù)據(jù)上發(fā)生的運算量,只要這個運算量足夠大,意味著傳輸一個字節(jié)可以消耗足夠多的計算量,那么即使設(shè)備間傳輸帶寬低于設(shè)備內(nèi)部帶寬,也有可能使得設(shè)備處于滿負(fù)荷狀態(tài)。進(jìn)一步,如果采用比GPU更快的設(shè)備,那么處理一塊兒數(shù)據(jù)的時間就比100毫秒更低,譬如10毫秒,在給定的帶寬條件下,“調(diào)配”算法能用10毫秒的時間為下一次計算做好準(zhǔn)備嗎?事實上,即使是使用不那么快(相對于TPU 等專用芯片)的GPU,當(dāng)前主流的深度學(xué)習(xí)框架在某些場景(譬如模型并行)已經(jīng)力不從心了。

一個通用的深度學(xué)習(xí)軟件框架要能對任何給定的神經(jīng)網(wǎng)絡(luò)和可用資源都能最高效的“調(diào)配”硬件,這需要解決三個核心問題:(1)資源分配,包括計算核心,內(nèi)存,傳輸帶寬三種資源的分配,需要綜合考慮局部性和負(fù)載均衡的問題;(2)生成正確的數(shù)據(jù)路由(相當(dāng)于前文想象的專用硬件之間的連線問題);(3)高效的運行機制,完美協(xié)調(diào)數(shù)據(jù)搬運和計算,硬件利用率最高。

事實上,這三個問題都很挑戰(zhàn),本文暫不討論其解法,假設(shè)我們能夠解決這些問題的話,會有什么好處呢?

假設(shè)我們能解決前述的三個軟件上的難題,那就能“魚與熊掌兼得”:軟件發(fā)揮靈活性,硬件發(fā)揮高效率,任給一個深度學(xué)習(xí)任務(wù),用戶不需要重新連線,就能享受那種“無限大專用硬件”的性能,何其美好。更令人激動的是,當(dāng)這種軟件得以實現(xiàn)時,專用硬件可以比現(xiàn)在所有AI芯片都更簡單更高效。讀者可以先想象一下怎么實現(xiàn)這種美好的前景。

袁進(jìn)輝:分享了深度學(xué)習(xí)框架方面的技術(shù)進(jìn)展

讓我們重申一下幾個觀點:(1)軟件真的非常關(guān)鍵;(2)我們對宏觀層次(設(shè)備和設(shè)備之間)的優(yōu)化更感興趣;(3)深度學(xué)習(xí)框架存在一個理想的實現(xiàn),正如柏拉圖心中那個最圓的圓,當(dāng)然現(xiàn)有的深度學(xué)習(xí)框架還相距甚遠(yuǎn);(4)各行各業(yè)的公司,只要有數(shù)據(jù)驅(qū)動的業(yè)務(wù),最終都需要一個自己的“大腦”,這種“大腦”不應(yīng)該只被少數(shù)巨頭公司獨享。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 硬件
    +關(guān)注

    關(guān)注

    11

    文章

    3444

    瀏覽量

    66986
  • 深度學(xué)習(xí)
    +關(guān)注

    關(guān)注

    73

    文章

    5543

    瀏覽量

    122269
  • cnn
    cnn
    +關(guān)注

    關(guān)注

    3

    文章

    354

    瀏覽量

    22560

原文標(biāo)題:深度學(xué)習(xí)引擎的終極形態(tài)是什么?

文章出處:【微信號:AItists,微信公眾號:人工智能學(xué)家】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關(guān)推薦

    深度學(xué)習(xí)在自然語言處理方面的研究進(jìn)展

    要是關(guān)注深度學(xué)習(xí)在自然語言處理方面的研究進(jìn)展,我相信你一定聽說過Attention Model(后文有時會簡
    的頭像 發(fā)表于 07-19 09:20 ?7657次閱讀
    <b class='flag-5'>深度</b><b class='flag-5'>學(xué)習(xí)</b>在自然語言處理<b class='flag-5'>方面的</b>研究<b class='flag-5'>進(jìn)展</b>

    2017全國深度學(xué)習(xí)技術(shù)應(yīng)用大會

    檢測與分割深度學(xué)習(xí)的發(fā)展及應(yīng)用  報 告 人:季向陽 清華大學(xué)  報告摘要:物體檢測與分割是圖像處理與計算機視覺重要基礎(chǔ)研究方向之一。首先介紹全卷積網(wǎng)絡(luò)在語義分割與實例掩模研究方面的進(jìn)展
    發(fā)表于 03-22 17:16

    Nanopi深度學(xué)習(xí)之路(1)深度學(xué)習(xí)框架分析

    就能實現(xiàn)!還請關(guān)注我后面的日記。實際上我也是剛剛有時間學(xué)習(xí)深度學(xué)習(xí),我是個純初學(xué)者,但面對深度學(xué)習(xí)
    發(fā)表于 06-04 22:32

    深度學(xué)習(xí)在預(yù)測和健康管理中的應(yīng)用

    方法方面的最新進(jìn)展,目的是發(fā)現(xiàn)研究差距并提出進(jìn)一步的改進(jìn)建議。在簡要介紹幾種深度學(xué)習(xí)模型之后,我們回顧并分析
    發(fā)表于 07-12 06:46

    TensorFlow、PyTorch,“后浪”O(jiān)neFlow 有沒有機會

    TensorFlow、PyTorch,“后浪”O(jiān)neFlow 有沒有機會 | 一流科技工程師成誠編者按:7月31日,一流科技在創(chuàng)業(yè)1300天后,他們宣布開源自研的深度學(xué)習(xí)框架OneFlow,此前,CSDN對CEO
    發(fā)表于 07-27 08:24

    小米AI移動端深度學(xué)習(xí)框架MACE開源

    MACE,是指小米公司自研的移動端深度學(xué)習(xí)框架Mobile AI Compute Engine。2017年12月,這一深度學(xué)習(xí)
    的頭像 發(fā)表于 07-26 14:06 ?5221次閱讀

    深度學(xué)習(xí)框架是什么?深度學(xué)習(xí)框架有哪些?

    深度學(xué)習(xí)框架是什么?深度學(xué)習(xí)框架有哪些?? 深度
    的頭像 發(fā)表于 08-17 16:03 ?3192次閱讀

    深度學(xué)習(xí)框架的作用是什么

    深度學(xué)習(xí)框架的作用是什么 深度學(xué)習(xí)是一種計算機技術(shù),它利用人工神經(jīng)網(wǎng)絡(luò)來模擬人類的
    的頭像 發(fā)表于 08-17 16:10 ?1824次閱讀

    深度學(xué)習(xí)框架tensorflow介紹

    深度學(xué)習(xí)框架tensorflow介紹 深度學(xué)習(xí)框架TensorFlow簡介
    的頭像 發(fā)表于 08-17 16:11 ?2770次閱讀

    深度學(xué)習(xí)算法庫框架學(xué)習(xí)

    深度學(xué)習(xí)算法庫框架學(xué)習(xí) 深度學(xué)習(xí)是一種非常強大的機器學(xué)習(xí)
    的頭像 發(fā)表于 08-17 16:11 ?877次閱讀

    深度學(xué)習(xí)框架對照表

    深度學(xué)習(xí)框架對照表? 隨著人工智能技術(shù)的發(fā)展,深度學(xué)習(xí)正在成為當(dāng)今最熱門的研究領(lǐng)域之一。而
    的頭像 發(fā)表于 08-17 16:11 ?960次閱讀

    深度學(xué)習(xí)框架連接技術(shù)

    深度學(xué)習(xí)框架連接技術(shù) 深度學(xué)習(xí)框架是一個能夠幫助機器
    的頭像 發(fā)表于 08-17 16:11 ?933次閱讀

    深度學(xué)習(xí)框架深度學(xué)習(xí)算法教程

    深度學(xué)習(xí)框架深度學(xué)習(xí)算法教程 深度學(xué)習(xí)是機器
    的頭像 發(fā)表于 08-17 16:11 ?1280次閱讀

    基于深度學(xué)習(xí)的語音合成技術(shù)進(jìn)展與未來趨勢

    近年來,深度學(xué)習(xí)技術(shù)在語音合成領(lǐng)域取得了顯著的進(jìn)展?;?b class='flag-5'>深度學(xué)習(xí)的語音合成
    的頭像 發(fā)表于 09-16 14:48 ?1384次閱讀

    TensorFlow與PyTorch深度學(xué)習(xí)框架的比較與選擇

    深度學(xué)習(xí)作為人工智能領(lǐng)域的一個重要分支,在過去十年中取得了顯著的進(jìn)展。在構(gòu)建和訓(xùn)練深度學(xué)習(xí)模型的過程中,
    的頭像 發(fā)表于 07-02 14:04 ?1376次閱讀
    主站蜘蛛池模板: 午夜两性网| 国产小视频在线观看www | 国产日本在线播放 | 日韩a级毛片 | 濑亚美莉vs黑人欧美视频 | 手机看片日韩福利 | 五月婷婷网址 | 欧美性色欧美a在线播放 | 久久精品人人爽人人爽 | 爱草视频 | 午夜免费福利在线 | 99热国内精品 | 天天干夜夜艹 | 欧美又黄又嫩大片a级 | 五月婷丁香| 国产福利你懂的 | 亚洲视频一 | 四虎影永久在线观看精品 | 91国内在线 | 天天综合在线观看 | 在线免费观看视频你懂的 | 无毒在线 | www婷婷| 加勒比一木道|视频在线看 加勒比在线免费视频 | 免费大秀视频在线播放 | 亚洲精品香蕉婷婷在线观看 | 日本不卡在线观看 | 天堂网中文在线最新版 | 国产精品va在线观看不 | 国产三级影院 | 女人被免费网站视频在线 | 高清在线免费观看 | 欧美影院一区二区 | 天天插夜夜操 | 国产伦子一区二区三区四区 | 成人影院在线观看视频 | 人人做人人爽人人爱秋霞影视 | 福利区在线观看 | 日本丝瓜着色视频 | 看黄网站在线 | 插吧插吧综合网 |