在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

您好,歡迎來電子發(fā)燒友網(wǎng)! ,新用戶?[免費(fèi)注冊]

您的位置:電子發(fā)燒友網(wǎng)>源碼下載>數(shù)值算法/人工智能>

深度學(xué)習(xí)優(yōu)化技術(shù)實踐應(yīng)用分析

大小:0.4 MB 人氣: 2017-09-30 需要積分:1

  自2012年Deep Learning的代表模型AlexNet在ImageNet大賽中力壓亞軍,以超過10個百分點的絕對優(yōu)勢奪得頭籌之后,依托于建模技術(shù)的進(jìn)步、硬件計算能力的提升、優(yōu)化技術(shù)的進(jìn)步以及海量數(shù)據(jù)的累積,Deep Learning在語音、圖像以及文本等多個領(lǐng)域不斷推進(jìn),相較于傳統(tǒng)作法取得了顯著的效果提升。工業(yè)界和學(xué)術(shù)界也先后推出了用于Deep Learning建模用途的開源工具和框架,包括Caffe、Theano、Torch、MXNet、TensorFlow、Chainer、CNTK等等。其中MXNet、TensorFlow以及CNTK均對于訓(xùn)練過程提供了多機(jī)分布式支持,在相當(dāng)大程度上解放了DL建模同學(xué)的生產(chǎn)力。但是,DL領(lǐng)域的建模技術(shù)突飛猛進(jìn),模型復(fù)雜度也不斷增加。從模型的深度來看,以圖像識別領(lǐng)域為例,12年的經(jīng)典模型AlexNet由5個卷積層,3個全連接層構(gòu)成(圖1),在當(dāng)時看來已經(jīng)算是比較深的復(fù)雜模型,而到了15年, 微軟亞洲研究院則推出了由151個卷積層構(gòu)成的極深網(wǎng)絡(luò)ResNet(圖2);從模型的尺寸來看,在機(jī)器翻譯領(lǐng)域,即便是僅僅由單層雙向encoder,單層decoder構(gòu)成的NMT模型(圖3),在阿里巴巴的一個內(nèi)部訓(xùn)練場景下,模型尺寸也達(dá)到了3GB左右的規(guī)模。從模型的計算量來看,上面提到的機(jī)器翻譯模型在單塊M40 NVIDIA GPU上,完成一次完整訓(xùn)練,也需要耗時近三周。

  Deep Learning通過設(shè)計復(fù)雜模型,依托于海量數(shù)據(jù)的表征能力,從而獲取相較于經(jīng)典shallow模型更優(yōu)的模型表現(xiàn)的建模策略對于底層訓(xùn)練工具提出了更高的要求。現(xiàn)有的開源工具,往往會在性能上、顯存支持上、生態(tài)系統(tǒng)的完善性上存在不同層面的不足,在使用效率上對于普通的算法建模用戶并不夠友好。阿里云推出的PAI(Platform of Artificial Intelligence)[18]產(chǎn)品則致力于通過系統(tǒng)與算法協(xié)同優(yōu)化的方式,來有效解決Deep Learning訓(xùn)練工具的使用效率問題,目前PAI集成了TensorFlow、Caffe、MXNet這三款流行的Deep Learning框架,并針對這幾款框架做了定制化的性能優(yōu)化支持,以求更好的解決用戶建模的效率問題。

  這些優(yōu)化目前都已經(jīng)應(yīng)用在阿里巴巴內(nèi)部的諸多業(yè)務(wù)場景里,包括黃圖識別、OCR識別、機(jī)器翻譯、智能問答等,這些業(yè)務(wù)場景下的某些建模場景會涉及到幾十億條規(guī)模的訓(xùn)練樣本,數(shù)GB的模型尺寸,均可以在我們的優(yōu)化策略下很好地得到支持和滿足。經(jīng)過內(nèi)部大規(guī)模數(shù)據(jù)及模型場景的檢測之后,我們也期望將這些能力輸出,更好地賦能給阿里外部的AI從業(yè)人員。

  深度學(xué)習(xí)優(yōu)化技術(shù)實踐應(yīng)用分析

  圖1. AlexNet模型示例

  深度學(xué)習(xí)優(yōu)化技術(shù)實踐應(yīng)用分析

  圖2. 36層的ResNet模型示例

  深度學(xué)習(xí)優(yōu)化技術(shù)實踐應(yīng)用分析

  圖3. NMT模型架構(gòu)示例

  接下來,本文會扼要介紹一下在PAI里實現(xiàn)的大規(guī)模深度學(xué)習(xí)的優(yōu)化策略。

  2.大規(guī)模深度學(xué)習(xí)優(yōu)化策略在PAI中實踐應(yīng)用

  大規(guī)模深度學(xué)習(xí)作為一個交叉領(lǐng)域,涉及到分布式計算、操作系統(tǒng)、計算機(jī)體系結(jié)構(gòu)、數(shù)值優(yōu)化、機(jī)器學(xué)習(xí)建模、編譯器技術(shù)等多個領(lǐng)域。按照優(yōu)化的側(cè)重點,可以將優(yōu)化策略劃分為如下幾種:

  I. 計算優(yōu)化

  II. 顯存優(yōu)化

  III. 通信優(yōu)化

  IV. 性能預(yù)估模型

  V 軟硬件協(xié)同優(yōu)化

  PAI平臺目前主要集中在顯存優(yōu)化、通信優(yōu)化、性能預(yù)估模型、軟硬件協(xié)同優(yōu)化這四個優(yōu)化方向。

  1)。 顯存優(yōu)化

  內(nèi)存優(yōu)化主要關(guān)心的是GPU顯存優(yōu)化的議題,在Deep Learning訓(xùn)練場景,其計算任務(wù)的特點(大量的滿足SIMD特性的矩陣浮點運(yùn)算執(zhí)行序列,控制邏輯通常比較簡單)決定了通常我們會選擇GPU來作為計算設(shè)備,而GPU作為典型的高通量異構(gòu)計算設(shè)備,其硬件設(shè)計約束決定了其顯存資源往往是比較稀缺的,目前在PAI平臺上提供的中檔M40顯卡的顯存只有12GB,而復(fù)雜度較高的模型則很容易達(dá)到M40顯存的臨界值,比如151層的ResNet、阿里巴巴內(nèi)部用于中文OCR識別的一款序列模型以及機(jī)器翻譯模型。從建模同學(xué)的角度來看,顯存并不應(yīng)該是他們關(guān)心的話題,PAI在顯存優(yōu)化上做了一系列工作,期望能夠解放建模同學(xué)的負(fù)擔(dān),讓建模同學(xué)在模型尺寸上獲得更廣闊的建模探索空間。在內(nèi)存優(yōu)化方面, 通過引入task-specific的顯存分配器以及自動化模型分片框架支持,在很大程度上緩解了建模任務(wù)在顯存消耗方面的約束。其中自動化模型分片框架會根據(jù)具體的模型網(wǎng)絡(luò)特點,預(yù)估出其顯存消耗量,然后對模型進(jìn)行自動化切片,實現(xiàn)模型并行的支持,在完成自動化模型分片的同時,我們的框架還會考慮到模型分片帶來的通信開銷,通過啟發(fā)式的方法在大模型的承載能力和計算效率之間獲得較優(yōu)的trade-off。

  2)。 通信優(yōu)化

  大規(guī)模深度學(xué)習(xí),或者說大規(guī)模機(jī)器學(xué)習(xí)領(lǐng)域里一個永恒的話題就是如何通過多機(jī)分布式對訓(xùn)練任務(wù)進(jìn)行加速。而機(jī)器學(xué)習(xí)訓(xùn)練任務(wù)的多遍迭代式通信的特點,使得經(jīng)典的map-reduce式的并行數(shù)據(jù)處理方式并不適合這個場景。對于以單步小批量樣本作為訓(xùn)練單位步的深度學(xué)習(xí)訓(xùn)練任務(wù),這個問題就更突出了。

  依據(jù)Amdahl’s law[19],一個計算任務(wù)性能改善的程度取決于可以被改進(jìn)的部分在整個任務(wù)執(zhí)行時間中所占比例的大小。而深度學(xué)習(xí)訓(xùn)練任務(wù)的多機(jī)分布式往往會引入額外的通信開銷,使得系統(tǒng)內(nèi)可被提速的比例縮小,相應(yīng)地束縛了分布式所能帶來的性能加速的收益 。

  在PAI里,我們通過pipeline communication、late-multiply、hybrid-parallelism以及heuristic-based model average等多種優(yōu)化策略對分布式訓(xùn)練過程中的通信開銷進(jìn)行了不同程度的優(yōu)化,并在公開及in-house模型上取得了比較顯著的收斂加速比提升。

  在Pipeline communication(圖4)里,通過將待通信數(shù)據(jù)(模型及梯度)切分成一個個小的數(shù)據(jù)塊并在多個計算結(jié)點之間充分流動起來,可以突破單機(jī)網(wǎng)卡的通信帶寬極限,將一定尺度內(nèi)將通信開銷控制在常量時間復(fù)雜度。

非常好我支持^.^

(0) 0%

不好我反對

(0) 0%

      發(fā)表評論

      用戶評論
      評價:好評中評差評

      發(fā)表評論,獲取積分! 請遵守相關(guān)規(guī)定!

      ?
      主站蜘蛛池模板: 69国产成人精品午夜福中文 | 欧美xxxx性特级高清 | 欧美高清另类 | 久久久久青草 | 精品成人网 | 欧美性黑人十极品hd | 午夜免费视频 | 国产成人啪午夜精品网站 | 国产免费一区二区三区香蕉精 | 欧美色a电影精品aaaa | 在线网站你懂 | 91精品久久久久含羞草 | 日本在线观看永久免费网站 | 美女扒开尿口给男人看的让 | 特黄特a级特别特级特毛片 特黄特色大片免费播放路01 | 激情文学亚洲色图 | 日本丝瓜着色视频 | 色婷婷久久久swag精品 | 手机看片国产免费久久网 | 四虎最新入口 | 亚州视频一区二区 | 啪啪网站色大全免费 | 久久久久久久综合狠狠综合 | 亚洲小便 | 午夜视频免费看 | 免费看欧美一级特黄a大片 免费看欧美一级特黄a大片一 | 轻点灬大ji巴太粗太长了h | 午夜噜噜噜私人影院在线播放 | 免费日韩毛片 | 妖精视频永久在线入口 | 午夜色综合 | 日韩欧美国产电影 | 激情深爱| 日本xxxx69hd| 欧美成人午夜 | 黄色成人在线 | 日本一区二区三区免费看 | 亚洲欧美精品一区二区 | 亚洲人成网站色在线观看 | 国产成人精品曰本亚洲77美色 | 777欧美午夜精品影院 |