人工智能(AI)和機(jī)器學(xué)習(xí)(ML)日新月異,在游戲、人類對(duì)話、社交媒體甚至燃油泵方面產(chǎn)生的變化備受關(guān)注。如果您回顧一下并站在開發(fā)者的角度觀察AI的話,可以看到這一過(guò)程中有外因,也有內(nèi)因,并且外因和內(nèi)因也在迅速變化當(dāng)中:
???? 外因:ML兩大組成部分——訓(xùn)練和推理,直到最近才被安排到云端。移動(dòng)處理器的計(jì)算能力在逐步提升,為邊緣設(shè)備(如智能手機(jī)和無(wú)人機(jī))運(yùn)行推理工作負(fù)載(而非在云端運(yùn)行)打下基礎(chǔ)。
???? 內(nèi)因:如今,應(yīng)用程序是否引人注目取決于用戶體驗(yàn)。在對(duì)自拍進(jìn)行美顏處理既有吸引力又有樂(lè)趣,但是,在云端執(zhí)行這項(xiàng)工作會(huì)造成延遲,從而破壞美好的體驗(yàn)。如果您不在設(shè)備端運(yùn)行分類和跟蹤之類的工作負(fù)載,那么造成的不愉快體驗(yàn)會(huì)讓客戶最終離您而去。
???? ?“推手”:移動(dòng)處理器(CPU、GPU和DSP)每個(gè)核心都有自己的電源/性能配置文件。作為開發(fā)者,您可以在邊緣設(shè)備(如智能手機(jī))上選擇最有效運(yùn)行工作負(fù)載的時(shí)間和方式。
也正是因?yàn)槿绱耍琎ualcomm Technologies,Inc.(QTI)才推出了Qualcomm? 驍龍?神經(jīng)處理引擎(NPE)SDK。該SDK已經(jīng)以限定版本發(fā)布了數(shù)月,現(xiàn)在更是通過(guò)Qualcomm開發(fā)者網(wǎng)絡(luò)提供給更廣泛的開發(fā)者社區(qū)。該SDK旨在加速驍龍?jiān)O(shè)備神經(jīng)網(wǎng)絡(luò)處理,方便開發(fā)者根據(jù)特定的用戶體驗(yàn)選擇最佳核心:Qualcomm Kryo? CPU、Qualcomm Adreno? GPU或Qualcomm Hexagon? DSP。
具有更高性能和更低功耗的AI
在任何邊緣設(shè)備上,AI都是性能和功耗平衡的棘手環(huán)節(jié)。
比方說(shuō),您已經(jīng)在云端訓(xùn)練了神經(jīng)網(wǎng)絡(luò)模型。下一步是編寫移動(dòng)應(yīng)用,利用模型運(yùn)行推理,識(shí)別面部、跟蹤對(duì)象、檢測(cè)聲音、理解語(yǔ)言,甚至將貓?zhí)砑拥阶耘闹小D溃绻谠贫诉\(yùn)行這一切的話,造成的延遲會(huì)徹底毀了用戶體驗(yàn),因此,您編寫應(yīng)用在設(shè)備CPU上運(yùn)行推理工作負(fù)載。但是很快您就會(huì)認(rèn)識(shí)到,這樣做的結(jié)果是,不但耗電量大,而且性能平平。
?“我想不妨嘗試一下其它核心而不是CPU,”您對(duì)自己說(shuō)。
好主意。Snapdragon處理器上的CPU、GPU和DSP以不同的方式處理工作負(fù)載。比如,為獲得最佳功耗/性能特性,語(yǔ)音檢測(cè)應(yīng)用最好在Hexagon DSP上運(yùn)行,而對(duì)象檢測(cè)或樣式傳輸應(yīng)用更適合運(yùn)行在Adreno GPU上。
我們?cè)O(shè)計(jì)NPE SDK就是為了能夠讓您評(píng)估各核心執(zhí)行模型的效率。然后,決定在哪里運(yùn)行應(yīng)用。
改善在Caffe / Caffe2和TensorFlow中訓(xùn)練的神經(jīng)網(wǎng)絡(luò)模型
QTI專注于兩個(gè)開源深度學(xué)習(xí)框架:分別由Facebook和Google開發(fā)和發(fā)起的Caffe/Caffe2和TensorFlow。另外,如果您擁有Caffe或TensorFlow不支持的專有或自定義網(wǎng)絡(luò)層,可以利用NPE SDK靈活添加。
推理工作負(fù)載卸載到正確的核心會(huì)帶來(lái)哪些好處呢?我們?cè)谏逃檬謾C(jī)上的測(cè)試顯示,Adreno? GPU的性能和能效提升了4-5倍,而使用向量擴(kuò)展(HVX)的Hexagon DSP也提升了2倍。
開發(fā)者已經(jīng)在使用NPE,充分發(fā)揮驍龍的性能,提升移動(dòng)應(yīng)用體驗(yàn)。例如,F(xiàn)acebook在其開發(fā)者大會(huì)F8上宣布,將NPE整合到Facebook應(yīng)用的相機(jī)功能中,加速實(shí)現(xiàn)Caffe2支持的AR特性,在拍攝照片和直播視頻時(shí),實(shí)現(xiàn)更流暢、無(wú)縫且逼真的AR特性應(yīng)用。
接下來(lái)
NPE SDK包括運(yùn)行時(shí)軟件、庫(kù)、API、離線模型轉(zhuǎn)換工具、示例代碼、文檔、調(diào)試和基準(zhǔn)測(cè)試工具。目前,NPE SDK兼容驍820, 835, 625, 626, 650, 652, 653 和 660(Android)和驍龍 625和626(Linux)。
如果您擁有訓(xùn)練神經(jīng)網(wǎng)絡(luò)模型的資源和專有技術(shù),并且希望搭載驍龍的移動(dòng)設(shè)備或邊緣設(shè)備獲得最佳性能和功耗,那么NPE SDK就是最佳選擇。您不需要了解異構(gòu)計(jì)算或成為ML專家,但如果您擁有數(shù)據(jù)、分析和深度神經(jīng)網(wǎng)絡(luò)訓(xùn)練的經(jīng)驗(yàn),會(huì)讓您受益良多。
關(guān)注我和Qualcomm AI團(tuán)隊(duì)發(fā)布的文章,了解有關(guān)NPE SDK的更多詳細(xì)信息:
???? 使用NPE SDK的知名應(yīng)用
???? 入門方法
???? 改善性能和功耗的技巧
同時(shí),現(xiàn)在就訪問(wèn)我們的驍龍神經(jīng)處理引擎頁(yè)面,下載SDK。
您還可以注冊(cè)參加我們于2017年8月1日上午9點(diǎn)舉辦的驍龍和邊緣AI網(wǎng)絡(luò)研討會(huì),了解為什么QTI認(rèn)為移動(dòng)設(shè)備是實(shí)現(xiàn)設(shè)備端人工智能體驗(yàn)的理想平臺(tái)。
更多Qualcomm開發(fā)內(nèi)容請(qǐng)?jiān)斠姡篞ualcomm開發(fā)者社區(qū)。
評(píng)論
查看更多