資料介紹
描述
這是在使用 32 位浮點(diǎn)精度的微控制器上訓(xùn)練深度學(xué)習(xí)模型的嘗試。我們通過構(gòu)建一個(gè)機(jī)器人來實(shí)現(xiàn)這一點(diǎn),該機(jī)器人學(xué)習(xí)如何使用深度強(qiáng)化學(xué)習(xí)以最小距離跟隨最近的障礙物。訓(xùn)練過程的演示可以在這里找到。
訓(xùn)練過程的演示可以在這里找到。該項(xiàng)目的靈感來自于Pete Warden ( Google TensorFlow)、Neil Tan (ARM) 在微控制器上運(yùn)行神經(jīng)網(wǎng)絡(luò)所做的工作。
介紹
實(shí)時(shí)機(jī)器學(xué)習(xí) (RTML) 是指主動(dòng)解釋和學(xué)習(xí)實(shí)時(shí)到達(dá)的數(shù)據(jù)。它要求代理人根據(jù)先前的知識(shí)解決不熟悉的問題,并經(jīng)常做出實(shí)時(shí)決策。我們在嵌入式系統(tǒng)的開發(fā)和部署環(huán)境中討論 RTML。
目前,地球上活躍著近 150 億個(gè)嵌入式處理器,它們收集并有時(shí)處理大量數(shù)據(jù)。這些數(shù)據(jù)中的大部分都被丟棄了,因?yàn)檫@些微型計(jì)算機(jī)通常不具備在其上運(yùn)行復(fù)雜解釋任務(wù)的硬件功能。出于這個(gè)原因,數(shù)據(jù)通過無線網(wǎng)絡(luò)發(fā)送到功能更強(qiáng)大的中央計(jì)算機(jī)進(jìn)行處理。但是這種形式的基于云的架構(gòu)(其中邊緣設(shè)備僅執(zhí)行數(shù)據(jù)收集)可能由于以下原因而變得不利:
- 發(fā)送數(shù)據(jù)需要邊緣設(shè)備和中央計(jì)算機(jī)之間的通信。這個(gè)過程對處理器來說是非常耗能的,因此只能間歇性地完成
- 由于無線通信協(xié)議的設(shè)計(jì)方式,傳輸數(shù)據(jù)時(shí)的延遲保證權(quán)衡是不可避免的。這可能會(huì)嚴(yán)重延遲從數(shù)據(jù)中采取關(guān)鍵行動(dòng)的時(shí)間。
- 關(guān)于數(shù)據(jù)包從微處理器到達(dá)和被微處理器接收所花費(fèi)的時(shí)間,無線通信協(xié)議也具有不確定的行為,這對于需要關(guān)鍵響應(yīng)的任務(wù)來說也是非常不希望的。
- 這種不確定的通信鏈路要求微處理器幾乎一直處于活動(dòng)狀態(tài),這是空閑功耗的主要來源之一。
這就是深度學(xué)習(xí)的力量所在。深度學(xué)習(xí)算法實(shí)現(xiàn)中最大最密集的操作是矩陣乘法,硬件高效實(shí)現(xiàn)已經(jīng)存在并且完全受算術(shù)限制。即使使用現(xiàn)有技術(shù),微處理器和 DSP 也能夠在不到一毫瓦的情況下處理數(shù)千萬或數(shù)億次計(jì)算,而且更高效的低能耗加速器即將出現(xiàn)。經(jīng)過訓(xùn)練后,這些模型能夠運(yùn)行復(fù)雜的推理任務(wù)并保持對噪聲的穩(wěn)健性,這是實(shí)時(shí)數(shù)據(jù)的典型特征。通過在邊緣設(shè)備中加入深度學(xué)習(xí)功能使邊緣設(shè)備更智能,將解決所有源于數(shù)據(jù)交換的問題,并使其成為從現(xiàn)實(shí)世界數(shù)據(jù)中快速做出重要決策的合適且可靠的候選者。設(shè)備在部署到現(xiàn)場后還可以進(jìn)行持續(xù)改進(jìn)。
以下是深度學(xué)習(xí)框架如何在資源受限的嵌入式系統(tǒng)上開發(fā)和運(yùn)行的一些更廣泛的方法:
- 現(xiàn)有算法的內(nèi)存高效實(shí)現(xiàn)
- 低精度量化訓(xùn)練/推理
- 訓(xùn)練期間的低精度乘法
- 使用修剪和霍夫曼編碼壓縮神經(jīng)網(wǎng)絡(luò)
- 使浮點(diǎn)數(shù)學(xué)對 AI 硬件高效
在本項(xiàng)目中,我們重點(diǎn)介紹第一種方法,并簡要介紹第二種方法。據(jù)我們所知,這將是第一個(gè)開發(fā)用于在具有平臺(tái)獨(dú)立性的嵌入式系統(tǒng)上訓(xùn)練和運(yùn)行推理的深度學(xué)習(xí)庫。
使用深度策略梯度網(wǎng)絡(luò)進(jìn)行強(qiáng)化學(xué)習(xí)
有關(guān)策略梯度網(wǎng)絡(luò)的精彩介紹,請參閱本教程。所有用于矩陣操作和實(shí)施深度學(xué)習(xí)算法的庫都是用 C++ 自定義編寫的。
對于這個(gè)項(xiàng)目,網(wǎng)絡(luò)構(gòu)建如下:
- 輸入層的維度為 1x1。它攜帶超聲波傳感器測量到的最近障礙物的距離。
- 隱藏層的維度為 3x1,具有 RELU 激活。
- 輸出層的維度為 5x1,具有 softmax 激活,對應(yīng)于機(jī)器人可以行進(jìn)的 5 種可能速度。
訓(xùn)練在每一集之后進(jìn)行,其中網(wǎng)絡(luò)對 5 個(gè)動(dòng)作進(jìn)行采樣,執(zhí)行它們并存儲(chǔ)計(jì)算出的獎(jiǎng)勵(lì)。
- 基于強(qiáng)化學(xué)習(xí)的目標(biāo)檢測算法案例 0次下載
- [ESP32]學(xué)習(xí)筆記02
- 使用Matlab進(jìn)行強(qiáng)化學(xué)習(xí)電子版資源下載 0次下載
- 基于強(qiáng)化學(xué)習(xí)的虛擬場景角色乒乓球訓(xùn)練 62次下載
- 基于深度強(qiáng)化學(xué)習(xí)的無人機(jī)控制律設(shè)計(jì)方法 46次下載
- 一種新型的多智能體深度強(qiáng)化學(xué)習(xí)算法 36次下載
- 基于深度強(qiáng)化學(xué)習(xí)仿真集成的壓邊力控制模型 0次下載
- 基于強(qiáng)化學(xué)習(xí)的壯語詞標(biāo)注方法 14次下載
- 基于深度強(qiáng)化學(xué)習(xí)的路口單交叉信號(hào)控制 21次下載
- 模型化深度強(qiáng)化學(xué)習(xí)應(yīng)用研究綜述 9次下載
- 機(jī)器學(xué)習(xí)中的無模型強(qiáng)化學(xué)習(xí)算法及研究綜述 11次下載
- 深度強(qiáng)化學(xué)習(xí)的筆記資料免費(fèi)下載 0次下載
- ESP32教程之如何在Windows系統(tǒng)上搭建開發(fā)環(huán)境 40次下載
- 使用加權(quán)密集連接卷積網(wǎng)絡(luò)的深度強(qiáng)化學(xué)習(xí)方法說明 3次下載
- 如何使用深度強(qiáng)化學(xué)習(xí)進(jìn)行機(jī)械臂視覺抓取控制的優(yōu)化方法概述 22次下載
- 通過強(qiáng)化學(xué)習(xí)策略進(jìn)行特征選擇 387次閱讀
- 基于深度強(qiáng)化學(xué)習(xí)的視覺反饋機(jī)械臂抓取系統(tǒng) 2473次閱讀
- 使用ESP32實(shí)現(xiàn)UDP通信的方法 6519次閱讀
- ESP8266/ESP32自動(dòng)下載原理 4741次閱讀
- 如何在ESP32上使用代碼運(yùn)行TensorFlow模型? 4818次閱讀
- 深度強(qiáng)化學(xué)習(xí)給推薦系統(tǒng)以及CTR預(yù)估工業(yè)界帶來的最新進(jìn)展 8738次閱讀
- 多智體深度強(qiáng)化學(xué)習(xí)研究中首次將概率遞歸推理引入AI的學(xué)習(xí)過程 4925次閱讀
- 對NAS任務(wù)中強(qiáng)化學(xué)習(xí)的效率進(jìn)行深入思考 5086次閱讀
- 量化深度強(qiáng)化學(xué)習(xí)算法的泛化能力 2423次閱讀
- 如何構(gòu)建強(qiáng)化學(xué)習(xí)模型來訓(xùn)練無人車算法 4911次閱讀
- 基于強(qiáng)化學(xué)習(xí)的MADDPG算法原理及實(shí)現(xiàn) 2.1w次閱讀
- 用PopArt進(jìn)行多任務(wù)深度強(qiáng)化學(xué)習(xí) 5699次閱讀
- 強(qiáng)化學(xué)習(xí)環(huán)境研究,智能體玩游戲?yàn)槭裁磪柡?/a> 3644次閱讀
- 什么是強(qiáng)化學(xué)習(xí)?純強(qiáng)化學(xué)習(xí)有意義嗎?強(qiáng)化學(xué)習(xí)有什么的致命缺陷? 1.7w次閱讀
- 斯坦福提出基于目標(biāo)的策略強(qiáng)化學(xué)習(xí)方法——SOORL 5436次閱讀
下載排行
本周
- 1山景DSP芯片AP8248A2數(shù)據(jù)手冊
- 1.06 MB | 532次下載 | 免費(fèi)
- 2RK3399完整板原理圖(支持平板,盒子VR)
- 3.28 MB | 339次下載 | 免費(fèi)
- 3TC358743XBG評(píng)估板參考手冊
- 1.36 MB | 330次下載 | 免費(fèi)
- 4DFM軟件使用教程
- 0.84 MB | 295次下載 | 免費(fèi)
- 5元宇宙深度解析—未來的未來-風(fēng)口還是泡沫
- 6.40 MB | 227次下載 | 免費(fèi)
- 6迪文DGUS開發(fā)指南
- 31.67 MB | 194次下載 | 免費(fèi)
- 7元宇宙底層硬件系列報(bào)告
- 13.42 MB | 182次下載 | 免費(fèi)
- 8FP5207XR-G1中文應(yīng)用手冊
- 1.09 MB | 178次下載 | 免費(fèi)
本月
- 1OrCAD10.5下載OrCAD10.5中文版軟件
- 0.00 MB | 234315次下載 | 免費(fèi)
- 2555集成電路應(yīng)用800例(新編版)
- 0.00 MB | 33566次下載 | 免費(fèi)
- 3接口電路圖大全
- 未知 | 30323次下載 | 免費(fèi)
- 4開關(guān)電源設(shè)計(jì)實(shí)例指南
- 未知 | 21549次下載 | 免費(fèi)
- 5電氣工程師手冊免費(fèi)下載(新編第二版pdf電子書)
- 0.00 MB | 15349次下載 | 免費(fèi)
- 6數(shù)字電路基礎(chǔ)pdf(下載)
- 未知 | 13750次下載 | 免費(fèi)
- 7電子制作實(shí)例集錦 下載
- 未知 | 8113次下載 | 免費(fèi)
- 8《LED驅(qū)動(dòng)電路設(shè)計(jì)》 溫德爾著
- 0.00 MB | 6656次下載 | 免費(fèi)
總榜
- 1matlab軟件下載入口
- 未知 | 935054次下載 | 免費(fèi)
- 2protel99se軟件下載(可英文版轉(zhuǎn)中文版)
- 78.1 MB | 537798次下載 | 免費(fèi)
- 3MATLAB 7.1 下載 (含軟件介紹)
- 未知 | 420027次下載 | 免費(fèi)
- 4OrCAD10.5下載OrCAD10.5中文版軟件
- 0.00 MB | 234315次下載 | 免費(fèi)
- 5Altium DXP2002下載入口
- 未知 | 233046次下載 | 免費(fèi)
- 6電路仿真軟件multisim 10.0免費(fèi)下載
- 340992 | 191187次下載 | 免費(fèi)
- 7十天學(xué)會(huì)AVR單片機(jī)與C語言視頻教程 下載
- 158M | 183279次下載 | 免費(fèi)
- 8proe5.0野火版下載(中文版免費(fèi)下載)
- 未知 | 138040次下載 | 免費(fèi)
評(píng)論