資料介紹
描述
強(qiáng)化學(xué)習(xí)是人工智能的一個(gè)分支,計(jì)算機(jī)通過與問題直接交互來了解問題。該項(xiàng)目使用強(qiáng)化學(xué)習(xí)來嘗試學(xué)習(xí)在舊 iPhone 上玩 Doodle Jump 游戲。相機(jī)每秒從 iphone 拍攝 30 張圖像。對這些圖像進(jìn)行分析,然后一個(gè)簡單的機(jī)器人通過旋轉(zhuǎn) iPhone 并按下屏幕上的按鈕來操縱 iPhone。
硬件
該項(xiàng)目的“智能”部分是運(yùn)行機(jī)器人操作系統(tǒng) (ROS) 和 TensorFlow 的 Nvidia Jetson。機(jī)器人包括:
- 用于旋轉(zhuǎn) iPhone 的步進(jìn)電機(jī)。
- 用于按下 iPhone 屏幕上的按鈕的伺服電機(jī)和螺線管。
- Ximea 相機(jī)用于捕捉 iPhone 屏幕的圖片,并通過 USB3 將它們提供給 Jetson。
- EIBot 板驅(qū)動步進(jìn)器和伺服系統(tǒng)。
- 復(fù)古外觀的盒子中還有一個(gè)電源,可為 Jetson 提供 12 伏電壓,為 EIBot 板提供 19 伏電壓,為 USB 集線器提供 5 伏電壓。
- 用于運(yùn)行 Linux 和控制事物的鍵盤、鼠標(biāo)和顯示器。
軟件
ROS 是構(gòu)建此類項(xiàng)目的絕佳方式。使用 ROS,我可以將系統(tǒng)構(gòu)建為一組使用標(biāo)準(zhǔn)消息傳遞系統(tǒng)進(jìn)行通信的獨(dú)立進(jìn)程。該項(xiàng)目包括 C++ 和 Python 進(jìn)程。消息編譯器以兩種語言構(gòu)建存根,因此可以輕松傳遞消息。ROS的主要模塊包括:
- 從相機(jī)接收圖像的相機(jī)驅(qū)動程序。
- 從屏幕上讀取分?jǐn)?shù)的簡單神經(jīng)網(wǎng)絡(luò)。
- 一個(gè)更大的、基于 TensorFlow 的神經(jīng)網(wǎng)絡(luò),用于分析從相機(jī)接收到的圖片。這是通過與機(jī)器人交互訓(xùn)練的網(wǎng)絡(luò)。
- 一個(gè)存檔過程,負(fù)責(zé)將操作和屏幕圖像保存在 sqlite 數(shù)據(jù)庫中以供以后訓(xùn)練使用。
- EIBot 板驅(qū)動程序。
- 屏幕驅(qū)動程序。
強(qiáng)化學(xué)習(xí)
人工智能的強(qiáng)化學(xué)習(xí)分支是最活躍的領(lǐng)域之一。該系統(tǒng)使用一種稱為模仿學(xué)習(xí)的變體。我使用機(jī)器人操縱 iPhone 玩了數(shù)百場 Doodle Jump 游戲。系統(tǒng)存檔圖像和我采取的行動。這些圖像和動作被用作神經(jīng)網(wǎng)絡(luò)的訓(xùn)練集。在系統(tǒng)開始做任何有意義的事情之前,它需要數(shù)千張訓(xùn)練圖像。目前該系統(tǒng)可以玩一個(gè)基本的游戲。它不會瘋狂??地按下按鈕或隨機(jī)搖動屏幕。作為學(xué)習(xí)的一部分,我會盡可能及時(shí)地糾正錯(cuò)誤的決定。這些游戲和修正,以及隨機(jī)選擇的最后 20K 張圖像,在每次運(yùn)行后用作訓(xùn)練。
這個(gè)過程比我預(yù)期的要慢得多。我希望通過采用更復(fù)雜的學(xué)習(xí)模型來改進(jìn)事情,我希望讓系統(tǒng)松散以自行學(xué)習(xí)。
- 使用Matlab進(jìn)行強(qiáng)化學(xué)習(xí)電子版資源下載 0次下載
- 基于強(qiáng)化學(xué)習(xí)的虛擬場景角色乒乓球訓(xùn)練 62次下載
- 基于深度強(qiáng)化學(xué)習(xí)的無人機(jī)控制律設(shè)計(jì)方法 46次下載
- 一種新型的多智能體深度強(qiáng)化學(xué)習(xí)算法 36次下載
- 基于深度強(qiáng)化學(xué)習(xí)仿真集成的壓邊力控制模型 0次下載
- 基于強(qiáng)化學(xué)習(xí)的壯語詞標(biāo)注方法 14次下載
- 虛擬乒乓球手的強(qiáng)化學(xué)習(xí)模仿訓(xùn)練方法 12次下載
- 基于深度強(qiáng)化學(xué)習(xí)的路口單交叉信號控制 21次下載
- 強(qiáng)化學(xué)習(xí)的雙權(quán)重最小二乘Sarsa算法 5次下載
- 模型化深度強(qiáng)化學(xué)習(xí)應(yīng)用研究綜述 9次下載
- 機(jī)器學(xué)習(xí)中的無模型強(qiáng)化學(xué)習(xí)算法及研究綜述 11次下載
- 一種基于多智能體協(xié)同強(qiáng)化學(xué)習(xí)的多目標(biāo)追蹤方法 20次下載
- 人工智能到底是什么?什么工作需要學(xué)習(xí)人工智能 17次下載
- 人工智能深度學(xué)習(xí)處理架構(gòu)的演進(jìn)GPU功耗和延遲問題如何解決 28次下載
- 強(qiáng)化學(xué)習(xí)在RoboCup帶球任務(wù)中的應(yīng)用劉飛 0次下載
- 通過強(qiáng)化學(xué)習(xí)策略進(jìn)行特征選擇 387次閱讀
- 機(jī)器學(xué)習(xí)是如何工作的? 人工智能與機(jī)器學(xué)習(xí)實(shí)例 2081次閱讀
- 懶惰強(qiáng)化學(xué)習(xí)算法在發(fā)電調(diào)控REG框架的應(yīng)用 936次閱讀
- 如何避開人工智能的陷阱 1254次閱讀
- 對NAS任務(wù)中強(qiáng)化學(xué)習(xí)的效率進(jìn)行深入思考 5086次閱讀
- 量化深度強(qiáng)化學(xué)習(xí)算法的泛化能力 2423次閱讀
- 如何構(gòu)建強(qiáng)化學(xué)習(xí)模型來訓(xùn)練無人車算法 4911次閱讀
- 基于強(qiáng)化學(xué)習(xí)的MADDPG算法原理及實(shí)現(xiàn) 2.1w次閱讀
- 用PopArt進(jìn)行多任務(wù)深度強(qiáng)化學(xué)習(xí) 5699次閱讀
- 強(qiáng)化學(xué)習(xí)環(huán)境研究,智能體玩游戲?yàn)槭裁磪柡?/a> 3644次閱讀
- 什么是強(qiáng)化學(xué)習(xí)?純強(qiáng)化學(xué)習(xí)有意義嗎?強(qiáng)化學(xué)習(xí)有什么的致命缺陷? 1.7w次閱讀
- 探討機(jī)器學(xué)習(xí)、強(qiáng)化學(xué)習(xí)、NLP、計(jì)算機(jī)視覺最新進(jìn)展 5624次閱讀
- 人工智能強(qiáng)化學(xué)習(xí)的原理和目標(biāo) 4948次閱讀
- 5個(gè)頂級的人工智能開源工具 6240次閱讀
- 利用強(qiáng)化學(xué)習(xí)探索多巴胺對學(xué)習(xí)的作用 4750次閱讀
下載排行
本周
- 1涂鴉各WiFi模塊原理圖加PCB封裝
- 11.75 MB | 76次下載 | 1 積分
- 2錦銳科技CA51F2 SDK開發(fā)包
- 24.06 MB | 29次下載 | 1 積分
- 3錦銳CA51F005 SDK開發(fā)包
- 19.47 MB | 3次下載 | 1 積分
- 4蘋果iphone 11電路原理圖
- 4.98 MB | 3次下載 | 2 積分
- 5基礎(chǔ)模擬電子電路
- 3.80 MB | 3次下載 | 1 積分
- 6RA-Eco-RA6M4-100PIN-V1.0開發(fā)板資料
- 34.89 MB | 1次下載 | 免費(fèi)
- 7STM32F3系列、STM32F4系列、STM32L4系列和STM32L4+系列Cortex-M4編程手冊
- 3.32 MB | 1次下載 | 免費(fèi)
- 8聯(lián)想A820t手機(jī)維修圖紙包括主板原理圖 尾板原理圖 點(diǎn)位圖
- 0.62 MB | 次下載 | 5 積分
本月
- 1AI智能眼鏡產(chǎn)業(yè)鏈分析
- 4.43 MB | 383次下載 | 免費(fèi)
- 2蘇泊爾電磁爐線路的電路原理圖資料合集
- 2.02 MB | 296次下載 | 5 積分
- 3貼片三極管上的印字與真實(shí)名稱的對照表詳細(xì)說明
- 0.50 MB | 94次下載 | 1 積分
- 4長虹液晶電視R-HS310B-5HF01的電源板電路原理圖
- 0.46 MB | 91次下載 | 5 積分
- 5涂鴉各WiFi模塊原理圖加PCB封裝
- 11.75 MB | 76次下載 | 1 積分
- 6錦銳科技CA51F2 SDK開發(fā)包
- 24.06 MB | 29次下載 | 1 積分
- 7AO4803A雙P通道增強(qiáng)型場效應(yīng)晶體管的數(shù)據(jù)手冊
- 0.11 MB | 28次下載 | 2 積分
- 8長虹液晶彩電LS29機(jī)芯的技術(shù)資料說明
- 3.42 MB | 16次下載 | 2 積分
總榜
- 1matlab軟件下載入口
- 未知 | 935127次下載 | 10 積分
- 2開源硬件-PMP21529.1-4 開關(guān)降壓/升壓雙向直流/直流轉(zhuǎn)換器 PCB layout 設(shè)計(jì)
- 1.48MB | 420064次下載 | 10 積分
- 3Altium DXP2002下載入口
- 未知 | 233089次下載 | 10 積分
- 4電路仿真軟件multisim 10.0免費(fèi)下載
- 340992 | 191388次下載 | 10 積分
- 5十天學(xué)會AVR單片機(jī)與C語言視頻教程 下載
- 158M | 183342次下載 | 10 積分
- 6labview8.5下載
- 未知 | 81588次下載 | 10 積分
- 7Keil工具M(jìn)DK-Arm免費(fèi)下載
- 0.02 MB | 73815次下載 | 10 積分
- 8LabVIEW 8.6下載
- 未知 | 65988次下載 | 10 積分
評論