標簽　>　強化學習

強化學習

+關(guān)注4人關(guān)注

文章：225個瀏覽：11603次帖子：1個

全部技術(shù) 資訊資料帖子視頻產(chǎn)品方案企業(yè)

強化學習技術(shù)

智能體的連接問題,如何創(chuàng)建能符合人類目標的智能體？

長期來看，我們會擴大獎勵建模的規(guī)模，將其應(yīng)用于人類難以評估的領(lǐng)域。為了做到這一點，我們需要增強用戶衡量輸出的能力。我們討論了如何循環(huán)應(yīng)用獎勵建模：我們可...

2018-11-24 標簽：機器學習智能體強化學習 3668 0

伯克利人工智能實驗室?guī)砹艘豁椥碌臋C器人科研成果

作者們提出的方法讓機器人有能力學習如何把不同的物體當作工具以完成用戶給定的任務(wù)（第一行圖中用黃色箭頭標出）。任務(wù)中并沒有指定機器人必須使用給定的工具，但...

2019-04-15 標簽：機器人視覺強化學習 3660 0

有了OpenAI Five，它已經(jīng)可以在比賽中擊敗業(yè)余玩家

如果一個AI能在像星際、Dota這樣復雜的游戲里超越人類水平，那它就是一個里程碑。相較于AI之前在國際象棋和圍棋里取得的成就，游戲能更好地捕捉現(xiàn)實世界中...

2018-06-29 標簽：神經(jīng)網(wǎng)絡(luò)AI 強化學習 3649 0

神經(jīng)科學為人工智能發(fā)展提供進一步助力

人工智能從神經(jīng)科學領(lǐng)域吸收了大量養(yǎng)分，并由此催生了深度學習和強化學習等智能處理方法。

2019-02-19 標簽：人工智能強化學習 3615 0

OpenAI舉辦的首屆遷移學習競賽Retro Contest結(jié)束

Dharmaraja（法王）是一個6人組成的團隊：Qing Da、Jing-Cheng Shi、Anxiang Zeng、Guangda Huzhang...

2018-06-26 標簽：阿里巴巴機器學習強化學習 3532 0

AI智能體學習如何跑步、躲避跨越障礙物

在深度強化學習中，智能體是由神經(jīng)網(wǎng)絡(luò)表示的。神經(jīng)網(wǎng)絡(luò)直接與環(huán)境相互作用。它觀察環(huán)境的當前狀態(tài)，并根據(jù)當前狀態(tài)和過去的經(jīng)驗決定采取何種行動（例如向左、向右...

2018-10-22 標簽：智能體強化學習 3529 0

OpenAI提出了一種回報設(shè)置方法RND

在開發(fā)RND之前，OpenAI的研究人員和加州大學伯克利分校的學者進行了合作，他們測試了在沒有環(huán)境特定回報的情況下，智能體的學習情況。因為從理論上來說，...

2018-11-05 標簽：機器學習智能體強化學習 3517 0

如何測試強化學習智能體適應(yīng)性

強化學習（RL）能通過獎勵或懲罰使智能體實現(xiàn)目標，并將它們學習到的經(jīng)驗轉(zhuǎn)移到新環(huán)境中。

2018-12-24 標簽：人工智能強化學習 3473 0

單v100 GPU，4小時搜索到一個魯棒的網(wǎng)絡(luò)結(jié)構(gòu)

這個采用了搜索robust neural cell來替代搜索整個網(wǎng)絡(luò)。如下圖，不同的操作（操作用箭頭表示）會計算出不同的中間結(jié)果（中間結(jié)果用cycle表...

2019-07-27 標簽：神經(jīng)網(wǎng)絡(luò)gpu 強化學習 3357 0

空間簡史-人類認識空間的旅程與其對強化學習的啟示

首先，什么是空間？最早探討它的是物理學，從亞里士多德到牛頓。牛頓的物理學在絕對空間基礎(chǔ)上存在，所謂絕對空間，可以簡化為一個歐式直角坐標系， ...

2019-04-05 標簽：函數(shù)強化學習 3210 0

綜述將主要總結(jié)增強學習的錄用論文

一年一度的國際機器學習會議( ICML )，于7月15日在瑞典斯德哥爾摩閉幕，ICML 的會議日程之緊湊，會議內(nèi)容之豐富，令人目不暇接。

2018-07-31 標簽：網(wǎng)絡(luò)架構(gòu)強化學習 3104 0

更好的理解TensorFlow 2.0的新特性

雖然很多基礎(chǔ)的RL理論是在表格案例中開發(fā)的，但現(xiàn)代RL幾乎完全是用函數(shù)逼近器完成的，例如人工神經(jīng)網(wǎng)絡(luò)。具體來說，如果策略和值函數(shù)用深度神經(jīng)網(wǎng)絡(luò)近似，則...

2019-01-23 標簽：智能體強化學習 tensorflow 3091 0

深度強化學習大神Pieter Abbeel發(fā)表深度強化學習的加速方法

首先將多個 CPU核心與單個GPU 相關(guān)聯(lián)。多個模擬器在CPU內(nèi)核上以并行進程運行，并且這些進程以同步方式執(zhí)行環(huán)境步驟。在每個步驟中，將所有單獨的觀...

2019-02-13 標簽：gpu 模擬器強化學習 3026 0

使用新的機器學習技術(shù), 通過減少治療膠質(zhì)母細胞瘤過程中毒性化療和放療的劑量

然而，研究人員還必須確保該模型不僅僅為了最大療效而給出最大的劑量。任何時候模型選擇給予全部劑量時，它就會受到懲罰，因此它會選擇更少、更小的劑量。 “如果...

2018-08-24 標簽：模型機器學習強化學習 2805 0

在強化學習的表示空間中引入規(guī)劃能力的思路

在涉及計算路徑的每一個步驟（不管是在r-空間還是在s-空間），我們都可以使用范圍廣泛的技術(shù)，包括基于優(yōu)化的技術(shù)（TrajOpt），基于搜索的技術(shù)（RRT...

2018-09-06 標簽：神經(jīng)網(wǎng)絡(luò)機器翻譯強化學習 2798 0

AI智能體的能力還會繼續(xù)提高嗎？

奪旗原本是一項廣受歡迎的戶外運動，被廣泛的應(yīng)用于電子游戲中。在一張給定的地圖中，紅藍雙方保護自己的旗子并搶奪對方旗子，5分鐘時間內(nèi)，奪旗次數(shù)最多的隊伍獲...

2019-06-02 標簽：AI 智能體強化學習 2797 0

我們能否讓機器人以同觀察和實踐學會使用工具？

我們的設(shè)計使機器人明白如何使用不同的物體作為工具來實現(xiàn)指定的任務(wù)（根據(jù)黃色箭頭標記）。機器人在執(zhí)行任務(wù)期間自行決定是否使用已提供的工具。

2019-04-29 標簽：機器人數(shù)據(jù)集強化學習 2754 0

研究人員們提出了一種新的導航工具SafeRoute

另外，策略網(wǎng)絡(luò)表示強化學習智能體使用的隨機策略，用πθ(s, a) = p(a|s;θ)表示，其中θ是神經(jīng)網(wǎng)絡(luò)的參數(shù)列表，會用Adam優(yōu)化器進行更新。系...

2018-11-24 標簽：神經(jīng)網(wǎng)絡(luò)智能體強化學習 2679 0

在AI技術(shù)的幫助下，讓滑翔機學會這項非凡的本事

在我們可以真正使用AI控制的熱氣流滑翔機進行實際應(yīng)用之前，還有很多工作要做。這只是鳥類輔助自身飛行的氣流中的一種。換句話說：僅僅因為AI可以駕馭熱氣流，...

2018-10-04 標簽：AI 機器學習強化學習 2512 0

幫你們破除RL的神秘感，理清各算法發(fā)展的脈絡(luò)

因為篇幅所限，簡單介紹一下V(s)與Q(s,a)。它們是Value Function Approximation算法中兩個重要概念，著名的Deep Q-...

2019-01-14 標簽：算法強化學習 2247 0

相關(guān)話題

換一批

IOT

IOT

+關(guān)注

IoT是Internet of Things的縮寫，字面翻譯是“物體組成的因特網(wǎng)”，準確的翻譯應(yīng)該為“物聯(lián)網(wǎng)”。物聯(lián)網(wǎng)（Internet of Things）又稱傳感網(wǎng)，簡要講就是互聯(lián)網(wǎng)從人向物的延伸。
海思

海思

+關(guān)注
STM32F103C8T6

STM32F103C8T6

+關(guān)注

STM32F103C8T6是一款集成電路，芯體尺寸為32位，程序存儲器容量是64KB，需要電壓2V~3.6V，工作溫度為-40°C ~ 85°C。
數(shù)字隔離

數(shù)字隔離

+關(guān)注

數(shù)字隔離技術(shù)常用于工業(yè)網(wǎng)絡(luò)環(huán)境的現(xiàn)場總線、軍用電子系統(tǒng)和航空航天電子設(shè)備中，尤其是一些應(yīng)用環(huán)境比較惡劣的場合。數(shù)字隔離電路主要用于數(shù)字信號和開關(guān)量信號的傳輸。另一個重要原因是保護器件（或人）免受高電壓的危害。本文詳細介紹了數(shù)字隔離器工作原理及特點，選型及應(yīng)用，各類數(shù)字隔離器件性能比較等內(nèi)容。
硬件工程師

硬件工程師

+關(guān)注

硬件工程師Hardware Engineer職位要求熟悉計算機市場行情；制定計算機組裝計劃；能夠選購組裝需要的硬件設(shè)備，并能合理配置、安裝計算機和外圍設(shè)備；安裝和配置計算機軟件系統(tǒng)；保養(yǎng)硬件和外圍設(shè)備；清晰描述出現(xiàn)的計算機軟硬件故障。
wifi模塊

wifi模塊

+關(guān)注

Wi-Fi模塊又名串口Wi-Fi模塊，屬于物聯(lián)網(wǎng)傳輸層，功能是將串口或TTL電平轉(zhuǎn)為符合Wi-Fi無線網(wǎng)絡(luò)通信標準的嵌入式模塊，內(nèi)置無線網(wǎng)絡(luò)協(xié)議IEEE802.11b.g.n協(xié)議棧以及TCP/IP協(xié)議棧。傳統(tǒng)的硬件設(shè)備嵌入Wi-Fi模塊可以直接利用Wi-Fi聯(lián)入互聯(lián)網(wǎng)，是實現(xiàn)無線智能家居、M2M等物聯(lián)網(wǎng)應(yīng)用的重要組成部分。
MPU6050

MPU6050

+關(guān)注

MPU-6000（6050）為全球首例整合性6軸運動處理組件，相較于多組件方案，免除了組合陀螺儀與加速器時間軸之差的問題，減少了大量的封裝空間。
74ls74

74ls74

+關(guān)注

74LS74是雙D觸發(fā)器。功能多，可作雙穩(wěn)態(tài)、寄存器、移位寄存器、振蕩器、單穩(wěn)態(tài)、分頻計數(shù)器等功能。本章詳細介紹了74ls112的功能及原理，74ls74引腳圖及功能表，74ls112的應(yīng)用等內(nèi)容。
Protues

Protues

+關(guān)注

Proteus軟件是英國Lab Center Electronics公司出版的EDA工具軟件（該軟件中國總代理為廣州風標電子技術(shù)有限公司）。它不僅具有其它EDA工具軟件的仿真功能，還能仿真單片機及外圍器件。
STC12C5A60S2

STC12C5A60S2

+關(guān)注

在眾多的51系列單片機中，要算國內(nèi)STC 公司的1T增強系列更具有競爭力，因他不但和8051指令、管腳完全兼容，而且其片內(nèi)的具有大容量程序存儲器且是FLASH工藝的，如STC12C5A60S2單片機內(nèi)部就自帶高達60K FLASHROM，這種工藝的存儲器用戶可以用電的方式瞬間擦除、改寫。
UHD

UHD

+關(guān)注

UHD是”超高清“的意思UHD的應(yīng)用在電視機技術(shù)上最為普遍，目前已有不少廠商推出了UHD超高清電視。
循跡小車

循跡小車

+關(guān)注

做單片機的工程師相比都堆循跡小車有所認識，它是自動引導機器人系統(tǒng)的基本應(yīng)用，那么今天小編就給大家介紹下自動自動循跡小車的原理，智能循跡小車的應(yīng)用，智能循跡小車程序，循跡小車用途等知識吧！
LM2596

LM2596

+關(guān)注

LM2596是降壓型電源管理單片集成電路的開關(guān)電壓調(diào)節(jié)器，能夠輸出3A的驅(qū)動電流，同時具有很好的線性和負載調(diào)節(jié)特性。固定輸出版本有3.3V、5V、12V，可調(diào)版本可以輸出小于37V的各種電壓。
光模塊

光模塊

+關(guān)注

光模塊(optical module)由光電子器件、功能電路和光接口等組成，光電子器件包括發(fā)射和接收兩部分。簡單的說，光模塊的作用就是光電轉(zhuǎn)換，發(fā)送端把電信號轉(zhuǎn)換成光信號，通過光纖傳送后，接收端再把光信號轉(zhuǎn)換成電信號。
光立方

光立方

+關(guān)注

光立方是由四千多棵光藝高科技“發(fā)光樹”組成的，在2009年10月1日天安門廣場舉行的國慶聯(lián)歡晚會上面世。這是新中國成立六十周年國慶晚會最具創(chuàng)意的三大法寶之首。
K60

K60

+關(guān)注
STM32單片機

STM32單片機

+關(guān)注

STM32系列基于專為要求高性能、低成本、低功耗的嵌入式應(yīng)用專門設(shè)計的ARM Cortex-M3內(nèi)核
Nexperia

Nexperia

+關(guān)注

Nexperia是大批量生產(chǎn)基本半導體的領(lǐng)先專家，這些半導體是世界上每個電子設(shè)計都需要的組件。該公司廣泛的產(chǎn)品組合包括二極管、雙極晶體管、ESD 保護器件、MOSFET、GaN FET 以及模擬和邏輯IC。
步進驅(qū)動器

步進驅(qū)動器

+關(guān)注

步進驅(qū)動器是一種將電脈沖轉(zhuǎn)化為角位移的執(zhí)行機構(gòu)。當步進驅(qū)動器接收到一個脈沖信號，它就驅(qū)動步進電機按設(shè)定的方向轉(zhuǎn)動一個固定的角度（稱為“步距角”），它的旋轉(zhuǎn)是以固定的角度一步一步運行的。可以通過控制脈沖個數(shù)來控制角位移量，從而達到準確定位的目的；同時可以通過控制脈沖頻率來控制電機轉(zhuǎn)動的速度和加速度，從而達到調(diào)速和定位的目的。
CD4046

CD4046

+關(guān)注

cD4046是通用的CMOS鎖相環(huán)集成電路，其特點是電源電壓范圍寬（為3V－18V），輸入阻抗高（約100MΩ），動態(tài)功耗小，在中心頻率f0為10kHz下功耗僅為600μW，屬微功耗器件。本章主要介紹內(nèi)容有，CD4046的功能 cd4046鎖相環(huán)電路，CD4046無線發(fā)射，cd4046運用，cd4046鎖相環(huán)電路圖。
COMSOL

COMSOL

+關(guān)注

COMSOL集團是全球多物理場建模解決方案的提倡者與領(lǐng)導者。憑借創(chuàng)新的團隊、協(xié)作的文化、前沿的技術(shù)、出色的產(chǎn)品，這家高科技工程軟件公司正飛速發(fā)展，并有望成為行業(yè)領(lǐng)袖。其旗艦產(chǎn)品COMSOL Multiphysics 使工程師和科學家們可以通過模擬，賦予設(shè)計理念以生命。
加速度傳感器

加速度傳感器

+關(guān)注

加速度傳感器是一種能夠測量加速度的傳感器。通常由質(zhì)量塊、阻尼器、彈性元件、敏感元件和適調(diào)電路等部分組成。
聯(lián)網(wǎng)技術(shù)

聯(lián)網(wǎng)技術(shù)

+關(guān)注
服務(wù)機器人

服務(wù)機器人

+關(guān)注

服務(wù)機器人是機器人家族中的一個年輕成員，到目前為止尚沒有一個嚴格的定義。不同國家對服務(wù)機器人的認識不同。
四軸飛行器

四軸飛行器

+關(guān)注

四軸飛行器，又稱四旋翼飛行器、四旋翼直升機，簡稱四軸、四旋翼。這四軸飛行器（Quadrotor）是一種多旋翼飛行器。四軸飛行器的四個螺旋槳都是電機直連的簡單機構(gòu)，十字形的布局允許飛行器通過改變電機轉(zhuǎn)速獲得旋轉(zhuǎn)機身的力，從而調(diào)整自身姿態(tài)。具體的技術(shù)細節(jié)在“基本運動原理”中講述。
基站測試

基站測試

+關(guān)注

802.11ac與11基站測試（base station tests）在基站設(shè)備安裝完畢后，對基站設(shè)備電氣性能所進行的測量。n的區(qū)別，802.11n無線網(wǎng)卡驅(qū)動，802.11n怎么安裝。
SDK

SDK

+關(guān)注

　　SDK一般指軟件開發(fā)工具包，軟件開發(fā)工具包一般都是一些軟件工程師為特定的軟件包、軟件框架、硬件平臺、操作系統(tǒng)等建立應(yīng)用軟件時的開發(fā)工具的集合。軟件開發(fā)工具廣義上指輔助開發(fā)某一類軟件的相關(guān)文檔、范例和工具的集合。
TMS320F28335

TMS320F28335

+關(guān)注

TMS320F28335是一款TI高性能TMS320C28x系列32位浮點DSP處理器
靜電防護

靜電防護

+關(guān)注

為防止靜電積累所引起的人身電擊、火災(zāi)和爆炸、電子器件失效和損壞，以及對生產(chǎn)的不良影響而采取的防范措施。其防范原則主要是抑制靜電的產(chǎn)生，加速靜電泄漏，進行靜電中和等。
ESP8266

ESP8266

+關(guān)注

wifi模塊ESP8266的默認波特率是115200，但是單片機不能達到那么快的傳輸速率，只能使用4800bps，那么設(shè)置的時候，必不可少的要先用轉(zhuǎn)串口調(diào)試下載器。

換一批

電機控制	DSP	氮化鎵	功率放大器	ChatGPT	自動駕駛	TI	瑞薩電子
BLDC	PLC	碳化硅	二極管	OpenAI	元宇宙	安森美	ADI
無刷電機	FOC	IGBT	逆變器	文心一言	5G	英飛凌	羅姆
直流電機	PID	MOSFET	傳感器	人工智能	物聯(lián)網(wǎng)	NXP	賽靈思
步進電機	SPWM	充電樁	IPM	機器視覺	無人機	三菱電機	ST
伺服電機	SVPWM	光伏發(fā)電	UPS	AR	智能電網(wǎng)	國民技術(shù)	Microchip

瑞薩	沁恒股份	全志	國民技術(shù)	瑞芯微	兆易創(chuàng)新	芯海科技	Altium
德州儀器	Vishay	Micron	Skyworks	AMS	TAIYOYUDEN	納芯微	HARTING
adi	Cypress	Littelfuse	Avago	FTDI	Cirrus LogIC	Intersil	Qualcomm
st	Murata	Panasonic	Altera	Bourns	矽力杰	Samtec	揚興科技
microchip	TDK	Rohm	Silicon Labs	圣邦微電子	安費諾工業(yè)	ixys	Isocom Compo
安森美	DIODES	Nidec	Intel	EPSON	樂鑫	Realtek	ERNI電子
TE Connectivity	Toshiba	OMRON	Sensirion	Broadcom	Semtech	旺宏	英飛凌
Nexperia	Lattice	KEMET	順絡(luò)電子	霍尼韋爾	pulse	ISSI	NXP
Xilinx	廣瀨電機	金升陽	君耀電子	聚洵	Liteon	新潔能	Maxim
MPS	億光	Exar	菲尼克斯	CUI	WIZnet	Molex	Yageo
Samsung	風華高科	WINBOND	長晶科技	晶導微電子	上海貝嶺	KOA	Echelon
Coilcraft	LRC	trinamic

放大器	運算放大器	差動放大器	電流感應(yīng)放大器	比較器	儀表放大器	可變增益放大器	隔離放大器
時鐘	時鐘振蕩器	時鐘發(fā)生器	時鐘緩沖器	定時器	寄存器	實時時鐘	PWM 調(diào)制器
視頻放大器	功率放大器	頻率轉(zhuǎn)換器	揚聲器放大器	音頻轉(zhuǎn)換器	音頻開關(guān)	音頻接口	音頻編解碼器
模數(shù)轉(zhuǎn)換器	數(shù)模轉(zhuǎn)換器	數(shù)字電位器	觸摸屏控制器	AFE	ADC	DAC	電源管理
線性穩(wěn)壓器	LDO	開關(guān)穩(wěn)壓器	DC/DC	降壓轉(zhuǎn)換器	電源模塊	MOSFET	IGBT
振蕩器	諧振器	濾波器	電容器	電感器	電阻器	二極管	晶體管
變送器	傳感器	解析器	編碼器	陀螺儀	加速計	溫度傳感器	壓力傳感器
電機驅(qū)動器	步進驅(qū)動器	TWS	BLDC	無刷直流驅(qū)動器	濕度傳感器	光學傳感器	圖像傳感器
數(shù)字隔離器	ESD 保護	收發(fā)器	橋接器	多路復用器	氮化鎵	PFC	數(shù)字電源

開關(guān)電源	步進電機	無線充電	LabVIEW	EMC	PLC	OLED	單片機
5G	m2m	DSP	MCU	ASIC	CPU	ROM	DRAM
NB-IoT	LoRa	Zigbee	NFC	藍牙	RFID	Wi-Fi	SIGFOX
Type-C	USB	以太網(wǎng)	仿真器	RISC	RAM	寄存器	GPU
語音識別	萬用表	CPLD	耦合	電路仿真	電容濾波	保護電路	看門狗
CAN	CSI	DSI	DVI	Ethernet	HDMI	I2C	RS-485
SDI	nas	DMA	HomeKit	閾值電壓	UART	機器學習	TensorFlow

Arduino	BeagleBone	樹莓派	STM32	MSP430	EFM32	ARM mbed	EDA
示波器	LPC	imx8	PSoC	Altium Designer	Allegro	Mentor	Pads
OrCAD	Cadence	AutoCAD	華秋DFM	Keil	MATLAB	MPLAB	Quartus

91在线观看视频-91在线观看视频-91在线观看免费视频-91在线观看免费-欧美第二页-欧美第1页

搜索歷史

強化學習

強化學習技術(shù)

相關(guān)標簽

相關(guān)話題

關(guān)注此標簽的用戶(4人)

C++	Java	Python	JavaScript	node.js	RISC-V	verilog	Tensorflow
Android	iOS	linux	RTOS	FreeRTOS	LiteOS	RT-THread	uCOS
DuerOS	Brillo	Windows11	HarmonyOS

林超文PCB設(shè)計：PADS教程，PADS視頻教程	鄭振宇老師：Altium Designer教程，Altium Designer視頻教程
張飛實戰(zhàn)電子視頻教程	朱有鵬老師：海思HI3518e教程，HI3518e視頻教程
李增老師：信號完整性教程，高速電路仿真教程	華為鴻蒙系統(tǒng)教程，HarmonyOS視頻教程
賽盛：EMC設(shè)計教程，EMC視頻教程	杜洋老師：STM32教程，STM32視頻教程
唐佐林：c語言基礎(chǔ)教程，c語言基礎(chǔ)視頻教程	張飛：BUCK電源教程，BUCK電源視頻教程
正點原子：FPGA教程，F(xiàn)PGA視頻教程	韋東山老師：嵌入式教程，嵌入式視頻教程
張先鳳老師：C語言基礎(chǔ)視頻教程	許孝剛老師：Modbus通訊視頻教程
王振濤老師：NB-IoT開發(fā)視頻教程	Mill老師：FPGA教程，Zynq視頻教程
C語言視頻教程	RK3566芯片資料合集
朱有鵬老師：U-Boot源碼分析視頻教程	開源硬件專題