2021年AI領域的你最應該學的是什么

進入到2021年，AI領域的你最應該學的是什么？我覺得是強化學習。

為什么這么說？首先要知道什么是強化學習。強化學習是機器學習的一種，是一種行為學習模型。由算法提供數據分析反饋，引導用戶逐步獲取最佳結果。主要解決在 Markov Decision Process(MDP) 中優化長期reward的期望的問題。強化學習也是現在非常熱門的方向，在近幾年的所有頂級計算機會議中，強化學習都有明顯的增長趨勢。比如在ICML 2020 熱門話題引用量最高的論文就是強化學習！

同時在12月30剛結束的首屆谷歌足球Kaggle競賽中，使用了深度強化學習的騰訊AI足球隊—絕悟(WeKick)，也以顯著優勢奪得冠軍！

不僅如此，工業界中，已經有很多將強化學習應用于推薦系統的研究，也有一些自動駕駛公司在嘗試使用強化學習的技術。在學術界中，除了強化學習本身關注的問題以外，也有一些NLP的問題可以利用強化學習來解決。學習強化學習，想要發表論文和落地應用，就一定要理解并掌強化學習領域的經典Paper，才能梳理出主要的知識框架。

責任編輯：xj

原文標題：10 篇論文攻克深度強化學習底層原理，推薦一個論文復現的好方向！

文章出處：【微信公眾號：深度學習自然語言處理】歡迎添加關注！文章轉載請注明出處。

聲明：本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人，不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用，如有內容侵權或者其他違規問題，請聯系本站處理。舉報投訴

AI

AI

+關注

關注
88

文章
34691

瀏覽量
276691
深度學習

深度學習

+關注

關注
73

文章
5557

瀏覽量
122622
強化學習

強化學習

+關注

關注
4

文章
269

瀏覽量
11544

原文標題：10 篇論文攻克深度強化學習底層原理，推薦一個論文復現的好方向！

文章出處：【微信號：zenRRan，微信公眾號：深度學習自然語言處理】歡迎添加關注！文章轉載請注明出處。

深度學習自然語言處理
專欄

0 文章 0 閱讀 0 粉絲 0 點贊

關注個人主頁

Hot 一個給NLP領域帶來革新的預訓練語言大模型Bert
Hot 推薦一些翻譯英文文獻比較準確的軟件

New 高效大模型的推理綜述
New 什么是RAG，RAG學習和實踐經驗

精選推薦
更多

文章

資料

帖子

泰克科技測試方案：借助WBG-DPT軟件的新型軟件消偏方法加速雙脈沖測試

泰克科技
12小時前

259 閱讀

體硅FinFET和SOI FinFET的差異

中科院半導體所
13小時前

296 閱讀

米爾STM32MP25系列產品榮獲“2024‘物聯之星’創新產品獎”

jf_36690210
15小時前

479 閱讀

PCB疊層設計避坑指南

華秋DFM
22小時前

403 閱讀

Allegro Skill布線功能之刪除Dangling介紹

凡億PCB
20小時前

369 閱讀

思科路由器指南

吳湛
6.56 MB

5積分

30下載

Advances in Material Technology Enable Game-Changing MLCC Performance

0.32 MB

免費

18下載

LuatOS實時操作系統

賈飛小
86.13 MB

2積分

1下載

W3A SOC Web日志審計與網絡監控

李輝
42.03 MB

2積分

1下載

oat++輕量級高性能Web服務開發框架

李歡
0.65 MB

2積分

2下載

【Banana Pi BPI-RV2開發板試用體驗】開發環境搭建

jf_1137202360
1天前

290 閱讀

矽速 Sipeed MaixCAM Pro 開發板資料+答疑貼

ElecFans小喇叭
1天前

333 閱讀

【RA4L1-SENSOR】2、段碼屏顯示和ADC檢測

EPTmachine
5天前

474 閱讀

STM32f103,直接操作寄存器，實現IIC的發送

jf_04610069
1天前

472 閱讀

【BPI-CanMV-K230D-Zero開發板體驗】香蕉派 K230D 視覺開發板開箱+CamMV 環境搭建

gtbestom
2天前

424 閱讀

推薦專欄
更多

企業產品

資料

方案
更多

在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

搜索歷史

2021年AI領域的你最應該學的是什么

評論