在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

您好,歡迎來電子發燒友網! ,新用戶?[免費注冊]

您的位置:電子發燒友網>源碼下載>數值算法/人工智能>

一種解決連續問題的真實在線自然梯度行動者-評論家算法

大小:0.85 MB 人氣: 2017-12-19 需要積分:0

  策略梯度作為一種能有效解決連續空間決策問題的方法被廣泛研究.然而,由于在策略估計過程中存在較大的方差,因此基于策略梯度的方法往往受到樣本利用率低、收斂速度幔等限制.針對該問題。提出了真實在線增量式自然梯度行動者一評論家算法(TOINAC).TOINAC算法采用優于傳統梯度的自然梯度,在真實在線時間差分(TOTD)算法的基礎上。提出了一種新型的向前觀點,改進了自然梯度行動者一評論家算法.在評論家部分,利用TOTD算法高效性的特點來估計值函數:在行動者部分。引入一種新的向前觀點來估計自然梯度。再利用資格跡將自然梯度估計變為在線估計。提高了自然梯度估計的準確性和算法的效率.將TOINAC算法與核方法以及正態策略分布結合,解決連續空間問題.最后。在平衡桿、Mountain Car、以及Acrobot等連續問題上進行了仿真實驗。驗證算法的有效性.

一種解決連續問題的真實在線自然梯度行動者-評論家算法

非常好我支持^.^

(0) 0%

不好我反對

(0) 0%

一種解決連續問題的真實在線自然梯度行動者-評論家算法下載

相關電子資料下載

      發表評論

      用戶評論
      評價:好評中評差評

      發表評論,獲取積分! 請遵守相關規定!

      ?
      主站蜘蛛池模板: 国产精品久久久久久久免费大片 | 手机福利视频 | 免费在线观看污视频 | h网站在线观看 | 天堂中文在线观看 | 午夜精品影院 | 中文天堂资源在线www | www.丁香.com | 美女很黄很黄是免费的·无遮挡网站 | 中文字幕在线一区二区在线 | 国产一区二区丁香婷婷 | 综合激情婷婷 | 四虎comwww最新地址 | 三级成人网 | 国产精品理论 | 欧美精品1 | 一区二区三区在线看 | 天天射天天爱天天干 | 天天射日日操 | 久久久久久久久综合影视网 | 美女无遮挡拍拍拍免费视频 | 伊人网综合在线视频 | 亚洲黄色一区二区 | 日本一区二区免费在线观看 | 欧美人与zoxxxx | 亚洲伊人99综合网 | 色秀视频免费高清网站 | 香蕉视频啪啪 | 一级片视频在线观看 | 女人双腿搬开让男人桶 | 国产美女视频爽爽爽 | 午夜影视网站 | 成 人 免 费 黄 色 | 在线观看国产精美视频 | 国产毛片一区二区三区精品 | 性欧美极品 | 欧美专区一区二区三区 | 99久久精品费精品国产 | 操www| 色99色| 天天操好逼|