強化學習同一個學習率的圖一樣嗎

【強化學習同一個學習率的圖一樣嗎】

強化學習同一個學習率的圖一樣嗎

文章插圖
強化學習同一個學習率的圖不一樣 。監督學習要求訓練集和測試集數據分布越相近越好,但是包含的數據不一樣,不能把分類任務中的一張圖片,同時放到訓練集和測試集中,因為實際情況中可能出現訓練集不包含的圖片,這時要保證監督學習算法具有一定的泛化能力,能夠在沒見過這張圖片的情況下,對其正確處理 。強化學習的目的是優化馬爾科夫決策過程中的智能體的策略,每次學習是專門針對一個任務進行的 。因此,不能讓強化學習優化好一個走迷宮的任務,然后拿學習好的策略去干其他事,哪怕是讓訓練好的智能體走一個布局稍有變化的迷宮,效果也會下降 。

    推薦閱讀