【強化學習同一個學習率的圖一樣嗎】

文章插圖
強化學習同一個學習率的圖不一樣 。監督學習要求訓練集和測試集數據分布越相近越好,但是包含的數據不一樣,不能把分類任務中的一張圖片,同時放到訓練集和測試集中,因為實際情況中可能出現訓練集不包含的圖片,這時要保證監督學習算法具有一定的泛化能力,能夠在沒見過這張圖片的情況下,對其正確處理 。強化學習的目的是優化馬爾科夫決策過程中的智能體的策略,每次學習是專門針對一個任務進行的 。因此,不能讓強化學習優化好一個走迷宮的任務,然后拿學習好的策略去干其他事,哪怕是讓訓練好的智能體走一個布局稍有變化的迷宮,效果也會下降 。
推薦閱讀
- 關于學習方面的諺語有哪些
- dnf紅字裝備怎么強化
- 為什么要學習中國傳統文化
- 完美世界手游精靈怎么學習技能
- dnf強化多少級會碎
- 學習通怎么注冊賬號
- 魔獸世界懷舊服如何學習武器技能
- 學長笛的方法 學習長笛的方法你都知道嗎?
- 項鏈吊墜怎么系繩子
- 青年大學習怎么進入
