强化学习同一个学习率的图一样吗
【强化学习同一个学习率的图一样吗】强化学习同一个学习率的图不一样 。监督学习要求训练集和测试集数据分布越相近越好,但是包含的数据不一样,不能把分类任务中的一张图片,同时放到训练集和测试集中,因为实际情况中可能出现训练集不包含的图片,这时要保证监督学习算法具有一定的泛化能力,能够在没见过这张图片的情况下 , 对其正确处理 。强化学习的目的是优化马尔科夫决策过程中的智能体的策略,每次学习是专门针对一个任务进行的 。因此 , 不能让强化学习优化好一个走迷宫的任务,然后拿学习好的策略去干其他事 , 哪怕是让训练好的智能体走一个布局稍有变化的迷宫 , 效果也会下降 。
推荐阅读
- 为什么有些人学习会先慢后快
- 为什么人能长时间玩游戏不感觉累却少有人能长时间学习看书
- 铬强化的主要方法
- 为什么在同一个城市房价的差别那么大
- 为什么学习击剑的人很少
- 民主学习型是什么意思
- 20节私教课可以学习几支舞蹈
- 学习通头像采集可以看到前置吗
- 学习进入厌倦期在心理学上叫什么
- 为什么没有机器学习大牛进入金融行业