Rl exploration and exploitation 探索和利用

阅读量:

探索(exploration)是通过随机行动对环境进行探索,以获取更多信息;利用(exploitation)是通过利用已知信息来最大化奖励。

WHY

平衡 Agent 探索新信息和利用已知信息的程度。

WHAT

RL 探索和利用的平衡_figure_1.png

HOW

利用(exploitation):选择已知的好的行动,但存在错失更好的行动的风险;

探索(exploration):选择未知的行动,可能会是一个坏行动,也可能是一个新的好行动。

实例

HOW GOOD

ref.

#待整理笔记

反向链接

到头儿啦~

局部关系图