Rl 任务种类
阅读量:
一个任务(task)是 RL 问题的一个实例。共有两种任务类型:回合制(episodic)和连续型(continuing)。
WHY
WHAT
回合制(episodic):有明确的起始点和中止点(中止状态)。
连续型(continuing):没有中止点(中止状态),需要在选择最优动作的同时与环境进行互动。
HOW
实例
- 回合制:闯关类游戏中,完成一个关卡或者失败;
- 连续型:自动化股票交易,持续运行知道人为停止。
HOW GOOD
ref.
#待整理笔记
反向链接
到头儿啦~