Rl 任务种类

阅读量:

一个任务(task)是 RL 问题的一个实例。共有两种任务类型:回合制(episodic)和连续型(continuing)。

WHY

WHAT

回合制(episodic):有明确的起始点和中止点(中止状态)。

连续型(continuing):没有中止点(中止状态),需要在选择最优动作的同时与环境进行互动。

RL 任务种类_figure_1.png

HOW

实例

  1. 回合制:闯关类游戏中,完成一个关卡或者失败;
  2. 连续型:自动化股票交易,持续运行知道人为停止。

HOW GOOD

ref.

#待整理笔记

反向链接

到头儿啦~

局部关系图