Toy Text¶

Toy Text 环境被设计得极其简单，具有小的离散状态和动作空间，因此易于学习。因此，它们适用于调试强化学习算法的实现。

环境可通过每个环境文档中指定的参数进行配置。