训练智能体¶ Gymnasium 最常见的应用是训练强化学习(RL)智能体。因此,这些教程旨在展示不同环境的各种示例实现。 使用表格 Q 学习解决 21 点 使用表格 Q 学习解决 21 点 使用表格 Q 学习解决冰湖问题 使用表格 Q 学习解决冰湖问题 使用 REINFORCE 训练 MuJoCo 使用 REINFORCE 训练 MuJoCo 使用向量环境加速 A2C 训练 使用向量环境加速 A2C 训练