教程

训练智能体

Gymnasium 最常见的应用是训练强化学习智能体。因此,这些教程旨在展示不同环境的一系列示例实现。

使用表格 Q-学习解决二十一点

使用表格 Q-学习解决二十一点

使用表格 Q-学习解决冰湖

使用表格 Q-学习解决冰湖

使用 REINFORCE 训练 Mujoco

使用 REINFORCE 训练 Mujoco

使用向量环境加速 A2C 训练

使用向量环境加速 A2C 训练

Gymnasium 基础

这些教程旨在展示 Gymnasium 的基本 API,以帮助用户实现它

创建你自己的自定义环境

创建你自己的自定义环境

处理时间限制

处理时间限制

实现自定义包装器

实现自定义包装器

加载自定义四足机器人环境

加载自定义四足机器人环境