教程¶ 训练智能体¶ Gymnasium 最常见的应用是训练强化学习智能体。因此,这些教程旨在展示不同环境的一系列示例实现。 使用表格 Q-学习解决二十一点 使用表格 Q-学习解决二十一点 使用表格 Q-学习解决冰湖 使用表格 Q-学习解决冰湖 使用 REINFORCE 训练 Mujoco 使用 REINFORCE 训练 Mujoco 使用向量环境加速 A2C 训练 使用向量环境加速 A2C 训练 Gymnasium 基础¶ 这些教程旨在展示 Gymnasium 的基本 API,以帮助用户实现它 创建你自己的自定义环境 创建你自己的自定义环境 处理时间限制 处理时间限制 实现自定义包装器 实现自定义包装器 加载自定义四足机器人环境 加载自定义四足机器人环境