浅色标志 深色标志 Gymnasium 文档
Farama 基金会标志 Farama 基金会
Contents - Gymnasium 文档 Menu - Gymnasium 文档 Expand - Gymnasium 文档 Light mode - Gymnasium 文档 Dark mode - Gymnasium 文档 Auto light/dark mode - Gymnasium 文档
浅色标志 深色标志 Gymnasium 文档

介绍

  • 基本用法
  • 训练智能体
  • 创建自定义环境
  • 记录智能体
  • 加速训练
  • 与 Gym 的兼容性
  • 迁移指南 - v0.21 到 v1.0.0

API

  • Env
  • 创建和注册
  • 空间
    • 基本空间
    • 复合空间
    • 空间工具
  • 封装器
    • 封装器列表
    • 其他封装器
    • 动作封装器
    • 观测封装器
    • 奖励封装器
  • 向量化
    • 封装器
    • AsyncVectorEnv
    • SyncVectorEnv
    • 实用函数
  • 实用函数
  • 函数式环境

环境

  • 经典控制
    • Acrobot
    • 倒立摆 (Cart Pole)
    • 连续山地车 (Mountain Car Continuous)
    • 山地车 (Mountain Car)
    • 摆 (Pendulum)
  • Box2D
    • 双足行走机器人 (Bipedal Walker)
    • 赛车 (Car Racing)
    • 月球着陆器 (Lunar Lander)
  • 玩具文本
    • 21点 (Blackjack)
    • 出租车 (Taxi)
    • 悬崖行走 (Cliff Walking)
    • 冰湖 (Frozen Lake)
  • MuJoCo
    • 蚂蚁 (Ant)
    • 半猎豹 (Half Cheetah)
    • 跳跃者 (Hopper)
    • 人形机器人 (Humanoid)
    • 人形机器人站立 (Humanoid Standup)
    • 双倒立摆 (Inverted Double Pendulum)
    • 倒立摆 (Inverted Pendulum)
    • 推动者 (Pusher)
    • 抓取者 (Reacher)
    • 游泳者 (Swimmer)
    • 2D 行走机器人 (Walker2D)
  • Atari
  • 外部环境

教程

  • Gymnasium 基础
    • 创建自己的自定义环境
    • 处理时间限制
    • 实现自定义封装器
    • 加载自定义四足机器人环境
  • 训练智能体
    • 使用表格 Q-学习解决21点问题
    • 使用表格 Q-学习解决冰湖问题
    • 使用 REINFORCE 训练 MuJoCo
    • 使用向量环境加速 A2C 训练
  • 第三方教程

开发

  • Github
  • 论文
  • Gymnasium 发布说明
  • Gym 发布说明
  • 贡献文档
返回顶部
编辑此页面

Gymnasium 基础¶

这些教程旨在展示 Gymnasium 的基本 API,以帮助用户实现它

创建自己的自定义环境

创建自己的自定义环境

处理时间限制

处理时间限制

实现自定义封装器

实现自定义封装器

加载自定义四足机器人环境

加载自定义四足机器人环境
下一步
创建自己的自定义环境
上一步
外部环境
版权所有 © 2025 Farama 基金会