浅色 Logo 深色 Logo Gymnasium 文档
Farama 基金会 logo Farama 基金会
Contents - Gymnasium 文档 Menu - Gymnasium 文档 Expand - Gymnasium 文档 Light mode - Gymnasium 文档 Dark mode - Gymnasium 文档 Auto light/dark mode - Gymnasium 文档
浅色 Logo 深色 Logo Gymnasium 文档

简介

  • 基本用法
  • 训练智能体
  • 创建自定义环境
  • 录制智能体
  • 加速训练
  • 与 Gym 的兼容性
  • 迁移指南 - v0.21 到 v1.0.0

API

  • Env (环境)
  • 创建和注册
  • Spaces (空间)
    • 基本 Spaces (空间)
    • 复合 Spaces (空间)
    • Spaces (空间) 工具
  • Wrappers (封装器)
    • Wrappers (封装器) 列表
    • 杂项 Wrappers (封装器)
    • 动作 Wrappers (封装器)
    • 观测 Wrappers (封装器)
    • 奖励 Wrappers (封装器)
  • Vectorize (向量化)
    • Wrappers (封装器)
    • AsyncVectorEnv (异步向量环境)
    • SyncVectorEnv (同步向量环境)
    • 实用函数
  • 实用函数
  • Functional Env (函数式环境)

Environments (环境)

  • Classic Control (经典控制)
    • Acrobot (平衡杆)
    • Cart Pole (倒立摆)
    • Mountain Car Continuous (连续型 Mountain Car)
    • Mountain Car (Mountain Car)
    • Pendulum (钟摆)
  • Box2D
    • Bipedal Walker (双足步行者)
    • Car Racing (赛车)
    • Lunar Lander (登月器)
  • Toy Text (玩具文本)
    • Blackjack (二十一点)
    • Taxi (出租车)
    • Cliff Walking (悬崖漫步)
    • Frozen Lake (冰冻湖面)
  • MuJoCo
    • Ant (蚂蚁)
    • Half Cheetah (半人马)
    • Hopper (跳跃者)
    • Humanoid (人形)
    • Humanoid Standup (人形站立)
    • Inverted Double Pendulum (倒立双摆)
    • Inverted Pendulum (倒立摆)
    • Pusher (推杆)
    • Reacher (机械臂)
    • Swimmer (游泳者)
    • Walker2D (二维步行者)
  • Atari (雅达利)
  • External Environments (外部环境)

Tutorials (教程)

  • Gymnasium 基础文档链接
    • 加载自定义四足机器人环境
    • 处理时间限制
    • 实现自定义 Wrappers (封装器)
    • 创建你自己的自定义环境
    • 使用向量环境和领域随机化训练 A2C
  • Gymnasium 文档中训练智能体链接
    • 使用 REINFORCE 训练 Mujoco
    • 用 Q-Learning 解决 Blackjack (二十一点)
    • Frozenlake 基准测试
  • 第三方教程

开发

  • Github
  • 论文
  • Gymnasium 发行说明
  • Gym 发行说明
  • 为文档做贡献
返回顶部
编辑此页

Gymnasium 基础文档链接¶

加载自定义四足机器人环境链接: https://gymnasium.org.cn/tutorials/gymnasium_basics/load_quadruped_model/

实现自定义 Wrappers (封装器) 链接: https://gymnasium.org.cn/tutorials/gymnasium_basics/implementing_custom_wrappers/

创建你自己的自定义环境(environment_creation.py): https://gymnasium.org.cn/tutorials/gymnasium_basics/environment_creation/

处理时间限制: https://gymnasium.org.cn/tutorials/gymnasium_basics/handling_time_limits/

使用向量环境和领域随机化训练 A2C: https://gymnasium.org.cn/tutorials/gymnasium_basics/vector_envs_tutorial/

处理时间限制

处理时间限制

实现自定义 Wrappers (封装器)

实现自定义 Wrappers (封装器)

创建你自己的自定义环境

创建你自己的自定义环境

使用向量环境和领域随机化训练 A2C

使用向量环境和领域随机化训练 A2C
下一个
加载自定义四足机器人环境
上一个
外部环境
版权所有 © 2025 Farama Foundation
在此页上
  • Gymnasium 基础文档链接