外部环境

第一方环境

Farama 基金会维护着许多其他项目,这些项目使用 Gymnasium API,环境包括:网格世界 (Minigrid)、机器人 (Gymnasium-Robotics)、3D 导航 (Miniworld)、Web 交互 (MiniWoB++)、街机游戏 (Arcade Learning Environment)、Doom (ViZDoom)、元目标机器人 (Metaworld)、自动驾驶 (HighwayEnv)、复古游戏 (stable-retro) 等等。

Farama 基金会还维护着用于 RL 的备用 API,包括:多智能体 RL (PettingZoo)、离线 RL (Minari)、多目标 RL (MO-Gymnasium)、目标 RL (Gymnasium-Robotics)。

带有 Gymnasium 的第三方环境

此页面包含非 Farama 基金会维护的环境,因此,不能保证这些环境能按预期运行。

如果您想贡献一个环境,请在 Discord 上联系我们,然后通过编辑此文件提交 PR,更多说明可以在该文件中找到

自动驾驶环境

自动驾驶汽车和交通管理。

生物 / 医学环境

与生物系统交互。

经济 / 金融环境

所有与经济学相关的内容。

电气 / 能源环境

管理电子的流动。

游戏环境

棋盘游戏、电子游戏和所有其他互动娱乐媒介。

数学 / 计算

减少计算量、证明数学定理等等。

机器人环境

自主机器人。

电信系统环境

交互和/或管理无线和/或有线电信系统。

其他

  • Buffalo-Gym:多臂老虎机 Gymnasium

    Gymnasium version dependency GitHub stars

    Buffalo-Gym 是一个多臂老虎机 (MAB) gymnasium,主要用于辅助调试 RL 实现。MAB 通常很容易推理智能体正在学习的内容以及它是否正确。Buffalo-gym 包含老虎机、上下文老虎机和带有别名的上下文老虎机。

  • CARL:上下文自适应 RL

    Gymnasium version dependency GitHub stars

    流行的强化学习环境的上下文扩展,支持泛化的训练和测试分布,例如,具有可变杆长的 CartPole 或具有不同地面摩擦力的 Brax 机器人。

  • DACBench:动态算法配置的基准

    Gymnasium version dependency GitHub stars

    一个用于 动态算法配置的基准库。它的重点是不同 DAC 方法的可重复性和可比性,以及优化过程的轻松分析。

  • gym-cellular-automata:元胞自动机环境

    Gymnasium version dependency GitHub stars

    智能体通过更改其单元状态与元胞自动机交互的环境。

  • Gym-Gridworlds:可定制的极简网格世界集合

    Gymnasium version dependency GitHub stars

    默认类实现“前往目标”,但它可以轻松自定义以适应不同的任务,具有各种网格、奖励、动力学和任务。它支持不同的观测类型(离散、坐标、二进制、像素、部分)。对于快速测试和原型化 RL 算法(表格和函数逼近)非常有用。

  • matrix-mdp:轻松创建离散 MDP

    Gymnasium version dependency GitHub stars

    一个轻松实现离散 MDP 作为 gym 环境的环境。将一组矩阵(P_0(s)P(s'| s, a)R(s', s, a))转换为表示由这些动力学规则的离散 MDP 的 gym 环境。

  • SimpleGrid:用于 Gymnasium 的简单网格环境

    Gymnasium version dependency GitHub stars

    SimpleGrid 是一个超级简单且极简的 Gymnasium 网格环境。它易于使用和自定义,旨在为快速测试和原型化不同的 RL 算法提供环境。

使用 Gym 的第三方环境

有大量第三方环境使用各种版本的 Gym。其中许多可以适应与 gymnasium 一起使用(请参阅与 Gym 的兼容性),但不保证完全正常运行。

视频游戏环境

机器人环境

自动驾驶环境

其他环境