外部环境

第一方环境

Farama 基金会维护着许多其他项目,这些项目使用 Gymnasium API,环境包括:网格世界 (Minigrid)、机器人 (Gymnasium-Robotics)、3D 导航 (Miniworld)、网页交互 (MiniWoB++)、街机游戏 (Arcade Learning Environment)、Doom (ViZDoom)、元目标机器人 (Metaworld)、自动驾驶 (HighwayEnv)、复古游戏 (stable-retro),等等。

Farama 基金会还维护着 RL 的其他 API,包括:多智能体 RL (PettingZoo)、离线 RL (Minari)、多目标 RL (MO-Gymnasium)、目标 RL (Gymnasium-Robotics).

使用 Gymnasium 的第三方环境

此页面包含未由 Farama 基金会维护的环境,因此不能保证其按预期运行。

如果您想贡献环境,请在Discord 上联系我们,然后通过编辑此文件提交 PR。

自动驾驶环境

自动驾驶汽车和交通管理。

生物/医学环境

与生物系统互动。

经济/金融环境

所有与经济相关的事物。

电气/能源环境

管理电子的流动。

游戏环境

棋盘游戏、电子游戏以及所有其他互动娱乐媒介。

数学/计算

减少计算量,证明数学定理等等。

机器人环境

自动机器人。

电信系统环境

交互和/或管理无线和/或有线电信系统。

其他

  • Buffalo-Gym:多臂老虎机 Gymnasium

    Gymnasium version dependency GitHub stars

    Buffalo-Gym 是一个主要用于帮助调试 RL 实现的多臂老虎机 (MAB) Gymnasium。MAB 通常易于推理代理正在学习什么以及它是否正确。Buffalo-gym 包括老虎机、上下文老虎机以及具有别名的上下文老虎机。

  • CARL:上下文自适应 RL

    Gymnasium version dependency GitHub stars

    流行强化学习环境的上下文扩展,这些扩展允许针对泛化的训练和测试分布,例如,具有可变杆长度的 CartPole 或具有不同地面摩擦的 Brax 机器人。

  • DACBench:动态算法配置基准

    Gymnasium version dependency GitHub stars

    用于 动态算法配置 的基准库。它侧重于不同 DAC 方法的可重复性和可比性,以及优化过程的轻松分析。

  • gym-cellular-automata:元胞自动机环境

    Gymnasium version dependency GitHub stars

    代理通过改变其单元格状态与 *元胞自动机* 交互的环境。

  • Gym-Gridworlds:可定制的极简网格世界的集合

    Gymnasium version dependency GitHub stars

    默认类实现了一个“前往目标”的目标,但它可以轻松地针对不同的任务进行定制,具有各种网格、奖励、动态和任务。它支持不同的观察类型(离散、坐标、二进制、像素、部分)。对于快速测试和原型化 RL 算法(包括表格和函数逼近)非常有用。

  • matrix-mdp:轻松创建离散 MDP

    Gymnasium version dependency GitHub stars

    一个环境,可以轻松地将离散 MDP 实现为 gym 环境。将一组矩阵 (P_0(s), P(s'| s, a)R(s', s, a)) 转换为一个 gym 环境,该环境表示由这些动态规则支配的离散 MDP。

  • SimpleGrid:一个简单的 Gymnasium 网格环境

    Gymnasium version dependency GitHub stars

    SimpleGrid 是一个超级简单且极简的 Gymnasium 网格环境。它易于使用和定制,旨在为快速测试和原型化不同的 RL 算法提供环境。

使用 Gym 的第三方环境

有大量使用各种版本的 Gym 的第三方环境。其中许多可以调整为与 gymnasium 一起使用(参见 与 Gym 的兼容性),但不能保证完全正常工作。

电子游戏环境

机器人环境

自动驾驶环境

其他环境