外部环境

第一方环境

Farama 基金会维护着许多其他项目,它们使用 Gymnasium API,环境包括:网格世界 (Minigrid)、机器人 (Gymnasium-Robotics)、3D 导航 (Miniworld)、网页交互 (MiniWoB++)、街机游戏 (Arcade Learning Environment)、Doom (ViZDoom)、元目标机器人 (Metaworld)、自动驾驶 (HighwayEnv)、复古游戏 (stable-retro) 等等。

Farama 基金会还维护着 RL 的替代 API,包括:多智能体 RL (PettingZoo)、离线 RL (Minari)、多目标 RL (MO-Gymnasium)、目标 RL (Gymnasium-Robotics)。

使用 Gymnasium 的第三方环境

此页面包含非 Farama 基金会维护的环境,因此无法保证其功能按预期运行。

如果您想贡献一个环境,请通过 Discord 联系我们,然后通过编辑此文件提交一个 PR,更多说明可以在该文件中找到。

自动驾驶环境

自动驾驶车辆和交通管理。

生物 / 医疗环境

与生物系统交互。

经济 / 金融环境

所有与经济学相关的内容。

电气 / 能源环境

管理电子流。

游戏环境

棋盘游戏、视频游戏和所有其他互动娱乐媒体。

数学 / 计算

减少计算量,证明数学定理等等。

机器人环境

自主机器人。

电信系统环境

交互和/或管理无线和/或有线电信系统。

其他

  • Buffalo-Gym: 多臂老虎机 Gymnasium

    Gymnasium version dependency GitHub stars

    Buffalo-Gym 是一个多臂老虎机 (MAB) Gymnasium,主要用于协助调试 RL 实现。MAB 通常易于理解智能体正在学习什么以及是否正确。Buffalo-gym 包含 Bandits、Contextual bandits 和带有别名的 contextual bandits。

  • CARL: 上下文自适应 RL

    Gymnasium version dependency GitHub stars

    流行强化学习环境的上下文扩展,支持泛化训练和测试分布,例如具有可变杆长或具有不同地面摩擦的 Brax 机器人的 CartPole。

  • DACBench: 动态算法配置基准

    Gymnasium version dependency GitHub stars

    一个用于动态算法配置的基准库。其重点是不同 DAC 方法的可重现性和可比较性,以及优化过程的简易分析。

  • gym-cellular-automata: 细胞自动机环境

    Gymnasium version dependency GitHub stars

    智能体通过改变其细胞状态与细胞自动机交互的环境。

  • Gym-Gridworlds: 可定制的简约网格世界集合

    Gymnasium version dependency GitHub stars

    默认类实现了“前往目标”,但可以轻松定制以适应不同任务,包括各种网格、奖励、动力学和任务。它支持不同的观察类型(离散、坐标、二进制、像素、部分)。适用于快速测试和原型化 RL 算法,包括表格型和函数逼近型。

  • Gym4ReaL

    Gymnasium version dependency GitHub stars

    Gym4ReaL 是一个综合性的现实环境套件,旨在支持开发和评估能够在真实世界场景中运行的 RL 算法。该套件包含一系列多样化的任务,使 RL 算法面临各种实际挑战,例如水资源管理、微电网能源管理、金融交易等。

  • matrix-mdp: 轻松创建离散 MDP

    Gymnasium version dependency GitHub stars

    一个用于轻松将离散 MDP 作为 Gym 环境实现的环境。将一组矩阵(P_0(s)P(s'| s, a)R(s', s, a))转换为表示由这些动力学控制的离散 MDP 的 Gym 环境。

  • SimpleGrid: 一个用于 Gymnasium 的简单网格环境

    Gymnasium version dependency GitHub stars

    SimpleGrid 是一个用于 Gymnasium 的超级简单且极简的网格环境。它易于使用和定制,旨在为快速测试和原型化不同的 RL 算法提供一个环境。

使用 Gym 的第三方环境

有大量第三方环境使用各种版本的 Gym。其中许多可以进行调整以与 Gymnasium 配合使用(参见与 Gym 的兼容性),但不能保证完全正常运行。

视频游戏环境

机器人环境

自动驾驶环境

其他环境