Wrapper 列表¶
Gymnasium 提供了许多常用的 wrappers,如下列表所示。更多信息可以在关于 wrapper 类型的页面上找到特定 wrapper 的信息
名称 |
描述 |
---|---|
实现了 Atari 环境的常用预处理技术(不包括帧堆叠)。 |
|
当达到终止或截断状态时,包装的环境会自动重置。 |
|
将传递给 |
|
将环境的奖励裁剪到上限和下限之间。 |
|
为环境中返回的观测添加延迟。 |
|
将观测数组的数据类型修改为指定的类型。 |
|
通过一组键或索引过滤 Dict 或 Tuple 观测空间。 |
|
展平环境的观测空间以及来自 |
|
以滚动方式堆叠最后 |
|
将 |
|
允许为支持 “rgb_array” 渲染的环境进行类似人类的渲染。 |
|
包装基于 Jax 的环境,使其可以与 NumPy 数组交互。 |
|
包装基于 Jax 的环境,使其可以与 PyTorch 张量交互。 |
|
跳过第 N 帧(观测),并返回最后两个观测之间的最大值。 |
|
将观测标准化为以均值为中心,单位方差。 |
|
标准化即时奖励,使其指数移动平均值具有固定的方差。 |
|
包装基于 NumPy 的环境,使其可以与 PyTorch 张量交互。 |
|
如果在 |
|
一个被动的环境检查器 wrapper,它围绕 |
|
此 wrapper 将跟踪累积奖励和 эпизод 长度。 |
|
使用环境的渲染函数记录环境 эпизод 的视频。 |
|
收集环境的渲染帧,例如 |
|
将渲染的观测包含在环境的观测中。 |
|
将环境的 |
|
将环境的 |
|
将基于数组的观测重塑为指定的形状。 |
|
使用 OpenCV 将图像观测调整为指定的形状。 |
|
为相同的 |
|
使用 эпизод 中经过的时间步数来增强观测。 |
|
通过在超过最大时间步数时截断环境来限制环境的步数。 |
|
在将修改后的值传递给环境 |
|
将函数应用于从环境的 |
|
将函数应用于从环境的 |
仅向量化 Wrappers¶
名称 |
描述 |
---|---|
将向量化环境的信息从 |
|
为向量环境向量化单智能体转换动作 wrapper。 |
|
为向量环境向量化单智能体转换观测 wrapper。 |
|
为向量环境向量化单智能体转换奖励 wrapper。 |