封装器列表¶
Gymnasium 提供了以下列出的许多常用封装器。有关特定封装器的更多信息,请参阅封装器类型页面
名称 |
描述 |
---|---|
封装基于任何 Array API 兼容框架(例如 |
|
实现 Atari 环境的常用预处理技术(不包括帧堆叠)。 |
|
当达到终止或截断状态时,被封装的环境会自动重置。 |
|
将传递给 |
|
将环境的奖励剪切到上限和下限之间。 |
|
对从环境中返回的观测值添加延迟。 |
|
将观测数组的数据类型修改为指定的数据类型。 |
|
通过一组键或索引过滤 Dict 或 Tuple 观测空间。 |
|
扁平化环境的观测空间以及来自 |
|
以滚动方式堆叠最后 |
|
将由 |
|
允许支持“rgb_array”渲染的环境进行类人渲染。 |
|
封装一个基于 Jax 的环境,使其可以与 NumPy 数组交互。 |
|
封装一个基于 Jax 的环境,使其可以与 PyTorch 张量交互。 |
|
跳过第 N 帧(观测)并返回最后两个观测之间的最大值。 |
|
将观测值归一化,使其以均值为中心,具有单位方差。 |
|
归一化即时奖励,使其指数移动平均值具有固定方差。 |
|
封装一个基于 NumPy 的环境,使其可以与 PyTorch 张量交互。 |
|
如果在 |
|
一个被动环境检查器封装器,围绕 |
|
此封装器将跟踪累积奖励和剧集长度。 |
|
使用环境的渲染功能录制环境剧集的视频。 |
|
收集环境的渲染帧,使得 |
|
将渲染的观测值包含在环境的观测值中。 |
|
将环境的 |
|
将环境的 |
|
将基于数组的观测值重塑为指定的形状。 |
|
使用 OpenCV 将图像观测值调整为指定的形状。 |
|
增加动作在同一 |
|
用剧集内的时间步数扩充观测值。 |
|
通过在超过最大时间步数时截断环境来限制环境的步数。 |
|
在将修改后的值传递给环境 |
|
对从环境的 |
|
对从环境的 |
仅限向量封装器¶
名称 |
描述 |
---|---|
将向量化环境的信息从 |
|
为向量环境向量化单智能体转换动作封装器。 |
|
为向量环境向量化单智能体转换观测封装器。 |
|
为向量环境向量化单智能体转换奖励封装器。 |