冰湖¶
此环境是玩具文字环境的一部分,其中包含有关该环境的一般信息。
动作空间 |
|
观测空间 |
|
导入 |
|
冰湖涉及穿过一个冰冻的湖泊,从起点走到目标,而不掉入任何洞中,通过在冰冻的湖泊上行走。由于冰冻湖泊的滑溜性质,玩家可能不会总是按预期方向移动。
描述¶
游戏从玩家位于冰冻湖泊网格世界的 [0, 0] 位置开始,目标位于世界的最远端,例如 4x4 环境的 [3, 3]。
当使用预先确定的地图时,冰中的洞穴分布在设定的位置,或者当生成随机地图时,分布在随机位置。
玩家进行移动,直到他们到达目标或掉入洞中。
湖泊很滑 (除非禁用),因此玩家有时可能会沿着与预期方向垂直的方向移动 (请参阅 is_slippery
)。
随机生成的世界的目标总是有一条路径。
精灵和凳子来自 https://franuka.itch.io/rpg-snow-tileset。所有其他资产由 Mel Tillery 提供 http://www.cyaneus.com/。
动作空间¶
动作形状为 (1,)
,范围为 {0, 3}
,表示玩家要移动的方向。
0: 向左移动
1: 向下移动
2: 向右移动
3: 向上移动
观测空间¶
观测值是一个值,表示玩家当前的位置,为 current_row * ncols + current_col (其中行和列都从 0 开始)。
例如,4x4 地图中的目标位置可以按如下方式计算:3 * 4 + 3 = 15。可能的观测值数量取决于地图的大小。
观测值将作为 int()
返回。
起始状态¶
游戏开始时,玩家处于状态 [0]
(位置 [0, 0])。
奖励¶
奖励计划
到达目标:+1
到达洞穴:0
到达冰面:0
游戏结束¶
如果发生以下情况,游戏将结束
终止
玩家移动到洞穴中。
玩家到达目标
max(nrow) * max(ncol) - 1
(位置[max(nrow)-1, max(ncol)-1]
)。
截断 (使用 time_limit 包装器时)
对于 4x4 环境,游戏的长度为 100;对于 FrozenLake8x8-v1 环境,游戏的长度为 200。
信息¶
step()
和 reset()
返回一个字典,其中包含以下键
p - 状态的转移概率。
有关转移概率信息,请参阅 is_slippery
。
参数¶
import gymnasium as gym
gym.make('FrozenLake-v1', desc=None, map_name="4x4", is_slippery=True)
desc=None
: 用于指定非预加载地图的地图。
指定自定义地图。
desc=["SFFF", "FHFH", "FFFH", "HFFG"].
可以通过调用函数 generate_random_map
来指定随机生成的地图。
from gymnasium.envs.toy_text.frozen_lake import generate_random_map
gym.make('FrozenLake-v1', desc=generate_random_map(size=8))
map_name="4x4"
: 用于使用任何预加载地图的 ID。
"4x4":[
"SFFF",
"FHFH",
"FFFH",
"HFFG"
]
"8x8": [
"SFFFFFFF",
"FFFFFFFF",
"FFFHFFFF",
"FFFFFHFF",
"FFFHFFFF",
"FHHFFFHF",
"FHFFHFHF",
"FFFHFFFG",
]
如果 desc=None
,则将使用 map_name
。如果 desc
和 map_name
都为 None
,则将生成一个随机的 8x8 地图,其中 80% 的位置被冻结。
is_slippery=True
: 如果为真,玩家将按预期方向移动,概率为 1/3,否则将以相等的概率 (1/3) 在两个垂直方向中的任何一个方向移动。
例如,如果操作为左,并且 is_slippery 为 True,那么
P(向左移动) = 1/3
P(向上移动) = 1/3
P(向下移动) = 1/3
版本历史¶
v1: 奖励的错误修复
v0: 初始版本发布