# 异步向量环境 AsyncVectorEnv

`gymnasium.vector.AsyncVectorEnv` 是一个向量化环境，它可以并行运行多个独立的环境实例。这种环境类型利用了多进程和进程间通信（通过管道），以实现高效的并行数据处理。这对于加速环境的步进和数据收集尤其有用，特别是在进行深度学习训练时。

### 参数
- **`env_fns`**: 创建环境的函数序列。每个函数在调用时都应返回一个新的环境实例。
- **`shared_memory`**: 如果为 `True`，则工作进程中的观测通过共享变量进行通信，可以提高大型观测（如图像）的效率。
- **`copy`**: 如果为 `True`，`AsyncVectorEnv.reset()` 和 `AsyncVectorEnv.step()` 方法会返回观测的副本。
- **`context`**: 多进程的上下文。如果为 `None`，则使用默认上下文。
- **`daemon`**: 如果为 `True`，子进程将设置为守护进程标志，即如果主进程退出，子进程也会退出。但设置为 `True` 会阻止子进程生成自己的子进程，因此对于某些环境可能需要设置为 `False`。
- **`worker`**: 如果设置，将使用该工作函数代替默认的工作函数。这可以用于覆盖一些内部向量环境逻辑，例如，如何处理终止或截断的重置。

### 示例代码

以下是如何使用 `AsyncVectorEnv` 创建并行环境的示例：

```python
import gymnasium as gym

# 创建 Pendulum-v1 环境的工厂函数
def make_env(g):
    return lambda: gym.make("Pendulum-v1", g=g)

# 创建两个具有不同重力的 Pendulum 环境
envs = gym.vector.AsyncVectorEnv([
    make_env(g=9.81),  # 标准重力加速度
    make_env(g=1.62)   # 月球重力加速度
])

# 重置环境并获取初始观测值
observations, infos = envs.reset(seed=42)
print(observations)

# 执行随机动作并获取新的观测值和奖励
actions = envs.action_space.sample()
observations, rewards, terminations, truncations, infos = envs.step(actions)
print(rewards)

# 关闭环境
envs.close()
```

### 功能和使用场景
- **并行性**：`AsyncVectorEnv` 通过并行执行多个环境实例来加速数据收集和环境交互过程。
- **灵活性**：允许自定义环境创建函数，使其能够运行具有不同配置的相同环境。
- **资源管理**：支持共享内存和守护进程模式，有助于优化资源使用和进程管理。
- **自定义工作进程**：通过 `worker` 参数，开发者可以自定义环境步进的内部逻辑，例如自定义重置逻辑。

这使得 `AsyncVectorEnv` 成为在多核CPU上进行强化学习训练和评估时的一个强大工具，特别是当需要高效地管理多个环境实例时。

`reset` 方法是向量化环境 (`VectorEnv`) 的一个重要组成部分，它用于同时重置所有子环境，并返回初始观测值和信息的批次。这个方法非常有用，因为它允许同时启动多个环境实例，从而可以并行收集数据，加快了训练和评估过程。

### 参数
- **`seed`**: 一个整数、整数列表或 `None`。如果是整数，将作为所有子环境的种子。如果是整数列表，列表中的每个元素将被用作对应子环境的种子。如果是 `None`，则不设定种子。
- **`options`**: 一个字典或 `None`。可用于传递额外的环境重置选项。

### 返回值
- **返回值**: 是一个元组，包含批次观测值和信息字典。
  - **批次观测值 (`ObsType`)**: 根据环境的观测空间类型，这可以是一个数组或字典的批次。
  - **信息 (`dict[str, Any]`)**: 包含每个子环境重置后的额外信息。

### 示例代码

下面的示例展示了如何使用 `reset` 方法重置一个包含两个子环境的向量化环境，并获取初始观测值。

```python
import gymnasium as gym

# 创建两个 Pendulum-v1 环境的向量化环境
envs = gym.vector.AsyncVectorEnv([
    lambda: gym.make("Pendulum-v1"),
    lambda: gym.make("Pendulum-v1")
])

# 使用种子重置所有子环境
observations, infos = envs.reset(seed=[42, 43])

# 打印初始观测值
print("Initial observations:", observations)

# 关闭环境
envs.close()
```

这段代码首先创建了一个包含两个 `Pendulum-v1` 环境的 `AsyncVectorEnv` 实例。然后，使用 `reset` 方法并传递种子列表 `[42, 43]` 重置所有子环境。该方法返回所有环境的初始观测值和信息，这些信息随后被打印出来。最后，调用 `close` 方法关闭环境，释放资源。

`step` 方法是向量化环境 (`VectorEnv`) 中的核心功能之一，它允许同时在所有子环境中执行动作，并收集结果。这使得数据收集和模型训练过程能够高效进行。

### 参数
- **`actions`**: 动作的批次。这些动作应符合环境的动作空间 (`action_space`)。对于每个子环境，必须提供一个动作。

### 返回值
- **返回值**: 是一个包含五个元素的元组，分别是观测值、奖励、终止标志、截断标志和额外信息的批次。
  - **观测值 (`ObsType`)**: 根据环境的观测空间类型，这可以是一个数组或字典的批次，包含每个子环境执行动作后的新观测值。
  - **奖励 (`ArrayType`)**: 包含每个子环境为给定动作提供的奖励值的数组。
  - **终止标志 (`ArrayType`)**: 布尔数组，每个元素指示对应的子环境是否达到终止状态（例如，任务完成或失败）。
  - **截断标志 (`ArrayType`)**: 布尔数组，每个元素指示对应的子环境是否因为达到最大步数等原因被截断。
  - **额外信息 (`dict[str, Any]`)**: 包含所有子环境可能提供的额外信息的字典。

### 示例代码

下面的示例展示了如何在包含两个子环境的向量化环境中执行动作，并处理返回的结果。

```python
import gymnasium as gym
import numpy as np

# 创建两个 CartPole-v1 环境的向量化环境
envs = gym.vector.AsyncVectorEnv([
    lambda: gym.make("CartPole-v1"),
    lambda: gym.make("CartPole-v1")
])

# 重置环境以获取初始观测值
observations, _ = envs.reset()

# 为每个子环境选择动作
actions = np.array([1, 0], dtype=np.int32)  # 假设选择的动作

# 在所有子环境中执行动作，并获取结果
observations, rewards, terminations, truncations, infos = envs.step(actions)

# 处理结果
print("Observations:", observations)
print("Rewards:", rewards)
print("Terminations:", terminations)
print("Truncations:", truncations)
print("Infos:", infos)

# 关闭环境
envs.close()
```

这段代码首先创建了一个包含两个 `CartPole-v1` 环境的 `AsyncVectorEnv` 实例，并通过 `reset` 方法初始化环境。然后，定义了一个动作数组，其中包含为每个子环境选择的动作。通过调用 `step` 方法执行这些动作，并收集每个子环境的观测值、奖励、终止标志、截断标志和额外信息。最后，打印出这些信息，并关闭环境。

`close` 方法是在使用向量化环境 (`VectorEnv`) 后进行清理和资源释放的重要步骤。这个方法负责关闭所有并行运行的子环境，并释放它们所占用的资源。

### 关键参数
- **`**kwargs`**: 关键字参数，这些参数将被传递给 `close_extras()` 方法。`close_extras` 是一个可以被子类重写的方法，用于处理特定的环境关闭逻辑，例如关闭额外的资源或执行清理操作。

### 注意事项
- 虽然 `close` 方法负责触发清理过程，但实际的环境关闭逻辑应在 `close_extras()` 方法中实现。这意味着如果你在开发自定义向量化环境或包装器时，可能需要重写 `close_extras` 方法以确保所有资源都被正确释放。
- 如果向量化环境在程序退出时未显式关闭，`close` 方法将被自动调用以释放资源。这是通过 Python 的垃圾收集机制实现的，确保即使在遗忘调用 `close` 的情况下，资源也能被清理。
- 对于异步向量化环境（例如 `AsyncVectorEnv`），`close` 方法还负责关闭所有子进程和通信管道，确保没有悬挂的进程或资源泄露。

### 示例代码

以下示例展示了如何正确关闭一个向量化环境：

```python
import gymnasium as gym

# 创建一个包含两个子环境的异步向量化环境
envs = gym.vector.AsyncVectorEnv([
    lambda: gym.make("CartPole-v1"),
    lambda: gym.make("CartPole-v1")
])

# 执行一些环境交互...

# 使用 close 方法关闭所有子环境并释放资源
envs.close()
```

在上面的示例中，通过调用 `close()` 方法，在完成所有环境交互后关闭向量化环境及其所有子环境。这个步骤是必要的，以确保程序结束时所有资源都被正确释放，特别是在使用多进程环境时。

`call` 方法是向量化环境（`VectorEnv`）的一个高级功能，它允许你对每个并行环境中的方法或属性进行调用，并传递相应的参数。

### 关键参数
- **`name`** (str): 要调用的方法或属性的名称。
- **`*args`**: 位置参数，将传递给每个环境中的方法调用。
- **`**kwargs`**: 关键字参数，也将传递给每个环境中的方法调用。

### 返回值
- 返回一个元组，包含每个并行环境中方法调用的结果。这意味着，如果你有三个子环境并且使用 `call` 方法调用了一个方法，你将得到一个包含三个元素的元组，每个元素代表对应环境中方法调用的结果。

### 示例代码

以下示例展示了如何使用 `call` 方法对每个并行环境的 `render` 方法进行调用，并传递方法参数：

```python
import gymnasium as gym

# 创建一个包含两个子环境的异步向量化环境
envs = gym.vector.AsyncVectorEnv([
    lambda: gym.make("CartPole-v1"),
    lambda: gym.make("CartPole-v1")
])

# 使用 call 方法对每个环境的 render 方法进行调用，并传递方法参数
render_results = envs.call("render", mode="rgb_array")

# 输出每个环境的渲染结果
for i, render_result in enumerate(render_results):
    print(f"Environment {i} render result shape: {render_result.shape}")

# 关闭环境
envs.close()
```

在这个例子中，`call` 方法被用来请求每个子环境以 `rgb_array` 模式渲染当前状态，并返回渲染结果的数组。这对于需要从每个子环境中获取或调用特定信息时非常有用，而无需直接操作环境对象。通过这种方式，你可以灵活地管理并行环境中的操作，而不需要显式循环遍历每个环境。

`get_attr` 方法允许你从每个并行环境中获取指定的属性。这对于访问环境内部状态或特定参数非常有用。

### 关键参数
- **`name`** (str): 要从每个环境中获取的属性名称。

### 返回值
- 返回一个列表，包含每个并行环境中指定属性的值。

### 示例代码

以下示例展示了如何使用 `get_attr` 方法从每个并行环境中获取 `spec` 属性的值：

```python
import gymnasium as gym

# 创建一个包含两个子环境的异步向量化环境
envs = gym.vector.AsyncVectorEnv([
    lambda: gym.make("CartPole-v1"),
    lambda: gym.make("MountainCarContinuous-v0")
])

# 使用 get_attr 方法从每个环境中获取 spec 属性的值
specs = envs.get_attr("spec")

# 输出每个环境的 spec 属性值
for i, spec in enumerate(specs):
    print(f"Environment {i} spec id: {spec.id}")

# 关闭环境
envs.close()
```

在这个例子中，`get_attr` 方法被用来获取每个子环境的 `spec` 属性，该属性包含环境的元数据（如环境的唯一标识符）。通过这种方式，你可以轻松访问并行环境中的共享或特定属性，而无需直接与环境对象交互。这种方法提高了代码的灵活性和可重用性，特别是在处理大量并行环境时。

`set_attr` 方法允许你为每个并行环境设置指定的属性。这个方法在需要统一更新环境属性或应用不同的设置到每个环境时非常有用。

### 关键参数
- **`name`** (str): 要在每个环境中设置的属性名称。
- **`values`** (list[Any] | tuple[Any] | object): 要设置的属性值。如果是列表或元组，则对应于每个单独环境的值；否则，单个值将被设置为所有环境的属性值。

### 异常
- **`ValueError`**: 如果 `values` 是列表或元组，其长度必须等于环境的数量。
- **`AlreadyPendingCallError`**: 如果在等待一个挂起的调用完成时调用 `set_attr()`，将抛出此异常。

### 示例代码

以下示例演示了如何使用 `set_attr` 方法为每个并行环境设置 `g` 属性（例如，重力加速度）的值：

```python
import gymnasium as gym

# 创建一个包含两个子环境的异步向量化环境
envs = gym.vector.AsyncVectorEnv([
    lambda: gym.make("Pendulum-v1"),
    lambda: gym.make("Pendulum-v1")
])

# 为每个环境设置不同的重力加速度值
envs.set_attr("g", [9.81, 1.62])

# 获取并打印每个环境的 'g' 属性，以验证设置是否成功
gravity_values = envs.get_attr("g")
print(f"Gravity values set: {gravity_values}")

# 关闭环境
envs.close()
```

这个示例中，我们创建了两个 `Pendulum-v1` 环境的异步向量化环境，并通过 `set_attr` 方法为每个子环境设置了不同的重力加速度值（一个为地球重力加速度，另一个为月球重力加速度）。然后，我们通过 `get_attr` 方法验证了属性值是否被正确设置。这种方式使得批量管理和配置大量环境变得简单且灵活。

# 同步向量环境 SyncVectorEnv

`SyncVectorEnv` 类是一个向量化环境，它串行地运行多个环境。这意味着每个环境会依次执行，而不是并行执行。这种环境对于需要避免多进程或多线程的情况（可能是由于环境的实现或外部库的限制）非常有用，同时仍然希望以统一和批量的方式处理多个环境实例。

### 参数
- **`env_fns`** (Iterator[Callable[[], Env]] | Sequence[Callable[[], Env]]): 一个可迭代对象，包含创建各个子环境的函数。这允许每个环境有不同的初始化设置。
- **`copy`** (bool): 如果为True，则`reset()`和`step()`方法返回观测值的副本。默认为True。

### 异常
- **`RuntimeError`**: 如果某个子环境的观测空间与第一个子环境（或指定的观测空间）不匹配，则抛出此异常。

### 示例代码

以下示例演示了如何创建两个`Pendulum-v1`环境的`SyncVectorEnv`，每个环境有不同的重力加速度值：

```python
import gymnasium as gym

# 定义创建环境的函数
env_fns = [
    lambda: gym.make("Pendulum-v1", g=9.81),  # 地球重力
    lambda: gym.make("Pendulum-v1", g=1.62)   # 月球重力
]

# 创建同步向量化环境
envs = gym.vector.SyncVectorEnv(env_fns)

# 重置环境并获取初始观测值
obs, infos = envs.reset(seed=42)
print(f"Initial observations: {obs}")

# 采取随机动作
actions = envs.action_space.sample()
obs, rewards, terminates, truncates, infos = envs.step(actions)
print(f"Observations after action: {obs}")
print(f"Rewards: {rewards}")

# 关闭环境
envs.close()
```

这个示例首先定义了两个创建环境的函数，每个函数设置了不同的`g`值。然后，它创建了一个`SyncVectorEnv`实例并通过它运行环境。通过串行执行步骤，该示例展示了观测值、奖励和其他信息的获取方法。

`reset` 方法用于重置 `SyncVectorEnv` 类中的所有子环境，并返回一个包含所有子环境初始观测值的批次，以及可能的环境信息。这个方法允许您为每个子环境设置不同的随机种子，或者为所有环境提供统一的随机种子，以控制环境的随机性。

### 参数
- **`seed`** (`int` | `list[int]` | `None`): 用于重置子环境的种子。
  - 如果为 `None`，每个子环境将使用随机种子。
  - 如果为 `int`，将为每个子环境生成一个序列种子，如 [seed, seed+1, ..., seed+n]。
  - 如果为 `list[int]`，列表中的每个整数将分别用作每个子环境的种子。
- **`options`** (`dict[str, Any]` | `None`): 用于每个子环境的额外选项信息。

### 返回值
- **`tuple[ObsType, dict[str, Any]]`**: 包含所有子环境初始观测值的批次以及可能的环境信息的元组。

### 示例代码

下面的代码示例展示了如何使用 `SyncVectorEnv` 类来重置两个 `Pendulum-v1` 环境，并为每个环境设置不同的种子。

```python
import gymnasium as gym

# 定义创建环境的函数列表
env_fns = [
    lambda: gym.make("Pendulum-v1"),
    lambda: gym.make("Pendulum-v1")
]

# 创建同步向量化环境
envs = gym.vector.SyncVectorEnv(env_fns)

# 使用不同的种子重置环境，并获取初始观测值和信息
obs, infos = envs.reset(seed=[42, 43])

print("初始观测值:")
print(obs)

# 关闭环境
envs.close()
```

在这个示例中，`reset` 方法被用来重置两个 `Pendulum-v1` 环境，并为它们分别设置种子 42 和 43。这样可以确保每个环境的初始状态不同，从而提供更多样化的学习环境。通过调用 `reset` 方法，我们得到了两个子环境的初始观测值，并打印出来。最后，通过调用 `close` 方法来释放资源。

`step` 方法在 `SyncVectorEnv` 类中用于在所有子环境上执行动作，并返回批量处理的结果。这个方法允许您一次性对所有环境执行动作，并收集结果，包括新的观测值、奖励、终止信号、截断信号和额外的信息。

### 参数
- **`actions`** (`ActType`): 一个包含每个子环境动作的数组。数组的每个元素对应一个子环境的动作。

### 返回值
该方法返回一个包含以下元素的元组：
- **`observations`** (`ObsType`): 所有子环境的新观测值的批量数据。
- **`rewards`** (`ArrayType`): 所有子环境的奖励的批量数据。
- **`terminations`** (`ArrayType`): 指示每个子环境是否达到了终止状态的批量数据。
- **`truncations`** (`ArrayType`): 指示每个子环境是否因为时间限制而截断的批量数据。
- **`infos`** (`dict[str, Any]`): 包含所有子环境额外信息的字典。

### 示例代码

以下代码展示了如何使用 `SyncVectorEnv` 类来同时在两个 `CartPole-v1` 环境上执行动作，并获取批量结果。

```python
import gymnasium as gym
import numpy as np

# 创建两个 CartPole-v1 环境的向量化环境
envs = gym.vector.SyncVectorEnv([
    lambda: gym.make("CartPole-v1"),
    lambda: gym.make("CartPole-v1")
])

# 重置环境并忽略初始观测值
envs.reset(seed=42)

# 定义两个环境的动作
actions = np.array([1, 0])  # 第一个环境执行动作 1，第二个环境执行动作 0

# 执行动作并获取结果
observations, rewards, terminations, truncations, infos = envs.step(actions)

print("新的观测值:", observations)
print("奖励:", rewards)
print("终止信号:", terminations)
print("截断信号:", truncations)

# 关闭环境
envs.close()
```

这个示例中，我们创建了一个包含两个 `CartPole-v1` 环境的 `SyncVectorEnv` 实例。通过调用 `reset` 方法初始化环境，并通过 `step` 方法同时在两个环境上执行动作。`step` 方法返回每个环境的新观测值、奖励、终止状态和截断状态的批量数据，以及可能的额外信息。最后，调用 `close` 方法来释放资源。

`close` 方法在 `SyncVectorEnv` 类中用于关闭所有并行运行的环境并释放资源。这个方法保证了所有使用的资源，如内存和进程，都被适当地清理，避免了潜在的资源泄露问题。

### 参数
- **`**kwargs`** (`Any`): 传递给 `close_extras()` 方法的关键字参数。这允许在关闭环境时传递额外的参数，以便进行定制化的清理操作。

### 注意事项
- **资源释放**: 虽然 `close` 方法负责触发环境的关闭流程，但实际关闭环境的动作应该在 `close_extras()` 方法中实现。这种设计允许子类根据需要实现特定的资源释放逻辑。
- **自动调用**: 当对象被垃圾回收或程序退出时，`close` 方法会自动被调用。这提供了一个安全网，确保资源不会因为忘记手动调用 `close` 而泄露。
- **警告**: 尽管 `close` 方法提供了关闭环境的机制，它本身并不直接关闭环境。这意味着如果你创建了自定义环境或使用了特殊资源，你可能需要在 `close_extras()` 中添加额外的清理代码。

### 示例代码

以下代码展示了如何在使用 `SyncVectorEnv` 创建并使用环境后，通过调用 `close` 方法来释放资源。

```python
import gymnasium as gym

# 创建两个 CartPole-v1 环境的向量化环境
envs = gym.vector.SyncVectorEnv([
    lambda: gym.make("CartPole-v1"),
    lambda: gym.make("CartPole-v1")
])

# 重置环境
envs.reset(seed=42)

# 执行一些动作（示例中省略了动作执行的具体代码）

# 关闭环境并释放资源
envs.close()
```

这段代码演示了在使用完向量化环境后，应当调用 `close` 方法来正确释放所有相关资源。这是确保资源正确管理的重要一步，特别是在使用了大量资源或长时间运行的程序中。

`call` 方法在 `SyncVectorEnv` 类中允许你对每个子环境执行特定的方法调用，并将参数（`args`）和关键字参数（`kwargs`）应用到这个方法调用上。此方法对于执行子环境中的自定义方法非常有用，例如获取环境的特定状态信息或执行环境特有的操作。

### 参数
- **`name`** (`str`): 要调用的子环境方法的名称。
- **`*args`** (`Any`): 传递给方法的位置参数。
- **`**kwargs`** (`Any`): 传递给方法的关键字参数。

### 返回值
- **`tuple[Any, ...]`**: 每个子环境调用指定方法后返回的结果组成的元组。

### 注意事项
- 调用的方法必须是子环境支持的方法，否则将抛出异常。
- 返回的结果将按照子环境的顺序组织成一个元组。

### 示例代码

以下代码演示了如何使用 `call` 方法来获取每个子环境中的特定属性或执行方法。

```python
import gymnasium as gym

# 创建两个 Pendulum-v1 环境的向量化环境
envs = gym.vector.SyncVectorEnv([
    lambda: gym.make("Pendulum-v1"),
    lambda: gym.make("Pendulum-v1")
])

# 调用每个子环境的 `get_attr` 方法，获取 `g` 属性的值
gravity_values = envs.call('get_attr', 'g')

print("Gravity values for each environment:", gravity_values)

# 假设子环境有一个 `custom_method` 方法，我们想要在所有环境上调用它
# 这里仅为示例，实际使用时确保环境中存在 `custom_method`
results = envs.call('custom_method', arg1, kwarg1='value')

print("Results from custom method:", results)

# 关闭环境
envs.close()
```

在这个例子中，`call` 方法首先被用来从每个子环境中获取 `g` 属性的值。然后，假设有一个名为 `custom_method` 的方法，我们演示了如何将位置参数和关键字参数传递给这个方法，并获取其在所有子环境上执行的结果。这个功能提供了一种灵活的方式来与向量化环境中的子环境交互。

`get_attr` 方法允许你从每个并行子环境中获取指定的属性。这对于需要从环境中提取配置或状态信息时非常有用。

### 参数
- **`name`** (`str`): 要从每个子环境中获取的属性的名称。

### 返回值
- 返回一个包含每个子环境指定属性值的列表。

### 示例代码

假设我们有一个向量化环境，其中每个子环境都有一个名为 `g` 的属性，表示环境中的重力值。以下代码展示了如何使用 `get_attr` 方法获取每个子环境的 `g` 属性值。

```python
import gymnasium as gym

# 假设我们有一个自定义的环境，其中包含一个表示重力的属性 `g`
# 这里使用 Pendulum-v1 作为示例，实际使用时请替换为你的环境
envs = gym.vector.SyncVectorEnv([
    lambda: gym.make("Pendulum-v1"),
    lambda: gym.make("Pendulum-v1")
])

# 获取每个子环境的 `g` 属性值
gravity_values = envs.get_attr('g')

print("Gravity values for each environment:", gravity_values)

# 关闭环境
envs.close()
```

在这个例子中，`get_attr` 方法被用来获取每个子环境的 `g` 属性值，这些值将被打印出来。注意，如果子环境没有名为 `g` 的属性，这将抛出一个异常。这个方法为你提供了一种方便的方式来批量查询子环境的状态或配置信息。

`set_attr` 方法允许你为每个子环境设置指定的属性。这个方法非常有用，特别是在需要动态调整环境参数的情况下，比如调整奖励的比例、修改环境的物理属性等。

### 参数
- **`name`** (`str`): 要设置的属性名称。
- **`values`** (`list[Any] | tuple[Any, ...] | Any`): 要设置的属性值。如果是列表或元组，则对应于每个子环境的值；如果是单个值，则为所有环境设置相同的值。

### 异常
- **`ValueError`**: 如果 `values` 是列表或元组，其长度必须等于子环境的数量。

### 示例代码

假设我们有一个向量化环境，其中每个子环境都有一个名为 `gravity` 的属性，以下代码展示了如何为每个子环境设置不同的重力值。

```python
import gymnasium as gym

# 假设我们有一个自定义的环境，其中包含一个表示重力的属性 `gravity`
# 这里使用 Pendulum-v1 作为示例，实际使用时请替换为你的环境
envs = gym.vector.SyncVectorEnv([
    lambda: gym.make("Pendulum-v1"),
    lambda: gym.make("Pendulum-v1")
])

# 为每个子环境设置不同的重力值
gravity_values = [9.81, 1.62]  # 第一个环境使用地球重力，第二个环境使用月球重力
envs.set_attr('gravity', gravity_values)

# 验证设置是否成功
updated_gravity_values = envs.get_attr('gravity')
print("Updated gravity values for each environment:", updated_gravity_values)

# 关闭环境
envs.close()
```

在这个例子中，`set_attr` 方法被用来为每个子环境设置 `gravity` 属性的值。首先创建一个包含每个子环境新重力值的列表，然后将这个列表传递给 `set_attr` 方法。最后，通过 `get_attr` 方法验证属性值是否已成功更新。这种方式为批量配置环境提供了极大的灵活性和便利。