AEAP: Actor Ensemble with Adaptive Pruning

AEAP is a multi-actor deterministic policy gradient algorithm that addresses the tension between exploration diversity and computational efficiency in ensemble-based reinforcement learning. It builds on TD3 and introduces two key components:

Dual-Randomized Actor Selection — Randomly selects different actors for environment interaction and policy updates, maintaining behavioral diversity without explicit regularization.
Adaptive Dual-Criterion Pruning — Progressively removes underperforming or redundant actors based on critic-estimated Q-values and pairwise action-space similarity.

Installation

Requirements

Python 3.8+
PyTorch (with CUDA support recommended)
NumPy
Gymnasium
gymnasium-robotics (for Fetch tasks)
MuJoCo

pip install torch numpy gymnasium gymnasium-robotics mujoco

Usage

Training

# Train AEAP on HalfCheetah
python main.py --policy AEAP --env HalfCheetah-v5 --seed 1

# Train TD3 baseline
python main.py --policy TD3 --env HalfCheetah-v5 --seed 1

Name		Name	Last commit message	Last commit date
Latest commit History 1 Commit
AEAP.py		AEAP.py
README.md		README.md
main.py		main.py

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

AEAP: Actor Ensemble with Adaptive Pruning

Installation

Requirements

Usage

Training

About

Uh oh!

Releases

Packages

Languages

kk0mo/AEAP

Folders and files

Latest commit

History

Repository files navigation

AEAP: Actor Ensemble with Adaptive Pruning

Installation

Requirements

Usage

Training

About

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages