Multi-Agent Reinforcement Leaning

We use Multi Agent Deep Deterministic Policy Gradient to train agents on our custom environment.


Algorithm	Environment

In our setup, we take action as the control points for planning our trajectory using bezier curves.The trajectory followed by the agent is taken as observation.
The reward structure is as follows:

-10 for any collision
+1 for reaching the target.

Setup

git clone https://github.com/COPS-IITBHU/MultiAgent_Grid.git
cd MultiAgent_Grid
pip install requirements.txt

Training

python train.py

Evaluation

python eval.py

Name		Name	Last commit message	Last commit date
Latest commit History 23 Commits
.ipynb_checkpoints		.ipynb_checkpoints
__pycache__		__pycache__
common		common
gym_foo.egg-info		gym_foo.egg-info
gym_grid		gym_grid
img		img
maddpg		maddpg
model		model
.DS_Store		.DS_Store
README.md		README.md
agent.py		agent.py
bezier.py		bezier.py
eval.py		eval.py
requirements.txt		requirements.txt
runner.py		runner.py
setup.py		setup.py
train.py		train.py

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Multi-Agent Reinforcement Leaning

Setup

Training

Evaluation

About

Releases

Packages

Contributors 2

Languages

COPS-IITBHU/MultiAgent_Grid

Folders and files

Latest commit

History

Repository files navigation

Multi-Agent Reinforcement Leaning

Setup

Training

Evaluation

About

Resources

Stars

Watchers

Forks

Releases

Packages 0

Contributors 2

Languages

Packages