Crafter RL Experiments

A collection of deep reinforcement learning experiments on the Crafter environment, featuring both DQN and PPO implementations with various improvements.

🎮 About Crafter

Crafter is a challenging open-world survival game designed for benchmarking RL agents. It requires learning complex behaviors like resource gathering, crafting, and combat across diverse terrains.

📋 Requirements

Python 3.10
CUDA-capable GPU (optional, but recommended for faster training)
Conda or Miniconda

🚀 Setup

1. Create Conda Environment

conda env create -f environment.yml
conda activate crafter_env

2. Verify Installation

python -c "import crafter; import stable_baselines3; print('Setup successful!')"

Optional: GA Conda Environment

conda env create -f crafterGA/environment.yml
conda activate crafter_env_ga

🏃 Training

PPO Training (1M steps each)

Baseline PPO:

python train.py --outdir logdir/ppo_baseline --steps 1000000

Improved PPO:

python train2.py --outdir logdir/ppo_improved --steps 1000000

PPO with Curiosity:

python train3.py --outdir logdir/ppo_curiosity --steps 1000000

DQN Training (1M steps each)

Baseline DQN:

python train_dqn.py --env_id CrafterPartial-v1 --total_timesteps 1000000

DQN with Reward Shaping:

python train_dqn_RShape.py --env_id CrafterPartial-v1 --total_timesteps 1000000

DQN with N-step Learning:

python train_dqn_per_nstep1.py --env_id CrafterPartial-v1 --total_timesteps 1000000

DQN with Noisy Networks + N-step:

python train_dqn_noisy_nstep.py --env_id CrafterPartial-v1 --total_timesteps 1000000

GA Training (200 generations each)

Baseline Training:

python crafterGA/train_ga.py --outdir crafterGA/logdir/crafter_ga_base/final --steps 200

Improvement 1 Training:

python crafterGA/train_ga_surv_v3.py --outdir crafterGA/logdir/crafter_ga_imp2/final --steps 200

Improvement 2 Training:

python crafterGA/train_ga_surv_v4.py --outdir crafterGA/logdir/crafter_ga_imp3/final --steps 200

📊 Evaluation

DQN Evaluation

Baseline DQN:

python eval_crafter_metrics.py --model dqn_crafter_baseline.zip --episodes 20 --logdir logs/dqn_csv
python plot_learning_curve.py --csv logs/dqn_csv/progress.csv --out dqn_base_curve.png
python crafter_eval_summary.py --path logs/dqn_csv/stats.jsonl --out dqn_summary.png --title "DQN Baseline Evaluation"

DQN with Reward Shaping:

python eval_crafter_metrics.py --model dqn_crafter_rShape.zip --episodes 20 --logdir logs/dqn_rShape_csv
python plot_learning_curve.py --csv logs/dqn_rShape_csv/progress.csv --out dqn_rShape_curve.png
python crafter_eval_summary.py --path logs/dqn_rShape_csv/stats.jsonl --out dqn_rShape_summary.png --title "DQN Reward Shaping Evaluation"

DQN with N-step Learning:

python eval_crafter_metrics.py --model dqn_nstep1.zip --episodes 20 --logdir eval_logs/dqn_nstep
python plot_learning_curve.py --csv logs/dqn_nstep_csv/progress.csv --out dqn_nstep_curve.png
python crafter_eval_summary.py --path eval_logs/dqn_nstep/stats.jsonl --out dqn_nstep_summary.png --title "DQN N-step Evaluation"

DQN with Noisy Networks + N-step:

python eval_crafter_metrics.py --model dqn_noisy_nstep.zip --episodes 20 --logdir logs/dqn_noisy_nstep_csv
python plot_learning_curve.py --csv logs/dqn_noisy_nstep_csv/progress.csv --out dqn_noisy_nstep_curve.png
python crafter_eval_summary.py --path logs/dqn_noisy_nstep_csv/stats.jsonl --out dqn_noisy_nstep_summary.png --title "DQN Noisy + N-step Evaluation"

GA Evaluation

Baseline Evaluation:

python crafterGA/pygadEval.py --model_path crafterGA/logdir/crafter_ga_base/final/best_ga_policy.pth --outdir crafterGA/logdir/crafter_ga_eval/base --seed 42

Improvment 1 Evaluation:

python crafterGA/pygadEvalImp1.py --model_path crafterGA/logdir/crafter_ga_imp1/final/best_ga_policy.pth --outdir crafterGAlogdir/crafter_ga_eval/imp2/final --seed 42

Improvment 2 Evaluation:

python crafterGA/pygadEvalImp1.py --model_path crafterGA/logdir/crafter_ga_imp2/final/best_ga_policy.pth --outdir crafterGA/logdir/crafter_ga_eval/imp3/final --seed 42

Animation Creation:

python crafterGA/viewEpisode.py --filename crafterGA/logdir/crafter_ga_eval/base/episode.npz

python crafterGA/viewEpisode.py --filename crafterGA/logdir/crafter_ga_eval/imp2/final/episode.npz

python crafterGA/viewEpisode.py --filename crafterGA/logdir/crafter_ga_eval/imp3/final/episode.npz

Graph Creation:

python crafterGA/pygadPlots.py

🔍 Monitoring Training

Monitor PPO training with TensorBoard:

tensorboard --logdir logdir/

📁 Project Structure

.
├── environment.yml              # Conda environment
├── train.py                     # Baseline PPO
├── train2.py                    # Improved PPO
├── train3.py                    # PPO + Curiosity
├── train_dqn.py                 # Baseline DQN
├── train_dqn_RShape.py          # DQN + Reward Shaping
├── train_dqn_per_nstep1.py      # DQN + N-step
├── train_dqn_noisy_nstep.py     # DQN + Noisy + N-step
├── crafterGA/                   # GA Files
└── logdir/                      # Training outputs

📚 References

Happy Training! 🚀

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Uh oh!

Repository files navigation

Crafter RL Experiments

🎮 About Crafter

📋 Requirements

🚀 Setup

1. Create Conda Environment

2. Verify Installation

Optional: GA Conda Environment

🏃 Training

PPO Training (1M steps each)

DQN Training (1M steps each)

GA Training (200 generations each)

📊 Evaluation

DQN Evaluation

GA Evaluation

🔍 Monitoring Training

📁 Project Structure

📚 References

About

Uh oh!

Releases

Packages

Contributors 3

Uh oh!

Languages

Name		Name	Last commit message	Last commit date
Latest commit History 15 Commits
Improvement 1		Improvement 1
Improvement 2		Improvement 2
baseline		baseline
crafterGA		crafterGA
logdir		logdir
README.md		README.md
crafter_eval_summary.py		crafter_eval_summary.py
crafter_gym_wrapper.py		crafter_gym_wrapper.py
env_make.py		env_make.py
environment.yml		environment.yml
eval_crafter_metrics.py		eval_crafter_metrics.py
noisy_cnn_policy.py		noisy_cnn_policy.py
per_nstep_replay.py		per_nstep_replay.py
plot_learning_curve.py		plot_learning_curve.py
train.py		train.py
train2.py		train2.py
train3.py		train3.py
train_dqn.py		train_dqn.py
train_dqn_RShape.py		train_dqn_RShape.py
train_dqn_noisy_nstep.py		train_dqn_noisy_nstep.py
train_dqn_per_nstep1.py		train_dqn_per_nstep1.py

WITS-Reinforcement-Learning-Group/crafter_rl_project

Folders and files

Latest commit

History

Repository files navigation

Crafter RL Experiments

🎮 About Crafter

📋 Requirements

🚀 Setup

1. Create Conda Environment

2. Verify Installation

Optional: GA Conda Environment

🏃 Training

PPO Training (1M steps each)

DQN Training (1M steps each)

GA Training (200 generations each)

📊 Evaluation

DQN Evaluation

GA Evaluation

🔍 Monitoring Training

📁 Project Structure

📚 References

About

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Contributors 3

Uh oh!

Languages

Packages