## **Dependencies**

In [None]:
import gymnasium as gym
from src.dqn import run_dqn
from src.utils import plot_rewards
from src.utils import plot_epsilon
from src.utils import display_model
import pandas as pd

# **Lunar Lander Reinforcement Learning**

Dieses Projekt befasst sich mit der Implementierung und Anwendung eines Deep Q-Networks (DQN) zur Steuerung eines Lunar Landers in der Gymnasium-Umgebung `LunarLander-v2`. Ziel des Projekts ist es, einen Agenten zu trainieren, der in der Lage ist, das Landefahrzeug sicher auf dem Mond zu landen, indem er optimale Aktionen basierend auf dem aktuellen Zustand der Umgebung auswählt.

**Lunar Lander Enviroment:** 
- https://gymnasium.farama.org/environments/box2d/lunar_lander/

In dieser Ausarbeitung wurde sich maßgeblich am "Playing Atari with Deep Reinforcement Learning" Paper von Volodymyr Mnih et al. orientiert. Im Folgenden sind die Resultate des Trainingsprozesses dargestellt.

**Link zum "Playing Atari with Deep Reinforcement Learning" Paper:**
- https://arxiv.org/pdf/1312.5602


## **Train Agent**

### **Ziel**

Ein optimaler Zustand ist erreicht, sobald das Raumschiff sicher gelandet wurde und ein Gesamt-Reward (Score) von 200 erreicht wurde.

### **Aktionen**

Es stehen vier diskrete Aktionen zur Verfügung:

- **0**: Nichts tun
- **1**: Linken Steuerungstriebwerk zünden
- **2**: Haupttriebwerk zünden
- **3**: Rechten Steuerungstriebwerk zünden


### **Run DQN**


In [None]:
scores = run_dqn()

### **Training Reward**

In [None]:
df = pd.read_csv('data/logs/training_log.csv')
episodes = df['Episode']
scores = df['Score']
epsilon = df['Epsilon']

plot_rewards(episodes, scores)

### **Epsilon Decay**

In [None]:
plot_epsilon(episodes, epsilon)

### **Demo** 

10 Sample Trys in Enviroment

In [None]:
env = gym.make('LunarLander-v2', render_mode="human")
display_model(env, 'data/checkpoints/checkpoint_final.pth')
env.close()

#### **Demo Episode 100**

![Lunar Lander GIF](data/images/ep_100.gif)

### **Demo Final Model**

![Lunar Lander GIF](data/images/final.gif)