# Flappy Bird

In dieser Einheit trainieren wir eine KI, die das Spiel Flappy Bird bis zur Perfektion erlernen wird. Führe das folgende Codefeld aus, um alle notwendigen Module zu importieren.

<br>

 <figure>
  <img src="resources/img/game_flappy_bird.png" alt="Spiel Flappy Bird" style="width:70%">
  <figcaption></figcaption>
</figure> 

<br>


In [None]:
import gym
import copy
import numpy as np
import time as time
import torch
import torch.nn as nn
import gym_flappyBird
import genetics as gen
import matplotlib.pyplot as plt
import math
import pygame
from pygame.locals import *

____

<img style="float: left;" src="resources/img/laptop_icon.png" width=50 height=50 /> <br><br>

<i>Folge den Kommentaren im folgenden Codefeld, um das Spiel Flappy Bird selbst spielen zu können.</i>

In [None]:
done = False
reward = 0
env = gym.make("scienceCampBird-v1")
state = env.reset()

# Wenn du die Leertaste drückst, wirkt eine y-Kraft der 
# Schwerkraft entgegen. Probiere unterschiedliche Werte 
# für YKRAFT aus, um das beste Spielgefühl zu erreichen.

def birdAction(decision, bird):
    YKRAFT = # Füge hier deinen Code ein
    bird.forceY = YKRAFT * decision[0]
    
env.setAction(birdAction)

# In Folgenden baust du die Säulenlandschaft auf. 

# Abstand zwischen Säulen
ABSTAND_SAEULEN = [MIN1, MAX1]

# Höhe der Säulen
HOEHE_SAEULEN = [MIN2, MAX2]

# Öffnung der Säulen
LUECKEN_SAUELEN = [MIN3, MAX3]

env.setPipeIntervals([ ABSTAND_SAEULEN, HOEHE_SAEULEN, LUECKEN_SAUELEN ])

# Hier wird das Programm gestartet.

while True:
    
    decision = [0.0]     
    
    for event in pygame.event.get():
        
        if event.type == KEYDOWN and event.key == K_ESCAPE:
            pygame.quit()
        
        elif event.type == KEYDOWN and event.key == K_SPACE:
            decision = [1.0]
            
    state_old = state
    state, _, game_over, _ = env.step(decision)
    
    # Für jede Einheit, die der Flappy Bird nach rechts zurücklegt,
    # wird die Punktzahl erhöht.
    reward += 1
    
    env.render()
    
    # Wenn das Flappy Bird abstürzt oder gegen eine Säule fliegt,
    # wird das Spiel beendet.
    if game_over:
        # Die Punktzahl wird in der Konsole ausgegeben.
        print ('Score:', reward)
        
        # Das Spiel wird neu gestartet.
        state = env.reset()
        
        # Die Punktzahl wird wieder auf 0 gesetzt.
        reward = 0
        
        # Der Prozess wird eine Sekunde lang gestoppt.
        time.sleep(2)

Nun kannst du das Spiel Flappy Bird selbst spielen. Es wäre aber doch eigentlich ganz nett, wenn du zusätzlich eine KI implementieren und trainieren könntest, die die beste Spielweise eigenständig erlernt. Dafür gibt es für dieses Spiel zwei Möglichkeiten: 

<ol>
    <li>Das Bild des aktuellen Ausschnitts des Spiels wird in ein CNN eingesetzt. Die KI lernt im Laufe des Trainings die relevanten Feature für ein erfolgreiches Spielen und passt ihre Gewichte entsprechend an. Allerdings ist der Einsatz eines CNNs sehr rechenaufwendig und für unser Szenario etwas übertrieben.</li>
    <li>Wir können nämlich ausnutzen, dass wir auf die Daten des Spiels zugreifen können, um diese als Feature zu verwenden. Ein kleines neuronales Netz bestehend aus fully-connected Schichten wäre demzufolge ausreichend, um eine KI zu konstruieren, die lernt, das Spiel perfekt zu spielen.</li>
    
</ol>

Wir setzen die zweite Option um und betrachten im nächsten Abschnitt, wie wir unser Netz trainieren können. Aufgrund des Rechenaufwands ist Backpropagation in unserem Fall nicht geeignet.


## Evolutionärer Algorithmus

Die Idee eines evolutionären Algorithmus lässt sich für das Spiel Flappy Bird wie folgt zusammenfassen: In jedem Schritt wird eine Population von Vögeln erstellt. Die Aktion eines jeden Vogeln wird durch ein eigenes neuronales Netz bestimmt. In jedem Zeitschritt „trifft“ das neuronale Netz die Entscheidung, ob keine Kraft (0) oder eine Kraft (1) nach oben wirken soll. Jeder Vogel fliegt einmal durch die Hindernisse. Anschließend werden die besten $k$ Vögel und die entsprechenden neuronalen Netzen als Grundlage gewählt, um im nächsten Schritt durch Mutationen die nächste Population von Vögeln zu erhalten.  

<br>


 <figure>
  <img src="resources/img/evolution_sparrow.png" alt="Evolutionsalgorithmus" style="width:70%">
  <figcaption></figcaption>
</figure> 

<br>

Eine Mutation besteht darin, jedem Gewicht des neuronalen Netzes eine zufällig gewählte Zahl eines Intervalls nahe 0 zu addieren.

<br>

 <figure>
  <img src="resources/img/net_mutation.png" alt="Mutation" style="width:50%">
  <figcaption><i>Das ist ein Beispiel für den Ablauf einer Mutation. Bei diesem neuronalen Netz handelt es sich nicht um das neuronale Netz, das du umsetzen sollst. Die Anzahl der Eingabe- und Ausgabeneuronen und die Anzahl der verdeckten Schichten sollst du selbst sinnvoll festlegen.</i></figcaption>
</figure> 

<br>

Im Optimalfall wird auf diese Weise ein neuronales Netz ermittelt, das die gegebene Aufgabe optimal lösen kann. Jetzt bist du bereit die Theorie in Code umzusetzen.
____

<img style="float: left;" src="resources/img/laptop_icon.png" width=50 height=50 /> <br><br>

<i>Folge den Kommentaren in den folgenden Codefeldern, um eine KI zu implementieren, die das Spiel Flappy Bird selbst spielen kann.</i>


In [None]:
# Erstelle eine Funktion, die die relevanten Feature zurückgibt.

def generateFeatures(state):
    pass


# Der auskommentierte Code ist nicht zur Ausführung gedacht, soll dir aber helfen
# sinnvolle Feature für die obere Funktion zu finden.

'''

Der Parameter state ist eine Dictionary, die ungefähr so aussieht:

{
    'bird': <Objekt der Klasse Bird>, 
    'pipes': [<naechste_sauele0>, <naechste_sauele1>, <naechste_sauele2>, <naechste_sauele3>, <naechste_sauele4>]
}



class Bird:

    def __init__(self, sh):
    
        # Position
        self.Y = 250
        self.X = 80
        
        # Geschwindigkeit
        self.speedY = 0
        self.speedX = 20
        
        # Kräfte
        self.forceX = 0.0 
        self.forceY = 0.0

        self.ticks = 0
        self.flap = 0

class Pipe:

    def __init__(self, pos,  height, gap, sh):
        
        # Höhe der Säulen
        self.height = height
        
        # Lücke zwischen Säulen
        self.gap = gap
        
        # Position
        self.pos = pos
 
'''

In [None]:
# Implementiere hier die Architektur deines neuronalen Netzes und
# erzeuge anschließend ein Objekt davon.
# Das erzeugte Objekt soll 'net' heißen.


In [None]:
# Wähle hier sinnvolle Zahlen für die Variablen.

POPULATIONSGROESSE = # Füge hier deinen Code ein.
ANZAHL_TOP_K_VOEGEL = # Füge hier deinen Code ein. 
MUTATIONSSTAERKE = # Füge hier deinen Code ein.

In [None]:
# Analog zu oben, kannst du hier die y-Kraft festlegen.
def birdAction(eingabe, bird):
        YFORCE = # Füge hier deinen Code ein.
        bird.forceY = YFORCE * eingabe[0]

def computeReward(state_old, state_new):
    return 1

# Analog zu oben, kannst du hier die Säulenparameter ändern.
sauelen_distanz = # Füge hier deinen Code ein.
sauelen_hoehe = # Füge hier deinen Code ein.
saulen_luecke = # Füge hier deinen Code ein.

In [None]:
# Durch die Ausführung dieses Codefelds startest du das Spiel.

Score_Max = 4000
fittestBirds = []

# Hier wird die Environment eingerichtet.
env = gym.make("scienceCampBird-v1")
env.setPipeIntervals([sauelen_distanz, sauelen_hoehe, saulen_luecke])
population = gen.Population(POPULATIONSGROESSE, 5, 2, computeReward, net)
env.setAction(birdAction)
population.evaluate_on_env(env,generateFeatures, Score_Max)
k_te_generation = 0  
punktzahl_der_besten_voegel = []

while True:
    population = gen.mutate_population(population, ANZAHL_TOP_K_VOEGEL, MUTATIONSSTAERKE)
    population.evaluate_on_env(env, generateFeatures, Score_Max)
    fittestBirds.append(population.population[0])
    k_te_generation +=1
    if(k_te_generation % 5 == 0):
        print("evaluaton")
        net = population.population[0][1]
        score_e = population.population[0][0]
        score_p = env.playWithNet(net, generateFeatures, Score_Max, computeReward, k_te_generation)
        print("----------------------------------------------------------------------------")
        print("----------------------------------------------------------------------------")
        print('Generation: ', k_te_generation)
        print("____________________________________________________________________________")
        print('Punktzahl Training: ', score_e, ' Punktzahl Spiel: ', score_p)
        print("____________________________________________________________________________")
       
    punktzahl_der_besten_voegel = [score[0] for score in fittestBirds]

In [None]:
# Mit dieser Funktion kannst du dir die beste Punktzahl
# der jeweiligen Generationen anzeigen lassen.

def beste_punktzahl(scores):
    fig, ax = plt.subplots()
    ax.plot(scores)
    ax.set(xlabel='Population', ylabel='Punktzahl',
    title='Punktzahl der besten Vögel der jeweiligen Population')
    ax.grid()
    plt.show()
    
beste_punktzahl(punktzahl_der_besten_voegel)

In [None]:
# Durch die Ausführung dieses Codefelds, kannst du den Vogel 
# deiner letzten Population fliegen lassen.

env = gym.make("scienceCampBird-v1")
env.setPipeIntervals([sauelen_distanz, sauelen_hoehe, saulen_luecke])
env.setAction(birdAction)

env.playWithNet(fittestBirds[-1][1], generateFeatures, Score_Max, computeReward, k_te_generation)

pygame.quit()