In [None]:
import gym
import copy
import numpy as np
import time as time
import torch
import torch.nn as nn
from flappyBird.io import *
import flappyBird.genetics as gen
from tensorboardX import SummaryWriter
import matplotlib.pyplot as plt
import math
import pygame
from pygame.locals import *
import warnings
warnings.filterwarnings('ignore')

# Das Spiel vorbereiten
## Animationen individualisieren
Lege hier die Animationen für dein Spiel fest. Die einzelnen Frames für den Spieler und den Hintergrund werden jeweils in Äbhängigkeit der angegebenen Zeit aneinander gereiht und so zu einer Animation. Die Farbe der Rohre wird als RGB-Wert angegeben.

Um eigene Animationen zu erstellen, kannst du [Piskel](https://www.piskelapp.com/) verwenden. Achte auf die richtige Größe deiner Sprites: 34 x 24 Pixel (Spieler) und 288 x 512 Pixel (Hintergrund).

In [None]:
# Animation für Spieler
setImgBird([
    'sprites/sparrow.png',
    'sprites/sparrow_flap.png'
],40)

In [None]:
# Animation für Hintergrund
setImgBg([
    'sprites/background-day.png',
    'sprites/background-night.png'
],400)

In [None]:
# Farbe der Rohre
setColorPipe(15,104,48)

In [None]:
# Abstand und Höhe der Rohre und Breite der Lücke festlegen
Interval_distance = [250, 350]
Interval_height = [100,300]
Interval_gap = [120,130]

## Feature extrahieren
Entscheide, welche Informationen über das Spiel der KI zur Verfügung gestellt werden sollen.
<details>
    <summary><b>🗠 Verfügbare Feature</b></summary>
    <img src="img/ingame.jpg" align="left" />
</details>

In [None]:
def generateFeatures(state):
    bird = state['bird']
    pipes = state['pipes']
    
    posY = bird.Y
    speedY = bird.speedY
    posPipe = pipes[0].pos
    pipeHeight = pipes[0].height
    pipeGap = pipes[0].gap
    
    return posY, speedY, posPipe, pipeHeight, pipeGap

# Die KI vorbereiten
## Das Neuronale Netz initialisieren
Initialisiere dein neuronales Netz. Überlege dir dazu, wie die Topologie deines Netzes aussehen soll und wie viele Inputs und Outputs du benötigst.

Hast du einmal ein neuronales Netz erzeugt, kannst du es exportieren, um den Zustand zu speichern, und dann auch importieren, um den Zustand wieder zu laden. Achte darauf, dass du dabei keine Zustände unbeabsichtigt überschreibst und ersetze `Mein-Name` durch deinen Namen.

<details>
    <summary>Layer</summary>
    
    nn.Linear(X, Y), Input dim X, Output dim Y
</details>
<details>
    <summary>Aktivierungsfunktionen</summary>
    
    nn.ReLU()
    nn.Sigmoid()
    nn.Softmax(dim=1))
</details>
<details>
    <summary>Topologie</summary>
    
    nn.Sequential(Layer, Aktivierungsfunktion, Layer, Aktivierungsfunktion...., Layer)
    
    z.B. nn.Sequential(nn.Linear(5, 5),nn.Sigmoid(),nn.Linear(5, 1))
</details>
<details>
    <summary>Weiterführende Links</summary>
    <a href="https://pytorch.org/docs/stable/nn.html#linear-layers">https://pytorch.org/docs/stable/nn.html#linear-layers</a><br>
    <a href="https://pytorch.org/docs/stable/generated/torch.nn.Sigmoid.html?highlight=sigmoid#torch.nn.Sigmoid">https://pytorch.org/docs/stable/generated/torch.nn.Sigmoid.html?highlight=sigmoid#torch.nn.Sigmoid</a>
</details>

In [None]:
# Netz erzeugen
net = nn.Sequential(nn.Linear(5, 5),nn.Sigmoid(),nn.Linear(5, 5),nn.Sigmoid(), nn.Linear(5, 1))

# Gespeichertes Netz laden
#net = torch.load('Mein-Name/net.pt')

# (trainiertes) Netz inkl. Sprites speichern
#export(net, "Mein-Name")

In [None]:
for name, param in net.named_parameters():
    print(name, param)

## Entscheidungen verarbeiten
Lege fest, wie der Vogel auf eine Entscheidung reagieren soll, d.h. wie er mit der Ausgabe des neuronalen Netzes umgehen soll.

In [None]:
# Du kannst die folgenden Befehle verwenden: bird.forceX, bird.forceY, bird.speedX, bird.speedY
def birdAction(decission, bird):
        bird.forceY = 50*decission[0]


## Belohnung festlegen
Lege fest, wie die Belohnungsstrategie aussehen soll.
<details>
    <summary><b>🗠 Reward</b></summary>
    <img src="img/ingame_2.jpg" align="left" />
</details>

In [None]:
def computeReward(state_old, state_new):
    return 1

## Die nächste Generation
Lege fest, wie die Vögel mutiert werden sollen, um die nächste Generation zu bilden.
<details>
    <summary><b>🗠 Mutation</b></summary>
    <img src="img/ingame_3.jpg" align="left" >
</details>

In [None]:
# Anzahl der Vögel in der Population
POPULATION_SIZE = 50

# Anzahl der besten Vögel, aus denen dann mutiert wird
PARENTS_COUNT = 10

# Mutationsstärke
NOISE_STD = 0.1     

# Die KI trainieren
Beginne nun mit dem Training. Mit `Score_Max` legst du fest, wann ein Trainingsvorgang spätestens beendet wird.

Mit `print_weights` und `print_plot` kannst du steuern, wie die Ausgabe während des Trainingprozesses aussieht.

In [None]:
Score_Max = 4000
print_weights = False
print_plot = True

def plot_scores(data, save=False, filename="plot.png"):
    if print_plot:
        fig, ax = plt.subplots()
        ax.plot(data)
    
        ax.set(xlabel='Population', ylabel='Score', title='Score des besten Vogels der Population')
        ax.grid()
        if save:
            fig.savefig(filename)
            print("saved",filename)
        plt.show()


In [None]:
fittestBirds = []

env = gym.make("scienceCampBird-v1")
env.setPipeIntervals([Interval_distance, Interval_height, Interval_gap])
population = gen.Population(POPULATION_SIZE, 5, 2, computeReward, net)
env.setAction(birdAction)
  #  print(len(population.nets))
population.evaluate_on_env(env, generateFeatures, Score_Max)
ecount = 0 

if not(print_plot or print_weights):
    print('|{:>12}|{:^25}|'.format('','Score'))
    print('|{:^12}|{:^12}|{:^12}|'.format('Population','Training','Spiel'))
    print('----------------------------------------')
    
while True:
    population = gen.mutate_population(population, PARENTS_COUNT, NOISE_STD)
    population.evaluate_on_env(env, generateFeatures, Score_Max)
    fittestBirds.append(population.population[0])
    ecount +=1
    if(ecount % 5 == 0):
        net = population.population[0][1]
        score_e = population.population[0][0]
        score_p = env.playWithNet(net, generateFeatures, Score_Max, computeReward, ecount)
        if print_weights or print_plot:
            print('--- Population ', ecount, '------------------------------------------------------------')
            print('Score Training: ', score_e, ' Score Spiel: ', score_p)
        else:
            print('|{:>11} |{:>11} |{:>11} |'.format(ecount, score_e, score_p))
        if print_weights:
            for name, param in net.named_parameters():
                print(name, param)
        scores = [score[0] for score in fittestBirds]
        plot_scores(scores)


In [None]:
# Lernkurve zeichnen und speichern:
# plot_scores(data, save=False, filename="plot.png")
plot_scores(scores,True)

In [None]:
# Parameter der besten Vögel der letzten Population anzeigen
i = 0
for bird in fittestBirds:
        i +=1
        net = bird[1]
        score_p = bird[0]
        print('--- Vogel', ecount, '-', i,'------------------------------------------------------------')
        print('Score Training: ', score_e, ' Score Spiel: ', score_p)
        for name, param in net.named_parameters():
            print(name, param)
        print()

In [None]:
# ohne Training weiterspielen
run(
    net,
    Interval_distance,
    Interval_height,
    Interval_gap,
    computeReward,
    birdAction,
    generateFeatures,
    1000000
)

In [None]:
# Netz exportieren
#export(net, 'Mein-Name')