# TetBot AI:
## Genetic Algorithm solution for Tetris

Tetris Source Code: https://github.com/ibrahimAtespare/tetris-python by IbrahimAtaspare

Das Spiel, die logik und die UI als solches wurde nicht von uns Programmiert.
TetBot AI hat die anbindung dieses Environments zu einer KI erstellt und alle damit verbundene Logik

#### Quellen:

1. https://en.wikipedia.org/wiki/Genetic_algorithm


2. https://www.youtube.com/watch?v=pXTfgw9A08w


3. https://github.com/nuno-faria/tetris-ai


4. https://codemyroad.wordpress.com/2013/04/14/tetris-ai-the-near-perfect-player/


5. https://www.cologne-intelligence.de/blog/genetische-algorithmen#:~:text=Genetische%20Algorithmen%20sind%20Methoden%20zur,Fortpflanzung%20von%20nat%C3%BCrlichen%20Lebewesen%20orientieren.


6. https://medium.com/mlearning-ai/reinforcement-learning-on-tetris-707f75716c37


7. https://www.youtube.com/watch?v=ptUXxWumxfE


8. https://www.youtube.com/watch?v=1yXBNKubb2o


9. https://www.youtube.com/watch?v=LGNiWRhuIoA


10. https://pub.towardsai.net/genetic-algorithm-ga-introduction-with-example-code-e59f9bc58eaf


11. https://github.com/mbrenman/TetrisPlayground


12. https://sourcecodehero.com/tetris-game-in-python-with-source-code/ 



### Git Anbindung über GitHub CLI

Um GitHub CLI zu Installieren:
command "conda install -c conda-forge gh" in Conda Shell executen

In [None]:
# GIT HELP
# https://blog.reviewnb.com/github-jupyter-notebook/
# https://docs.github.com/en/get-started/getting-started-with-git/caching-your-github-credentials-in-git
# https://github.com/cli/cli#installation

# Create repo online in git hub and get the url
!git help

##### Zur Remote GitHub Repository Verbinden

* Git verbindung herstellen: run command "gh auth login" 
* Dann den Anweisungen folgen (GitHub.de, HTTPS, Authenticate over Website)

In [None]:
# Git Set Up

# TO ENABLE GIT:
# Authenticate GitHub Account through installing GitHub CLI in the Conda Shell
# then run command: gh auth login
# Follow the Instruction

# Git is now enabled


!echo "# TetBot_Genetic_Algorithm" >> README.md
!git init
!git add Tetris_Genetic_Algroithm.ipynb
!git commit -m "first commit"
!git branch -M main
!git remote add origin https://github.com/R290797/TetBot_Genetic_Algorithm.git
!git push -u origin main

##### Daten zum commit Hinzudügen

In [None]:
# Once you have the Training Data, add it to the Repository
!git add Training_Data

##### Commit and Push

In [None]:
# Commit and Push
!git commit -m "Formatted notebook"

In [None]:
!git push -u origin


------
Programmierung der KI und des Environments beginnt hier:

#### Import Dependancies

Wir benötigen:
* Pygame für die visuelle räpresentation des spiels
* Random und Math für Zufalls Operationen
* numpy für Array Multiplikationen
* CSV für die Erstellung und Speicherung der Trainings Daten


In [None]:
import pygame  # version 1.9.3
import random
import math
import sys
import numpy as np
import csv

##### Grundeinstellungen der Umgebung

Als erstes müssen Grundeinstellungen für die Logik des Tetrisspiels festgelegt werden.
Diese sind zum Großteil aus dem source code.
FÜr die Funktionalität ist das einzige die pieceValue Dictionary, welches den pieceNames einen Zahlen wert gibt damit wir später damit leichter arbeiten können

In [None]:
pygame.init()
pygame.font.init()

DISPLAY_WIDTH = 800
DISPLAY_HEIGHT = 600

gameDisplay = pygame.display.set_mode((DISPLAY_WIDTH, DISPLAY_HEIGHT))
pygame.display.set_caption('Tetris')
clock = pygame.time.Clock()

pieceNames = ('I', 'O', 'T', 'S', 'Z', 'J', 'L')

# Dictionary which assigns numerical values to the piece types for easier interpretation in the matrix
pieceValue = {'I': 1, 'O': 2, 'T': 3, 'S': 4, 'Z': 5, 'J': 6, 'L': 7}

# Inverse of the pieceValue dictionary
inv_pieceValue = {v: k for k, v in pieceValue.items()}

STARTING_LEVEL = 0  # Change this to start a new game at a higher level

MOVE_PERIOD_INIT = 4  # Piece movement speed when up/right/left arrow keys are pressed (Speed is defined as frame count. Game is 60 fps)

CLEAR_ANI_PERIOD = 4  # Line clear animation speed
SINE_ANI_PERIOD = 120  # Sine blinking effect speed

# Font sizes
SB_FONT_SIZE = 29
FONT_SIZE_SMALL = 17
PAUSE_FONT_SIZE = 66
GAMEOVER_FONT_SIZE = 66
TITLE_FONT_SIZE = 70
VERSION_FONT_SIZE = 20

fontSB = pygame.font.SysFont('agencyfb', SB_FONT_SIZE)
fontSmall = pygame.font.SysFont('agencyfb', FONT_SIZE_SMALL)
fontPAUSE = pygame.font.SysFont('agencyfb', PAUSE_FONT_SIZE)
fontGAMEOVER = pygame.font.SysFont('agencyfb', GAMEOVER_FONT_SIZE)
fontTitle = pygame.font.SysFont('agencyfb', TITLE_FONT_SIZE)
fontVersion = pygame.font.SysFont('agencyfb', VERSION_FONT_SIZE)

ROW = (0)
COL = (1)

# Some color definitions
BLACK = (0, 0, 0)
WHITE = (255, 255, 255)
DARK_GRAY = (80, 80, 80)
GRAY = (110, 110, 110)
LIGHT_GRAY = (150, 150, 150)
BORDER_COLOR = GRAY
NUM_COLOR = WHITE
TEXT_COLOR = GRAY

blockColors = {
    'I': (19, 232, 232),  # CYAN
    'O': (236, 236, 14),  # YELLOW
    'T': (126, 5, 126),  # PURPLE
    'S': (0, 128, 0),  # GREEN
    'Z': (236, 14, 14),  # RED
    'J': (30, 30, 201),  # BLUE
    'L': (240, 110, 2)}  # ORANGE

# Initial(spawn) block definitons of each piece
pieceDefs = {
    'I': ((1, 0), (1, 1), (1, 2), (1, 3)),
    'O': ((0, 1), (0, 2), (1, 1), (1, 2)),
    'T': ((0, 1), (1, 0), (1, 1), (1, 2)),
    'S': ((0, 1), (0, 2), (1, 0), (1, 1)),
    'Z': ((0, 0), (0, 1), (1, 1), (1, 2)),
    'J': ((0, 0), (1, 0), (1, 1), (1, 2)),
    'L': ((0, 2), (1, 0), (1, 1), (1, 2))}

directions = {
    'down': (1, 0),
    'right': (0, 1),
    'left': (0, -1),
    'downRight': (1, 1),
    'downLeft': (1, -1),
    'noMove': (0, 0)}

# Set Level speeds to 99999 to ensure the piece does not drop/make the piece fall throughout the game
# To make the AI Work
levelSpeeds = (999999999, 999999999, 999999999, 999999999, 999999999, 999999999, 999999999, 999999999, 999999999, 999999999, 999999999, 9999, 999999999, 999999999, 999999999, 999999999, 999999999, 999999999, 999999999, 999999999, 999999999, 999999999, 999999999, 999999999, 999999999, 999999999, 999999999, 999999999, 999999999)

# The speed of the moving piece at each level. Level speeds are defined as levelSpeeds[level]
# Each 10 cleared lines means a level up.
# After level 29, speed is always 1. Max level is 99

baseLinePoints = (0, 40, 100, 300, 1200)


# Total score is calculated as: Score = level*baseLinePoints[clearedLineNumberAtATime] + totalDropCount
# Drop means the action the player forces the piece down instead of free fall(By key combinations: down, down-left, down-rigth arrows)


##### GameKeyInput Handler
Für die KI unwichtig, ein Artefakt der Spieler Logik für das Tetris Spiel. Da dass Tetris Spiel über die KI gesteuert wird benötigen wir diese Klasse für die KI nicht. Wird beibehalten um mögliche Probleme mit dependancies in der Spiellogik zu vermeiden.

In [None]:
# Class for the game input keys and their status
class GameKeyInput:

    def __init__(self):
        self.xNav = self.KeyName('idle', False)  # 'left' 'right'
        self.down = self.KeyName('idle', False)  # 'pressed' 'released'
        self.rotate = self.KeyName('idle', False)  # 'pressed' //KEY UP
        self.cRotate = self.KeyName('idle', False)  # 'pressed' //KEY Z
        self.enter = self.KeyName('idle', False)  # 'pressed' //KEY Enter
        self.pause = self.KeyName('idle', False)  # 'pressed' //KEY P
        self.restart = self.KeyName('idle', False)  # 'pressed' //KEY R

        # Code a hard drop
        self.hardDrop = self.KeyName('idle', False)  # 'pressed' //KEY SPACE

    class KeyName:

        def __init__(self, initStatus, initTrig):
            self.status = initStatus
            self.trig = initTrig

##### GameClock

Klasse wird benutzt für das bearbeiten der Spiel Zeit und Frames. Hier wurde es abgeändert damit das Stück welches grade bewegt wird nicht fällt sondern immer oben im Spielfeld bleibt. 

In [None]:
# Class for the game's timing events
class GameClock:

    def __init__(self):
        self.frameTick = 0  # The main clock tick of the game, increments at each frame (1/60 secs, 60 fps) 
        
        # For AI Timing increased to 200 Fps (For faster computation...)
        
        self.pausedMoment = 0
        self.move = self.TimingType(MOVE_PERIOD_INIT)  # Drop and move(right and left) timing object
        #self.fall = self.TimingType(levelSpeeds[STARTING_LEVEL])  # Free fall timing object
        self.fall = self.TimingType(0)
        self.clearAniStart = 0

    class TimingType:

        def __init__(self, framePeriod):
            self.preFrame = 0
            self.framePeriod = framePeriod

        def check(self, frameTick):
            if frameTick - self.preFrame > self.framePeriod - 1:
                self.preFrame = frameTick
                return True
            return False

    def pause(self):
        self.pausedMoment = self.frameTick

    def unpause(self):
        self.frameTick = self.pausedMoment

    def restart(self):
        self.frameTick = 0
        self.pausedMoment = 0
        self.move = self.TimingType(MOVE_PERIOD_INIT)
        self.fall = self.TimingType(levelSpeeds[STARTING_LEVEL])
        self.clearAniStart = 0

    def update(self):
        self.frameTick = self.frameTick + 1

#### Mainboard

Mainboard ist die schnittstelle zwischen Spiellogik und KI. Diese Klasse enthält alle Informationen über den zustand des Spieles und des Spielfeldes

* MainBoard.piece => Das Tetromino welches grade bewegt wird
* MainBoard.blockMat => Tetrisspielfeld in Matrix form

* MainBoard.score => Punktestand des jeztigen Spiels
* MainBoard.lines => Anzahl der geclearten lines im jetzigen Speil

----

2 Hilfsfunktionen implementiert:

* MainBoard.set_blockMat(blockMat)
    * Funktion welche die BlockMat (Spielfeld Matrix) des MainBoards zu der in den Parametern übergeben BlockMat ändert
   
* MainBoard.set_piece(piece)
    * Funktion welches den sich im Spiel befindenden Tetromino (Der Spielstein welcher grade bewegt wird) zu dem übergebenen Tetromino (piece) ändert.

In [None]:
# Class for all the game mechanics, visuals and events
class MainBoard:

    def __init__(self, blockSize, xPos, yPos, colNum, rowNum, boardLineWidth, blockLineWidth, scoreBoardWidth):

        # Size and position initiations
        self.blockSize = blockSize
        self.xPos = xPos
        self.yPos = yPos
        self.colNum = colNum
        self.rowNum = rowNum
        self.boardLineWidth = boardLineWidth
        self.blockLineWidth = blockLineWidth
        self.scoreBoardWidth = scoreBoardWidth

        self.position_values = np.full((4, 10), np.NINF)

        # Matrix that contains all the existing blocks in the game board, except the moving piece
        self.blockMat = [['empty'] * colNum for i in range(rowNum)]

        self.piece = MovingPiece(colNum, rowNum, 'uncreated')

        self.lineClearStatus = 'idle'  # 'clearRunning' 'clearFin'
        self.clearedLines = [-1, -1, -1, -1]

        self.gameStatus = 'firstStart'  # 'running' 'gameOver'
        self.gamePause = False
        self.nextPieces = ['I', 'I']

        self.score = 0
        self.level = STARTING_LEVEL
        self.lines = 0

    def get_level(self):
        return self.level

    def get_height(self):
        return self.lines

    def get_mainBoard_pos(self, row, col):
        return self.blockMat[row][col]

    # Assisstance Functions for the AI
    
    #  Help to create the blockMat for the next piece (look ahead piece)
    def set_blockmat(self, new_blockmat):
        self.blockMat = new_blockmat
        
    # Help to set the piece of the next blockMat
    def set_piece(self, new_piece):
        self.piece = new_piece

    def restart(self):
        self.blockMat = [['empty'] * self.colNum for i in range(self.rowNum)]

        self.piece = MovingPiece(self.colNum, self.rowNum, 'uncreated')

        self.lineClearStatus = 'idle'
        self.clearedLines = [-1, -1, -1, -1]
        gameClock.fall.preFrame = gameClock.frameTick
        self.generateNextTwoPieces()
        self.gameStatus = 'running'
        self.gamePause = False

        self.score = 0
        self.level = STARTING_LEVEL
        self.lines = 0

        gameClock.restart()

    def get_piece(self):
        return self.piece

    def erase_BLOCK(self, xRef, yRef, row, col):
        pygame.draw.rect(gameDisplay, BLACK,
                         [xRef + (col * self.blockSize), yRef + (row * self.blockSize), self.blockSize, self.blockSize],
                         0)

    def draw_BLOCK(self, xRef, yRef, row, col, color):
        pygame.draw.rect(gameDisplay, BLACK,
                         [xRef + (col * self.blockSize), yRef + (row * self.blockSize), self.blockSize,
                          self.blockLineWidth], 0)
        pygame.draw.rect(gameDisplay, BLACK, [xRef + (col * self.blockSize) + self.blockSize - self.blockLineWidth,
                                              yRef + (row * self.blockSize), self.blockLineWidth, self.blockSize], 0)
        pygame.draw.rect(gameDisplay, BLACK,
                         [xRef + (col * self.blockSize), yRef + (row * self.blockSize), self.blockLineWidth,
                          self.blockSize], 0)
        pygame.draw.rect(gameDisplay, BLACK, [xRef + (col * self.blockSize),
                                              yRef + (row * self.blockSize) + self.blockSize - self.blockLineWidth,
                                              self.blockSize, self.blockLineWidth], 0)

        pygame.draw.rect(gameDisplay, color, [xRef + (col * self.blockSize) + self.blockLineWidth,
                                              yRef + (row * self.blockSize) + self.blockLineWidth,
                                              self.blockSize - (2 * self.blockLineWidth),
                                              self.blockSize - (2 * self.blockLineWidth)], 0)

    def draw_GAMEBOARD_BORDER(self):
        pygame.draw.rect(gameDisplay, BORDER_COLOR, [self.xPos - self.boardLineWidth - self.blockLineWidth,
                                                     self.yPos - self.boardLineWidth - self.blockLineWidth,
                                                     (self.blockSize * self.colNum) + (2 * self.boardLineWidth) + (
                                                             2 * self.blockLineWidth), self.boardLineWidth], 0)
        pygame.draw.rect(gameDisplay, BORDER_COLOR, [self.xPos + (self.blockSize * self.colNum) + self.blockLineWidth,
                                                     self.yPos - self.boardLineWidth - self.blockLineWidth,
                                                     self.boardLineWidth,
                                                     (self.blockSize * self.rowNum) + (2 * self.boardLineWidth) + (
                                                             2 * self.blockLineWidth)], 0)
        pygame.draw.rect(gameDisplay, BORDER_COLOR, [self.xPos - self.boardLineWidth - self.blockLineWidth,
                                                     self.yPos - self.boardLineWidth - self.blockLineWidth,
                                                     self.boardLineWidth,
                                                     (self.blockSize * self.rowNum) + (2 * self.boardLineWidth) + (
                                                             2 * self.blockLineWidth)], 0)
        pygame.draw.rect(gameDisplay, BORDER_COLOR, [self.xPos - self.boardLineWidth - self.blockLineWidth,
                                                     self.yPos + (self.blockSize * self.rowNum) + self.blockLineWidth,
                                                     (self.blockSize * self.colNum) + (2 * self.boardLineWidth) + (
                                                             2 * self.blockLineWidth), self.boardLineWidth], 0)

    def draw_GAMEBOARD_CONTENT(self):

        if self.gameStatus == 'firstStart':

            titleText = fontTitle.render('TETRIS', False, WHITE)
            gameDisplay.blit(titleText, (self.xPos + +1.55 * self.blockSize, self.yPos + 8 * self.blockSize))

            versionText = fontVersion.render('v 1.0', False, WHITE)
            gameDisplay.blit(versionText, (self.xPos + +7.2 * self.blockSize, self.yPos + 11.5 * self.blockSize))

        else:

            for row in range(0, self.rowNum):
                for col in range(0, self.colNum):
                    if self.blockMat[row][col] == 'empty':
                        self.erase_BLOCK(self.xPos, self.yPos, row, col)
                    else:
                        self.draw_BLOCK(self.xPos, self.yPos, row, col, blockColors[self.blockMat[row][col]])

            if self.piece.status == 'moving':
                for i in range(0, 4):
                    self.draw_BLOCK(self.xPos, self.yPos, self.piece.blocks[i].currentPos.row,
                                    self.piece.blocks[i].currentPos.col, blockColors[self.piece.type])

            if self.gamePause == True:
                pygame.draw.rect(gameDisplay, DARK_GRAY,
                                 [self.xPos + 1 * self.blockSize, self.yPos + 8 * self.blockSize, 8 * self.blockSize,
                                  4 * self.blockSize], 0)
                pauseText = fontPAUSE.render('PAUSE', False, BLACK)
                gameDisplay.blit(pauseText, (self.xPos + +1.65 * self.blockSize, self.yPos + 8 * self.blockSize))

            if self.gameStatus == 'gameOver':
                pygame.draw.rect(gameDisplay, LIGHT_GRAY,
                                 [self.xPos + 1 * self.blockSize, self.yPos + 8 * self.blockSize, 8 * self.blockSize,
                                  8 * self.blockSize], 0)
                gameOverText0 = fontGAMEOVER.render('GAME', False, BLACK)
                gameDisplay.blit(gameOverText0, (self.xPos + +2.2 * self.blockSize, self.yPos + 8 * self.blockSize))
                gameOverText1 = fontGAMEOVER.render('OVER', False, BLACK)
                gameDisplay.blit(gameOverText1, (self.xPos + +2.35 * self.blockSize, self.yPos + 12 * self.blockSize))

    def draw_SCOREBOARD_BORDER(self):
        pygame.draw.rect(gameDisplay, BORDER_COLOR, [self.xPos + (self.blockSize * self.colNum) + self.blockLineWidth,
                                                     self.yPos - self.boardLineWidth - self.blockLineWidth,
                                                     self.scoreBoardWidth + self.boardLineWidth, self.boardLineWidth],
                         0)
        pygame.draw.rect(gameDisplay, BORDER_COLOR, [self.xPos + (
                self.blockSize * self.colNum) + self.boardLineWidth + self.blockLineWidth + self.scoreBoardWidth,
                                                     self.yPos - self.boardLineWidth - self.blockLineWidth,
                                                     self.boardLineWidth,
                                                     (self.blockSize * self.rowNum) + (2 * self.boardLineWidth) + (
                                                             2 * self.blockLineWidth)], 0)
        pygame.draw.rect(gameDisplay, BORDER_COLOR, [self.xPos + (self.blockSize * self.colNum) + self.blockLineWidth,
                                                     self.yPos + (self.blockSize * self.rowNum) + self.blockLineWidth,
                                                     self.scoreBoardWidth + self.boardLineWidth, self.boardLineWidth],
                         0)

    def draw_SCOREBOARD_CONTENT(self):

        xPosRef = self.xPos + (self.blockSize * self.colNum) + self.boardLineWidth + self.blockLineWidth
        yPosRef = self.yPos
        yLastBlock = self.yPos + (self.blockSize * self.rowNum)

        if self.gameStatus == 'running':
            nextPieceText = fontSB.render('next:', False, TEXT_COLOR)
            gameDisplay.blit(nextPieceText, (xPosRef + self.blockSize, self.yPos))

            blocks = [[0, 0], [0, 0], [0, 0], [0, 0]]
            origin = [0, 0]
            for i in range(0, 4):
                blocks[i][ROW] = origin[ROW] + pieceDefs[self.nextPieces[1]][i][ROW]
                blocks[i][COL] = origin[COL] + pieceDefs[self.nextPieces[1]][i][COL]

                if self.nextPieces[1] == 'O':
                    self.draw_BLOCK(xPosRef + 0.5 * self.blockSize, yPosRef + 2.25 * self.blockSize, blocks[i][ROW],
                                    blocks[i][COL], blockColors[self.nextPieces[1]])
                elif self.nextPieces[1] == 'I':
                    self.draw_BLOCK(xPosRef + 0.5 * self.blockSize, yPosRef + 1.65 * self.blockSize, blocks[i][ROW],
                                    blocks[i][COL], blockColors[self.nextPieces[1]])
                else:
                    self.draw_BLOCK(xPosRef + 1 * self.blockSize, yPosRef + 2.25 * self.blockSize, blocks[i][ROW],
                                    blocks[i][COL], blockColors[self.nextPieces[1]])

            if self.gamePause == False:
                pauseText = fontSmall.render('P -> pause', False, WHITE)
                gameDisplay.blit(pauseText, (xPosRef + 1 * self.blockSize, yLastBlock - 15 * self.blockSize))
            else:
                unpauseText = fontSmall.render('P -> unpause', False, self.whiteSineAnimation())
                gameDisplay.blit(unpauseText, (xPosRef + 1 * self.blockSize, yLastBlock - 15 * self.blockSize))

            restartText = fontSmall.render('R -> restart', False, WHITE)
            gameDisplay.blit(restartText, (xPosRef + 1 * self.blockSize, yLastBlock - 14 * self.blockSize))

        else:

            yBlockRef = 0.3
            text0 = fontSB.render('press', False, self.whiteSineAnimation())
            gameDisplay.blit(text0, (xPosRef + self.blockSize, self.yPos + yBlockRef * self.blockSize))
            text1 = fontSB.render('enter', False, self.whiteSineAnimation())
            gameDisplay.blit(text1, (xPosRef + self.blockSize, self.yPos + (yBlockRef + 1.5) * self.blockSize))
            text2 = fontSB.render('to', False, self.whiteSineAnimation())
            gameDisplay.blit(text2, (xPosRef + self.blockSize, self.yPos + (yBlockRef + 3) * self.blockSize))
            if self.gameStatus == 'firstStart':
                text3 = fontSB.render('start', False, self.whiteSineAnimation())
                gameDisplay.blit(text3, (xPosRef + self.blockSize, self.yPos + (yBlockRef + 4.5) * self.blockSize))
            else:
                text3 = fontSB.render('restart', False, self.whiteSineAnimation())
                gameDisplay.blit(text3, (xPosRef + self.blockSize, self.yPos + (yBlockRef + 4.5) * self.blockSize))

        pygame.draw.rect(gameDisplay, BORDER_COLOR,
                         [xPosRef, yLastBlock - 12.5 * self.blockSize, self.scoreBoardWidth, self.boardLineWidth], 0)

        scoreText = fontSB.render('score:', False, TEXT_COLOR)
        gameDisplay.blit(scoreText, (xPosRef + self.blockSize, yLastBlock - 12 * self.blockSize))
        scoreNumText = fontSB.render(str(self.score), False, NUM_COLOR)
        gameDisplay.blit(scoreNumText, (xPosRef + self.blockSize, yLastBlock - 10 * self.blockSize))

        levelText = fontSB.render('level:', False, TEXT_COLOR)
        gameDisplay.blit(levelText, (xPosRef + self.blockSize, yLastBlock - 8 * self.blockSize))
        levelNumText = fontSB.render(str(self.level), False, NUM_COLOR)
        gameDisplay.blit(levelNumText, (xPosRef + self.blockSize, yLastBlock - 6 * self.blockSize))

        linesText = fontSB.render('lines:', False, TEXT_COLOR)
        gameDisplay.blit(linesText, (xPosRef + self.blockSize, yLastBlock - 4 * self.blockSize))
        linesNumText = fontSB.render(str(self.lines), False, NUM_COLOR)
        gameDisplay.blit(linesNumText, (xPosRef + self.blockSize, yLastBlock - 2 * self.blockSize))

    # All the screen drawings occurs in this function, called at each game loop iteration
    def draw(self):

        self.draw_GAMEBOARD_BORDER()
        self.draw_SCOREBOARD_BORDER()

        self.draw_GAMEBOARD_CONTENT()
        self.draw_SCOREBOARD_CONTENT()

    def whiteSineAnimation(self):

        sine = math.floor(255 * math.fabs(math.sin(2 * math.pi * (gameClock.frameTick / (SINE_ANI_PERIOD * 2)))))
        # sine = 127 + math.floor(127 * math.sin(2*math.pi*(gameClock.frameTick/SINE_ANI_PERIOD)))
        sineEffect = [sine, sine, sine]
        return sineEffect

    def lineClearAnimation(self):

        clearAniStage = math.floor((gameClock.frameTick - gameClock.clearAniStart) / CLEAR_ANI_PERIOD)
        halfCol = math.floor(self.colNum / 2)
        if clearAniStage < halfCol:
            for i in range(0, 4):
                if self.clearedLines[i] >= 0:
                    self.blockMat[self.clearedLines[i]][(halfCol) + clearAniStage] = 'empty'
                    self.blockMat[self.clearedLines[i]][(halfCol - 1) - clearAniStage] = 'empty'
        else:
            self.lineClearStatus = 'cleared'

    def dropFreeBlocks(self):  # Drops down the floating blocks after line clears occur

        for cLIndex in range(0, 4):
            if self.clearedLines[cLIndex] >= 0:
                for rowIndex in range(self.clearedLines[cLIndex], 0, -1):
                    for colIndex in range(0, self.colNum):
                        self.blockMat[rowIndex + cLIndex][colIndex] = self.blockMat[rowIndex + cLIndex - 1][colIndex]

                for colIndex in range(0, self.colNum):
                    self.blockMat[0][colIndex] = 'empty'

    def getCompleteLines(self):  # Returns index list(length of 4) of cleared lines(-1 if not assigned as cleared line)

        clearedLines = [-1, -1, -1, -1]
        cLIndex = -1
        rowIndex = self.rowNum - 1

        while rowIndex >= 0:
            for colIndex in range(0, self.colNum):
                if self.blockMat[rowIndex][colIndex] == 'empty':
                    rowIndex = rowIndex - 1
                    break
                if colIndex == self.colNum - 1:
                    cLIndex = cLIndex + 1
                    clearedLines[cLIndex] = rowIndex
                    rowIndex = rowIndex - 1

        if cLIndex >= 0:
            gameClock.clearAniStart = gameClock.frameTick
            self.lineClearStatus = 'clearRunning'
        else:
            self.prepareNextSpawn()

        return clearedLines

    def prepareNextSpawn(self):
        self.generateNextPiece()
        self.lineClearStatus = 'idle'
        self.piece.status = 'uncreated'

    def generateNextTwoPieces(self):
        self.nextPieces[0] = pieceNames[random.randint(0, 6)]
        self.nextPieces[1] = pieceNames[random.randint(0, 6)]
        self.piece.type = self.nextPieces[0]

    def generateNextPiece(self):
        self.nextPieces[0] = self.nextPieces[1]
        self.nextPieces[1] = pieceNames[random.randint(0, 6)]
        self.piece.type = self.nextPieces[0]

    def checkAndApplyGameOver(self):
        if self.piece.gameOverCondition == True:
            self.gameStatus = 'gameOver'
            for i in range(0, 4):
                if self.piece.blocks[i].currentPos.row >= 0 and self.piece.blocks[i].currentPos.col >= 0:
                    self.blockMat[self.piece.blocks[i].currentPos.row][
                        self.piece.blocks[i].currentPos.col] = self.piece.type

    def updateScores(self):

        clearedLinesNum = 0
        for i in range(0, 4):
            if self.clearedLines[i] > -1:
                clearedLinesNum = clearedLinesNum + 1

        self.score = self.score + (self.level + 1) * baseLinePoints[clearedLinesNum] + self.piece.dropScore
        if self.score > 999999:
            self.score = 999999
        self.lines = self.lines + clearedLinesNum
        self.level = STARTING_LEVEL + math.floor(self.lines / 10)
        if self.level > 99:
            self.level = 99

    def updateSpeed(self):

        #if self.level < 29:
            #gameClock.fall.framePeriod = levelSpeeds[self.level]
        #else:
            #gameClock.fall.framePeriod = 1

        #if gameClock.fall.framePeriod < 4:
            #gameClock.fall.framePeriod = gameClock.move.framePeriod
            
        print("Game Speed will not be updated")

    # All the game events and mechanics are placed in this function, called at each game loop iteration
    def gameAction(self):

        if self.gameStatus == 'firstStart':
            if key.enter.status == 'pressed':
                self.restart()

        elif self.gameStatus == 'running':

            if key.restart.trig == True:
                self.restart()
                key.restart.trig = False

            if self.gamePause == False:

                self.piece.move(self.blockMat)
                self.checkAndApplyGameOver()

                if key.pause.trig == True:
                    gameClock.pause()
                    self.gamePause = True
                    key.pause.trig = False

                if self.gameStatus != 'gameOver':
                    if self.piece.status == 'moving':
                        if key.rotate.trig == True:
                            self.piece.rotate('CW')
                            key.rotate.trig = False

                        if key.cRotate.trig == True:
                            self.piece.rotate('cCW')
                            key.cRotate.trig = False

                    elif self.piece.status == 'collided':
                        if self.lineClearStatus == 'idle':
                            for i in range(0, 4):
                                self.blockMat[self.piece.blocks[i].currentPos.row][
                                    self.piece.blocks[i].currentPos.col] = self.piece.type
                            self.clearedLines = self.getCompleteLines()
                            self.updateScores()
                            self.updateSpeed()
                        elif self.lineClearStatus == 'clearRunning':
                            self.lineClearAnimation()
                        else:  # 'clearFin'
                            self.dropFreeBlocks()
                            self.prepareNextSpawn()

            else:  # self.gamePause = False
                if key.pause.trig == True:
                    # TODO Maybe permanently pause the game?
                    gameClock.unpause()
                    self.gamePause = False
                    key.pause.trig = False

        else:  # 'gameOver'
            if key.enter.status == 'pressed':
                self.restart()


##### MovingPiece 

In dieser Klasse befindet sich die Logik zu dem Tetromino welches grade bewegt wird (Der Spielstein welchen man platziert).

Ein Objekt der Klasse Moving piece besteht aus 4 Weiteren Objekten namens "Moving Blocks". Die Position des MovingPiece wird über die Positionen der einzelnen MovingBlocks definiert. 

Wichtige Attribute/Funktionen für die implentierung der KI innerhalb der MovingBlock klasse:
* MovingPiece.blockMat => Spielfeld Matrix mit MovingPiece


* MovingPiece.blocks => Ein Array bestehen aus den MovingBlocks aus welchem das MovingPiece besteht


* MovingPiece.status => Status in dem sich das MovingPiece befindet
    * Für die KI relevante Stati: "moving", "Collided"
    
    
* MovingPiece.movCollisionCheck('direction') => Funktion welche True oder False wiedergibt, jenachdem ob das Stück mit einem anderen Stück oder dem Spielrand kollidieren würde wenn es sich in die angegebene Richtung bewegt (True wenn es kollidierent würde, False nicht)
    * Mögliche Richtungen: 'left', 'right', 'down'
    

* MovingPiece.rotCollisionCheck() => Funktion welche True oder false wiedergibt, jenachdem ob das stück bei einer Rotation mit einem anderen Stück oder dem Spielrand kollidieren würde. True wenn es kollidieren würde, False wenn nicht

----

In der MovingPiece Klasse wurden außerdem Extra funktionen hinzugefügt mit der der Spielstein bewegt werden kann.

* MovingPiece.move_piece_left() => Funktion welche versucht den Spielstein eine Position nach Links zu bewegen. Kann diese Aktion durchgeführt werden wird der Stein nach links bewegt und die Funktion returned True. Wenn die Bewegung nicht gemacht werden kann, da der Stein mit einem anderen oder dem Spielrand kollidiert wird die Aktion nicht ausgeführt und die Funktion returned False


* MovingPiece.move_piece_right() => Semantisch gleich wie move_piece_left(), bewegung nach rechts


* MovingPiece.move_piece_down() => Semantisch Gleich wie move_piece_left(), bewegung nach unten

* MovingPiece.rotate_piece() => Semantisch gleich wie die bewegungs funktionen, anstatt einer positions bewegung wird hier versucht den Spielstein zu rotieren


Weitere Implemtiere Hilfsfunktionen/Attribute für die KI:

* MovingPiece.get_block_positions() => returned die Coordinaten der MovingBlocks aus denen das MovingPiece besteht, als array.

* MovingPiece.rotationOrientation => speichert die rotation in dem sich der Spielstein befindet als numerischen wert
    * Mögliche werte 0 - 3 (Insgesamt 4 mögliche Orientations)



   

In [None]:
# Class for all the definitions of current moving piece
class MovingPiece:

    def __init__(self, colNum, rowNum, status):

        self.colNum = colNum
        self.rowNum = rowNum

        # Save the orientation of the piece (always a modulo of 4)
        self.rotation_orientation = 0
        
        # for max positioning, initiate a movement variable
        self.movingRight = True
        self.movingLeft = False

        self.blockMat = [['empty'] * colNum for i in range(rowNum)]

        self.blocks = []
        for i in range(0, 4):
            self.blocks.append(MovingBlock())

        self.currentDef = [[0] * 2 for i in range(4)]
        self.status = status  # 'uncreated' 'moving' 'collided'
        self.type = 'I'  # 'O', 'T', 'S', 'Z', 'J', 'L'

        self.gameOverCondition = False

        self.dropScore = 0
        self.lastMoveType = 'noMove'

    def get_blocks(self):
        return self.blocks

    def get_type(self):
        return self.type

    def get_status(self):
        return self.status

    def applyNextMove(self):
        for i in range(0, 4):
            self.blocks[i].currentPos.col = self.blocks[i].nextPos.col
            self.blocks[i].currentPos.row = self.blocks[i].nextPos.row

    # move the blocks a certain amount in a given direction (right = col+, left = col-, down = row+)
    def applyMove(self, row_move, col_move):
        for i in range(0, 4):
            self.blocks[i].currentPos.col += col_move
            self.blocks[i].currentPos.row += row_move

    def applyFastMove(self):

        if gameClock.move.check(gameClock.frameTick) == True:
            if self.lastMoveType == 'downRight' or self.lastMoveType == 'downLeft' or self.lastMoveType == 'down':
                self.dropScore = self.dropScore + 1
            self.applyNextMove()

    def slowMoveAction(self):

        if gameClock.fall.check(gameClock.frameTick) == True:
            if self.movCollisionCheck('down') == True:
                self.createNextMove('noMove')
                self.status = 'collided'
            else:
                self.createNextMove('down')
                self.applyNextMove()

    def set_collided(self):
        self.status = 'collided'

    def createNextMove(self, moveType):

        self.lastMoveType = moveType

        for i in range(0, 4):
            self.blocks[i].nextPos.row = self.blocks[i].currentPos.row + directions[moveType][ROW]
            self.blocks[i].nextPos.col = self.blocks[i].currentPos.col + directions[moveType][COL]

    def movCollisionCheck_BLOCK(self, dirType, blockIndex):
        if dirType == 'down':
            if (self.blocks[blockIndex].currentPos.row + 1 > self.rowNum - 1) or \
                    self.blockMat[self.blocks[blockIndex].currentPos.row + directions[dirType][ROW]][
                        self.blocks[blockIndex].currentPos.col + directions[dirType][COL]] != 'empty':
                return True
        else:
            if (((directions[dirType][COL]) * (self.blocks[blockIndex].currentPos.col + directions[dirType][COL])) > (
                    ((self.colNum - 1) + (directions[dirType][COL]) * (self.colNum - 1)) / 2) or
                    self.blockMat[self.blocks[blockIndex].currentPos.row + directions[dirType][ROW]][
                        self.blocks[blockIndex].currentPos.col + directions[dirType][COL]] != 'empty'):
                return True
        return False

    def movCollisionCheck(self, dirType):  # Collision check for next move
        for i in range(0, 4):
            if self.movCollisionCheck_BLOCK(dirType, i) == True:
                return True
        return False

    def rotCollisionCheck_BLOCK(self, blockCoor):
        if (blockCoor[ROW] > self.rowNum - 1 or blockCoor[ROW] < 0 or blockCoor[COL] > self.colNum - 1 or blockCoor[
            COL] < 0 or self.blockMat[blockCoor[ROW]][blockCoor[COL]] != 'empty'):
            return True
        return False

    def rotCollisionCheck(self, blockCoorList):  # Collision check for rotation
        for i in range(0, 4):
            if self.rotCollisionCheck_BLOCK(blockCoorList[i]) == True:
                return True
        return False

    def spawnCollisionCheck(self, origin):  # Collision check for spawn

        for i in range(0, 4):
            spawnRow = origin[ROW] + pieceDefs[self.type][i][ROW]
            spawnCol = origin[COL] + pieceDefs[self.type][i][COL]
            if spawnRow >= 0 and spawnCol >= 0:
                if self.blockMat[spawnRow][spawnCol] != 'empty':
                    return True
        return False

    def findOrigin(self):

        origin = [0, 0]
        origin[ROW] = self.blocks[0].currentPos.row - self.currentDef[0][ROW]
        origin[COL] = self.blocks[0].currentPos.col - self.currentDef[0][COL]
        return origin

    def rotate(self, rotationType):

        if self.type != 'O':
            tempBlocks = [[0] * 2 for i in range(4)]
            origin = self.findOrigin()

            if self.type == 'I':
                pieceMatSize = 4
            else:
                pieceMatSize = 3

            for i in range(0, 4):
                if rotationType == 'CW':
                    tempBlocks[i][ROW] = origin[ROW] + self.currentDef[i][COL]
                    tempBlocks[i][COL] = origin[COL] + (pieceMatSize - 1) - self.currentDef[i][ROW]
                else:
                    tempBlocks[i][COL] = origin[COL] + self.currentDef[i][ROW]
                    tempBlocks[i][ROW] = origin[ROW] + (pieceMatSize - 1) - self.currentDef[i][COL]

            if self.rotCollisionCheck(tempBlocks) == False:
                for i in range(0, 4):
                    self.blocks[i].currentPos.row = tempBlocks[i][ROW]
                    self.blocks[i].currentPos.col = tempBlocks[i][COL]
                    self.currentDef[i][ROW] = self.blocks[i].currentPos.row - origin[ROW]
                    self.currentDef[i][COL] = self.blocks[i].currentPos.col - origin[COL]

    def spawn(self):

        self.dropScore = 0

        origin = [0, 3]

        for i in range(0, 4):
            self.currentDef[i] = list(pieceDefs[self.type][i])

        spawnTry = 0
        while spawnTry < 2:
            if self.spawnCollisionCheck(origin) == False:
                break
            else:
                spawnTry = spawnTry + 1
                origin[ROW] = origin[ROW] - 1
                self.gameOverCondition = True
                self.status = 'collided'

        for i in range(0, 4):
            spawnRow = origin[ROW] + pieceDefs[self.type][i][ROW]
            spawnCol = origin[COL] + pieceDefs[self.type][i][COL]
            self.blocks[i].currentPos.row = spawnRow
            self.blocks[i].currentPos.col = spawnCol

    def move(self, lastBlockMat):

        if self.status == 'uncreated':
            self.status = 'moving'
            self.blockMat = lastBlockMat
            self.spawn()

        elif self.status == 'moving':

            if key.down.status == 'pressed':
                if key.xNav.status == 'right':
                    if self.movCollisionCheck('down') == True:
                        self.createNextMove('noMove')
                        self.status = 'collided'
                    elif self.movCollisionCheck('downRight') == True:
                        self.createNextMove('down')
                    else:
                        self.createNextMove('downRight')

                elif key.xNav.status == 'left':
                    if self.movCollisionCheck('down') == True:
                        self.createNextMove('noMove')
                        self.status = 'collided'
                    elif self.movCollisionCheck('downLeft') == True:
                        self.createNextMove('down')
                    else:
                        self.createNextMove('downLeft')

                else:  # 'idle'
                    if self.movCollisionCheck('down') == True:
                        self.createNextMove('noMove')
                        self.status = 'collided'
                    else:
                        self.createNextMove('down')

                self.applyFastMove()

            elif key.down.status == 'idle':
                if key.xNav.status == 'right':
                    if self.movCollisionCheck('right') == True:
                        self.createNextMove('noMove')
                    else:
                        self.createNextMove('right')
                elif key.xNav.status == 'left':
                    if self.movCollisionCheck('left') == True:
                        self.createNextMove('noMove')
                    else:
                        self.createNextMove('left')
                else:
                    self.createNextMove('noMove')

                self.applyFastMove()

                self.slowMoveAction()

            else:  # 'released'
                key.down.status = 'idle'
            # gameClock.fall.preFrame = gameClock.frameTick #Commented out because each seperate down key press and release creates a delay which makes the game easier

    # else: # 'collided'

    
    
    
    # AI Assistance functions

    # __________________________

    # attempt to move current piece to the left, if possible: move and return true, else: return false
    def move_piece_left(self):
        if self.movCollisionCheck('left') == True:
            self.createNextMove('noMove')
            self.applyNextMove()
            return False
        else:
            self.createNextMove('left')
            self.applyNextMove()
            return True

    # attempt to move current piece to the right, if possible: move and return true, else: return false
    def move_piece_right(self):
        if self.movCollisionCheck('right') == True:
            self.createNextMove('noMove')
            self.applyNextMove()
            return False
        else:
            self.createNextMove('right')
            self.applyNextMove()
            return True

    # attempt to rotate the piece, if possible: rotate and return true, else: return false
    def rotate_piece(self):

        tempBlocks = [[0] * 2 for i in range(4)]
        origin = self.findOrigin()

        if self.type == 'I':
            pieceMatSize = 4
        else:
            pieceMatSize = 3

        for i in range(0, 4):
            tempBlocks[i][ROW] = origin[ROW] + self.currentDef[i][COL]
            tempBlocks[i][COL] = origin[COL] + (pieceMatSize - 1) - self.currentDef[i][ROW]

        if self.rotCollisionCheck(tempBlocks) == False:
            self.rotate('CW')
            self.rotation_orientation += 1

            # by using modulo here, the same number will always refer to the same rotation orientation
            self.rotation_orientation = self.rotation_orientation % 4
            return True
        else:
            return False

    # attempt to move the piece down, if possible: move and return true, else: return false
    def move_piece_down(self):
        if self.movCollisionCheck('down') == True:
            self.createNextMove('noMove')
            self.status = 'collided'
            self.applyNextMove()
            return False
        else:
            self.createNextMove('down')
            self.applyNextMove()
            return True

    # returns the positions of the moving piece block as an 1D array of position [block1x, block1y, block2x, block2y, ....]
    def get_block_positions(self):

        block_positions = []

        for block in self.blocks:
            block_positions.append(block.currentPos.row)
            block_positions.append(block.currentPos.col)

        return np.array(block_positions)




##### MovingBlock

Klasse welches die Blöcke definiert aus dem ein MovingPiece besteht. Jedes MovingPiece besteht aus 4 MovingBlocks. Jeder MovingBlock speichert seine Position einzeln.

In [None]:
# Class for the blocks of the moving piece. Each piece is made of 4 blocks in Tetris game
class MovingBlock:

    def __init__(self):
        self.currentPos = self.CurrentPosClass(0, 0)
        self.nextPos = self.NextPosClass(0, 0)

    class CurrentPosClass:

        def __init__(self, row, col):
            self.row = row
            self.col = col

    class NextPosClass:

        def __init__(self, row, col):
            self.row = row
            self.col = col



---

#### KI Funktionen

Die Tetrisspiellogik ist nun weitestgehend Implementiert. Alle schnittstellen zu KI wurden über Hilfsfunktionen und Attribute hergestellt.

Es folgen nun die Implemntierungen der Hilfsfunktionen für den Späteren Algorithmus

---

#### get_BlockMat(mainBaord)

Funktion welches die Spielfeld Matrix der übergebenen MainBoard als Numpy Matrix returned.
In der Übergebenen Matrix befinden sich alle platzierten Tetrominoes, und der Tetromino der grade gespielt wird (Kontrolliert vom Spieler/Agenten)

In [None]:
# AI Assistance Function
# _________________________________________________________________________


# returns a matrix representation of the playing board
def get_Blockmat(mainBoard):
    # Init 2 Dimensional array
    blockMat = [[0 for c in range(10)] for r in range(20)]

    # Get the current blockMat
    for rows in range(len(mainBoard.blockMat)):
        for columns in range(len(mainBoard.blockMat[rows])):

            # if position is empty, insert a 0, else insert dict. value
            if mainBoard.get_mainBoard_pos(rows, columns) == "empty":
                blockMat[rows][columns] = 0
            else:
                blockMat[rows][columns] = pieceValue[mainBoard.get_mainBoard_pos(rows, columns)]

    # insert the moving block into the blockMat
    for blocks in mainBoard.piece.blocks:
        blockMat[blocks.currentPos.row][blocks.currentPos.col] = pieceValue[mainBoard.piece.type]

    # return the blockmat
    return np.matrix(blockMat)

#### get_Blockmat_onlyPiece(mainBoard)

Funktion welche die Spielfeld Matrix der übergenen MainBoard als Numpy Matrix returned. In der Matrix welche Returned wird sind nur die positionen des Spielsteins vertreten (nicht von den platzierten Steinen)

In [None]:
# returns the blockMat, but with only the moving piece
def get_Blockmat_onlyPiece(mainBoard):
    # Init 2 Dimensional array
    blockMat = [[0 for c in range(10)] for r in range(20)]

    # insert the moving block into the blockMat
    for blocks in mainBoard.piece.blocks:
        blockMat[blocks.currentPos.row][blocks.currentPos.col] = pieceValue[mainBoard.piece.get_type()]

    # return the blockMat
    return np.matrix(blockMat)


#### get_Blockmat_noPiece(mainBoard)

Funktion welches die Spielfeld Matrix der übergebenen Mainboard als Numpy Matrix returned. Die Matrix welche returned wird beinhaltet nur die Platzierten Steine (nicht den Spielstein - der der grade gespielt wird)

In [None]:
# returns the current Blockmat without the piece that is in play
def get_Blockmat_noPiece(mainBoard):
    # Init 2 Dimensional array
    blockMat = [[0 for c in range(10)] for r in range(20)]

    # Get the current blockMat
    for rows in range(len(mainBoard.blockMat)):
        for columns in range(len(mainBoard.blockMat[rows])):

            # if position is empty, insert a 0, else insert dict. value
            if mainBoard.get_mainBoard_pos(rows, columns) == "empty":
                blockMat[rows][columns] = 0
            else:
                blockMat[rows][columns] = pieceValue[mainBoard.get_mainBoard_pos(rows, columns)]

    # return the blockMat
    return np.matrix(blockMat)


## Kernstück der KI Logik

die Nächste funktion, get_next_blockmat(mainBoard) ist ein Kernelement der KI implementierung. Sie benutzt die Logik der bereits implentierten blockMat funktionen.

Diese Funktion erlaubt es der KI das ergebenis des Nächsten schrittes Anzuschauen. Dies wird dann später benutzt um alle möglichen nächsten Schritte zu vergleichen und zu bewerten

#### get_next_blockmat(mainBoard)

Funktion welches eine abgeänderte form der Spielfed Matrix des übergebenen Mainboardes als Numpy Matrix returned. Die hier returnte Spielfeld Matrix wiederspiegelt den Spielfeld zustand wenn der Spielstein (der der sich bewegt) in der weitest möglichen position nach unten platziert wird. Diese Spielfeld Matrix wiederspiegelt den "nächsten zustand" des Spielfeldes

In [None]:
# Function which returns the blockmat if the tetromino is dropped in the current position with the current rotation
def get_next_blockmat(mainBoard):
    # array which saves the distance from that block to the bottom
    distances = []

    # get blockMat WITHOUT (important) the moving piece
    blockMat = get_Blockmat_noPiece(mainBoard)

    # go through all blocks and find distance to the next block vertically
    # use the blockMat WITHOUT the moving piece for this, otherwise it will collide with itself.
    for blocks in mainBoard.piece.get_blocks():

        distance = 0
        next_block = blockMat[blocks.currentPos.row, blocks.currentPos.col]
        stopMovement = False

        # find the next block vertically or the bottom of the grid
        while next_block == 0 and stopMovement == False:

            next_block = blockMat[blocks.currentPos.row + distance, blocks.currentPos.col]

            if blocks.currentPos.row + distance >= 19:
                stopMovement = True

            elif next_block != 0:
                distance -= 1

            else:
                distance += 1

        distances.append(distance)

    # move all blocks down by the minimum distance found and insert into the blockMat
    minDistance = min(distances)

    for blocks in mainBoard.piece.blocks:
        blockMat[blocks.currentPos.row + minDistance, blocks.currentPos.col] = pieceValue[mainBoard.piece.type]

    return blockMat



###### get_vertical_distance(mainBoard)

Artefakt aus früheren Implementation der get_next_blockmat() Funktion. Returned ein Array bestehend aus den vertical Distanzen zum nächsten platzierten block (oder Spielrand) der MovingBlocks des MovingPiece.

In [None]:
# get the minimum vertical distance to the next block
def get_vertical_distance(mainBoard):
    # array which saves the distance from that block to the bottom
    distances = []

    # get blockMat WITHOUT (important) the moving piece
    blockMat = get_Blockmat_noPiece(mainBoard)

    # go through all blocks and find distance to the next block vertically
    # use the blockMat WITHOUT the moving piece for this, otherwise it will collide with itself.
    for blocks in mainBoard.piece.blocks:

        distance = 0
        next_block = blockMat[blocks.currentPos.row, blocks.currentPos.col]
        stopMovement = False

        # find the next block vertically or the bottom of the grid
        while next_block == 0 and stopMovement == False:

            next_block = blockMat[blocks.currentPos.row + distance, blocks.currentPos.col]

            if blocks.currentPos.row + distance >= 19:
                stopMovement = True

            elif next_block != 0:
                distance -= 1

            else:
                distance += 1

        distances.append(distance)

    return min(distances)


##### reverse_blockmat(blockmat)

Funktion welches eine Numpy Matrix übergeben bekommt und sie in ein normales 2 dimensionales Python Arry umwandelt und returned.

Diese Funktion wird gebraucht um aus den Numoy matrizten mit denen wir rechnen ein Array erstellen welches der Mainboard übergeben werden kann. So können die Numpy matritzen in die Spiellogik eingebracht werden.

In [None]:
def reverse_blockmat(blockmat):
    reversed_blockmat = [['empty'] * 10 for i in range(20)]

    for rows in range(20):
        for cols in range(10):

            if blockmat[rows, cols] != 0:
                reversed_blockmat[rows][cols] = inv_pieceValue[blockmat[rows, cols]]

    return reversed_blockmat


---

### Spielfeld bewertungen

Die Nächsten Funktionen berechnen die merkmale des Spielfeds mit denen die KI später die nächsten Schritte bewerten wird.


Als Errinerung: Blockmat ist die Matrix form des Spielfeldes. Sie beeinhalten die Koordinaten (als indexe) von den platzierten Spielsteinen und die Koordinaten des Steins welcher grade gespielt wird. Über diese Variable können wir logisch auf das Spielfeld zugreifen und rechnungen machen.


##### calc_aggregate_height(blockMat)

Funktion welche von der übergebenen blockMat die aggregierte höhe ausrechnent und returned. Return wert ist ein Int

In [None]:
# returns the aggregate height of a blockMat
def calc_aggregate_height(blockMat):
    heights = np.array([0, 0, 0, 0, 0, 0, 0, 0, 0, 0])

    # go through every cell in the blockMat. As soon as number is found within a call the first time:
    # subtract the row index from 20 to obtain the height
    for rows in range(20):
        for columns in range(10):

            if blockMat[rows, columns] != 0 and heights[columns] == 0:
                heights[columns] = 20 - rows

    # Aggregate heights
    agg = 0
    for x in range(10):
        agg += heights[x]

    return agg



##### calc_holes(blockMat)

Funktion welches die anzahl der Löcher in der übergebenen Blockmat ausrechnet und returned. Return Wert ist ein Int

In [None]:
# returns the sum of holes within a block mat
def calc_holes(blockMat):
    # array which saves if a column is covered
    covered = np.array([False, False, False, False, False, False, False, False, False, False])

    # array which saves the amount of holes in a column
    holes = np.array([0, 0, 0, 0, 0, 0, 0, 0, 0, 0])

    # Go through all cells of the blockMat
    # If a column is covered has a block in it, it will count as covered,
    # count all subsequent empty spaces in that column
    for rows in range(20):
        for columns in range(10):

            if blockMat[rows, columns] != 0:
                covered[columns] = True

            if blockMat[rows, columns] == 0 and covered[columns] == True:
                holes[columns] += 1

    # Aggregate holes
    agg = 0
    for x in range(10):
        agg += holes[x]

    return agg


##### calc_lines_cleared(blockMat)

Funktion welches die Anzahl der vollständigen reihen der übergebenen Blockmat ausrechnet und returned. Return Wert ist ein Int

In [None]:
# returns the number of lines cleared with a move
def calc_lines_cleared(blockMat):
    # init clear lines variable
    lines_cleared = 0

    # go through all cells in the blockMat
    # if a column is completely filled, increase the number of lines cleared
    for rows in range(20):

        full_line = True

        for columns in range(10):

            if blockMat[rows, columns] == 0:
                full_line = False

        if full_line:
            lines_cleared += 1

    return lines_cleared


##### calc_bumpiness(blockMat)

Funktion welches die Bumpiness der übergebenen Blockmat ausrechnet und returned. return wert ist ein Int. 
Bumpines setzt sich aus der absoluten different der höhen von zwei aneinander liegenden Spalten zusammen

In [None]:
# returns the bumpiness values of the blockMat
def calc_bumpiness(blockMat):
    heights = np.array([0, 0, 0, 0, 0, 0, 0, 0, 0, 0])

    # go through every cell in the blockMat. As soon as number is found within a call the first time:
    # subtract the row index from 20 to obtain the height
    for rows in range(20):
        for columns in range(10):

            if blockMat[rows, columns] != 0 and heights[columns] == 0:
                heights[columns] = 20 - rows

    bumpiness = 0

    # go through each value, and calculate the absolute difference in height to the adjacent column
    # only go to 9 to avoid index out of bounds
    for x in range(9):
        bumpiness += abs(heights[x] - heights[x + 1])

    return bumpiness


#### eval_blockMat(a, b, c, d, blockMat)

Funktion welches eine Blockmat mit anhand von aggregierter höhe, holes, lines cleared und bumpiness mit bezug auf die gewichtung des agenten (a, b, c, d) bewertet und returned. Der Return wert ist ein float. a, b, und d sind werte zwsichen -1 und 0. c ist ein wert zwischen 0 und 1.

In [None]:
# returns the score of the blockMat, based on the score heuristic and the given parameters
def eval_blockMat(a, b, c, d, blockMat):
    score_function = (a * calc_aggregate_height(blockMat)) + (b * calc_holes(blockMat)) + (
                c * calc_lines_cleared(blockMat)) + (d * calc_bumpiness(blockMat))
    return score_function




---

## Bewertungs Algorithmus

Es sind jetzt alle Funktionen bereitgestellt um eine BlockMat zur Bewertung des Spielfeldes erstellt worden. Es gilt jetzt den Spiel Algorithmus der KI zu erstellen

### eval_sequence(mainboard, step, a, b, c, d)

Die Eval sequences sind die ersten Teile des KI Spiel Algorithmuses. Das ziel dieser funktion ist es alle möglichen positionen ( d.h. alle tuple von position und rotation) des Tetrominos welches platziert werden soll zu bewerten.

Dies wird wie folgt gemacht:

Das stück wird zunächst nach ganz rechts bewegt. Sobald es ganz links angelangt ist wird die position bewertet in der es sich befindet. Position bewertet heißt die Funktion get_next_blockmat() wird gecalled um den Spielstand zu bekommen der kreiert werden würde wenn das Spielstück in dieser position platziert werden würde. Dieser potentielle spielstand wird dann durch eval_blockmat() bewertet. Die Bewertung dieser blockmat wird zusammen mit der position des Spielsteins und der rotation in arrays gespeichert. Die indexe der Einträge stimmer hier immer überein. Nachdem die erste position des spielsteins bewertet worden ist wird das stück eine position weiter nach rechts bewegt wo die position wieder bewertet und gespeichert wird. Das wird weiter wiederholt bis das stück ganz rechts ankommt. Dann wird das stück etwas nach links bewegt (2 positionen um die rotation zu ermöglichen), rotiert und wieder nach ganz links im Spielfeld bewegt. In dieser Orientation werden dann wieder alle positionen bewertet bis das stück ganz rechts ankommt. Dieser ganze prozess wiederholt sich bis alle positionen und rotationen dses jetztigen stückes bewertet worden sind. Am ende wird der Spielstein in seiner ursprungs rotations gebracht und ganz links im Spielfeld platziert.

Die Berwetung basiert auf den übergebenen Gewichtungen des Agentens (a, b, c, d)

---

Anmerkung:

Es gab bei der implementierung dieses Algorithmuses ein Problem. Da Pygame jeden sogenannten "game tick" die Bildschirm updaten will können wir innerhalb des gameloops kein schleifen machen oder ähnliches. Der Compiler muss in jeder iteration des gameloops komplett durchlaufen um keine Probleme mit Pygame zu erstellen. Das heißt diese Funktion darf keine Schleifen enthalten, und muss immer einen return wert haben (die Funktion darf das Programm nicht festhalten). Somit wurde der Step parameter mit einbezogen, damit wir extern den Fortschritt dieser Funktion speichern können. 

Deshalb hat diese funktion auch 5 return werte. Die ersten 3 sind der Positions wert (evaluation der blockmat), die position des Spielsteins und die rotation. Die letzten zwei Werte sind Booleans. Der erste gibt true zurück wenn ein wert berechnet worden ist der gespeichert werden soll. Das heißt jedes mal wenn der algorithmus eine position des Spielsteins bewertet hat, wird dieser wert True. So werden zwischen positionen, wie das erste positioneren des Steins an der linken seite des Spielfeldes nicht mit einberechnet. Der letzte Boolean wert wird True wennn alle berechnungen gemacht worden sind und der stein in seiner ursprungs Rotation links am Spielfeld angelangt ist.

In [None]:
def eval_sequence(mainboard, step, a, b, c, d):
    # move the piece to the very right
    if step < 10:
        mainboard.piece.move_piece_left()

        return 0, 0, 0, False, False

    # go through each x position in rot 0, get the pos_value and save it
    elif step < 20:
        position_value = eval_blockMat(a, b, c, d, get_next_blockmat(mainboard))
        rotation = mainboard.piece.rotation_orientation
        position = mainboard.piece.get_block_positions()

        mainboard.piece.move_piece_right()

        return rotation, position, position_value, True, False

    # go back two steps (to give the piece space to rotate)
    elif step == 20 or step == 21:
        mainboard.piece.move_piece_left()

        return 0, 0, 0, False, False

    # rotate piece
    elif step == 22:
        mainboard.piece.rotate_piece()

        return 0, 0, 0, False, False

    # move the piece back to the left
    elif step < 32:
        mainboard.piece.move_piece_left()

        return 0, 0, 0, False, False

    # go through each position x in rot 1, get the pos_value and save it
    elif step < 42:
        position_value = eval_blockMat(a, b, c, d, get_next_blockmat(mainboard))
        rotation = mainboard.piece.rotation_orientation
        position = mainboard.piece.get_block_positions()

        mainboard.piece.move_piece_right()

        return rotation, position, position_value, True, False

    # go back two steps to allow for rotation
    elif step == 42 or step == 43:
        mainboard.piece.move_piece_left()

        return 0, 0, 0, False, False

    # rotate the piece
    elif step == 44:
        mainboard.piece.rotate_piece()

        return 0, 0, 0, False, False

    # move piece back to the left
    elif step < 54:
        mainboard.piece.move_piece_left()

        return 0, 0, 0, False, False

    # go through each position x in rot 2, get the pos_value and save it
    elif step < 64:
        position_value = eval_blockMat(a, b, c, d, get_next_blockmat(mainboard))
        rotation = mainboard.piece.rotation_orientation
        position = mainboard.piece.get_block_positions()

        mainboard.piece.move_piece_right()

        return rotation, position, position_value, True, False

    # go back two steps to allow rotation
    elif step == 64 or step == 65:
        mainboard.piece.move_piece_left()

        return 0, 0, 0, False, False

    # rotate piece
    elif step == 66:
        mainboard.piece.rotate_piece()

        return 0, 0, 0, False, False

    # move piece back to left
    elif step < 76:
        mainboard.piece.move_piece_left()

        return 0, 0, 0, False, False

    # go through each position x in rot 3, get the pos_value and save it
    elif step < 86:
        position_value = eval_blockMat(a, b, c, d, get_next_blockmat(mainboard))
        rotation = mainboard.piece.rotation_orientation
        position = mainboard.piece.get_block_positions()

        mainboard.piece.move_piece_right()

        return rotation, position, position_value, True, False

    # move the piece two steps back
    elif step == 86 or step == 87:
        mainboard.piece.move_piece_left()

        return 0, 0, 0, False, False

    # rotate the piece
    elif step == 88:
        mainboard.piece.rotate_piece()

        return 0, 0, 0, False, False

    # move piece back to the left
    elif step < 98:
        mainboard.piece.move_piece_left()

        return 0, 0, 0, False, False

    # after having gone through all positional steps, return the last value as true to show position sequence is over
    elif step == 98:

        return 0, 0, 0, False, True

### eval_next_blockMat

Mit dieser Funktion wird der reward des nächsten Spielsteins mit einberechnet.
Wir übergeben der Funktion eine Blockmat (next_blockMat) und ein Spielstein (next_piece). Außerdem werden die bewertungs gewichtungen übergeben (a, b, c, d). 

Die funktion erstellt dann ein neues Mainboard mit der übergebenen Blockmat und Spielstein. Wir haben jezt sozusagen ein zweites Tetris Spiel kreiert welches ein Schritt voraus ist. Wir gehen dann alle positionen des Spielstücks in diesem neuen Tetris Spiel durch und bewerten diese positionen. Dies wird mit der eval_sequence() funktion gemacht. Hier müssen lediglich die richtigen Parameter übergeben werden. Die beste Bewertung dieses Neun Tetrisspiels wird dan als return wert zurück gegeben. Der return Wert ist ein Float

In [None]:
# Eval all positions of the potential next blockmat with the look ahead piece in play
def eval_next_blockMat(next_blockMat, next_pieces, a, b, c, d):
    # this function is called for every tuple of rotation and position of the current piece in play

    # Create a new mainboard object
    blockSize = 20
    boardColNum = 10
    boardRowNum = 20
    boardLineWidth = 10
    blockLineWidth = 1
    scoreBoardWidth = blockSize * (boardColNum // 2)
    boardPosX = DISPLAY_WIDTH * 0.3
    boardPosY = DISPLAY_HEIGHT * 0.15

    next_mainBoard = MainBoard(blockSize, boardPosX, boardPosY, boardColNum, boardRowNum, boardLineWidth,
                               blockLineWidth,
                               scoreBoardWidth)

    # set the blockmat of the new mainboard equal to the next blockmat
    next_mainBoard.set_blockmat(reverse_blockmat(next_blockMat))

    # set the piece of the new blockmat equal to the look ahead piece
    next_mainBoard.nextPieces = next_pieces

    # Store the achieved positional values in a list
    position_values = []

    # Analyse all the possible positions of this blockMat
    done = False
    step = 0
    while done is False:

        # We do not need to save rotation and position for this, as the AI will by its nature make that next move
        _, _, position_score, calculated, done = eval_sequence(next_mainBoard, step, a, b, c, d)

        # add the position score to the position_values
        if calculated:
            position_values.append(position_score)

        # increase the step
        step += 1

    # return the max score that could be achieved next step
    return max(position_values)


### eval_sequence_LookAhead(mainboard, step, a, b, c, d)

Semantisch das gleiche wie die Funktion eval_sequence. Retrun werte sind die gleichen, und haben die gleiche Funktion. Der unterschied ist hier das als die Bewertung der Positionen des Spielstens auch das Look Ahead Piece (den nächste Spielstein) mit einbeziehen.

In [None]:
# Eval Sequence with look ahead piece consideration
def eval_sequence_LookAhead(mainboard, step, a, b, c, d):
    # move the piece to the very right
    if step < 10:
        mainboard.piece.move_piece_left()

        return 0, 0, 0, False, False

    # go through each x position in rot 0, get the pos_value and save it
    elif step < 20:
        position_value = eval_blockMat(a, b, c, d, get_next_blockmat(mainboard)) + eval_next_blockMat(get_next_blockmat(mainboard), mainboard.nextPieces, a, b, c, d)
        rotation = mainboard.piece.rotation_orientation
        position = mainboard.piece.get_block_positions()

        mainboard.piece.move_piece_right()

        return rotation, position, position_value, True, False

    # go back two steps (to give the piece space to rotate)
    elif step == 20 or step == 21:
        mainboard.piece.move_piece_left()

        return 0, 0, 0, False, False

    # rotate piece
    elif step == 22:
        mainboard.piece.rotate_piece()

        return 0, 0, 0, False, False

    # move the piece back to the left
    elif step < 32:
        mainboard.piece.move_piece_left()

        return 0, 0, 0, False, False

    # go through each position x in rot 1, get the pos_value and save it
    elif step < 42:
        position_value = eval_blockMat(a, b, c, d, get_next_blockmat(mainboard)) + eval_next_blockMat(get_next_blockmat(mainboard), mainboard.nextPieces, a, b, c, d)
        rotation = mainboard.piece.rotation_orientation
        position = mainboard.piece.get_block_positions()

        mainboard.piece.move_piece_right()

        return rotation, position, position_value, True, False

    # go back two steps to allow for rotation
    elif step == 42 or step == 43:
        mainboard.piece.move_piece_left()

        return 0, 0, 0, False, False

    # rotate the piece
    elif step == 44:
        mainboard.piece.rotate_piece()

        return 0, 0, 0, False, False

    # move piece back to the left
    elif step < 54:
        mainboard.piece.move_piece_left()

        return 0, 0, 0, False, False

    # go through each position x in rot 2, get the pos_value and save it
    elif step < 64:
        position_value = eval_blockMat(a, b, c, d, get_next_blockmat(mainboard)) + eval_next_blockMat(get_next_blockmat(mainboard), mainboard.nextPieces, a, b, c, d)
        rotation = mainboard.piece.rotation_orientation
        position = mainboard.piece.get_block_positions()

        mainboard.piece.move_piece_right()

        return rotation, position, position_value, True, False

    # go back two steps to allow rotation
    elif step == 64 or step == 65:
        mainboard.piece.move_piece_left()

        return 0, 0, 0, False, False

    # rotate piece
    elif step == 66:
        mainboard.piece.rotate_piece()

        return 0, 0, 0, False, False

    # move piece back to left
    elif step < 76:
        mainboard.piece.move_piece_left()

        return 0, 0, 0, False, False

    # go through each position x in rot 3, get the pos_value and save it
    elif step < 86:
        position_value = eval_blockMat(a, b, c, d, get_next_blockmat(mainboard)) + eval_next_blockMat(get_next_blockmat(mainboard), mainboard.nextPieces, a, b, c, d)
        rotation = mainboard.piece.rotation_orientation
        position = mainboard.piece.get_block_positions()

        mainboard.piece.move_piece_right()

        return rotation, position, position_value, True, False

    # move the piece two steps back
    elif step == 86 or step == 87:
        mainboard.piece.move_piece_left()

        return 0, 0, 0, False, False

    # rotate the piece
    elif step == 88:
        mainboard.piece.rotate_piece()

        return 0, 0, 0, False, False

    # move piece back to the left
    elif step < 98:
        mainboard.piece.move_piece_left()

        return 0, 0, 0, False, False

    # after having gone through all positional steps, return the last value as true to show position sequence is over
    elif step == 98:

        return 0, 0, 0, False, True

### position_at_max(mainboard, step, rotation, block_position)
Das ist der zweite teil der KI Spiel Logik.

Eine Funktion welches den Spielstein in die angegeben position bringt.
Return wert ist True wenn das stück in die Richtige position gebracht worden ist.
Ansonsten wird False returned (in jedem Step)

Auch hier musste wieder über die Step logik gearbeitet werden um for und while loops in der ausführung zu vermeiden. Es ist zwar ein While Loop in dieser Funktion zu finden, semantisch ist dieser aber mit einem if statement zu vergleichen da er niemals einen ganzen loop macht. 

Algorithmus funktioniert wie folgt:

Spielstein nach ganz links bewegen. 
Zwei positionen nach rechts bewegen um rotieren zu ermöglichen
rotieren bis es in der angegeben rotation (rotation) angelangt ist

bis angegebenene position (block_position) erreicht ist, den Spielstein nach rechts bewegen. 
Gelang der Stein nach ganz rechts (Spielrand oder block), den Spielstein anfangen nach links zu bewegen bis die richtige position erreicht ist

(Nach 100 steps wird True Automatisch zurück gegeben um Softlocks zu vermeiden)



In [None]:
# Had to fix this: Go from right to left until position is found. Blocks were sometime not being
# placed in the right position (e.g line pieces always being dropped in the left because they skipped)
# the optimal position

# So if the piece is not in the optimal position we made it move back to the left until it reaches the optimal
# postion

# position piece at optimal position
def position_at_max(mainboard, step, rotation, block_position):

    # opt_coords = (rotation, position from left)

    # move piece two steps right to allow rotation
    if step == 0 or step == 1:
        mainboard.piece.move_piece_right()
        
        return False

    # rotate the piece until it is in the correct position
    elif step < 6:
        if mainboard.piece.rotation_orientation != rotation:
            mainboard.piece.rotate_piece()
            
            return False
        if mainboard.piece.rotation_orientation == rotation:

            return False

    # move the piece back to the left
    elif step == 6 or step == 7:
        mainboard.piece.move_piece_left()
        
        return False

    # TODO Maybe return right if correct position cannot be achieved
    # Probably dont need to do that TO Do, because even if a block is blocking the whole right side, it will go through
    # All possible positions available to the piece in that situation

    # move piece to correct x position
    while not np.array_equal(mainboard.piece.get_block_positions(), block_position):
        print(step)
        
        # If piece is stuck, return true to move to next
        if step > 100:
            return True
        
        # Check if piece can move right, move it right
        elif mainboard.piece.movCollisionCheck('right') == False and mainboard.piece.movingRight:
            mainboard.piece.move_piece_right()
            
            return False
        
        # If position was still not found, move to the left
        elif mainboard.piece.movCollisionCheck('right') == True:
            mainboard.piece.movingRight = False
            mainboard.piece.movingLeft = True
            mainboard.piece.move_piece_left()
            
            return False
        
        elif mainboard.piece.movCollisionCheck('left') == False and mainboard.piece.movingLeft:
            mainboard.piece.move_piece_left()
            
            return False
        
        elif mainboard.piece.movCollisionCheck('left') == True:
            mainboard.piece.movingLeft = False
            mainboard.piece.movingRight = True
            mainboard.piece.move_piece_right()
            
            return False
            
    else:
        
        return True



### AI_Game_loop(a, b, c, d)

Die Hauptfunktionen der KI Spiel Logik sind Implementiert. In diser Funktion werden sie zusammengeführt. 

AI_Game_Loop erstellt zunächste eine Instant des Tetris Spiels (ein Mainboard) und gibt dieses Auch visuell aus.

Der Spielstatus befinden sich zuert in "firstStart". In dem wir ein Enter Signal übergeben wird Startet das Spiel.

Als erstes werden alle positionen des Spielsteinss ausgewertet (eval_sequence_lookAhead())
Nachdem alles positionen ausgewertet worden sind, wird die beste position, die mit der höchsten bewertung, ausgesucht. 
Dan wird der spiel stein in diese Position gebracht (position_at_max()), und dann in dieser Position Platziert. 

Wir wiederholen diesen Prozess bis entweder der Spiel Status zu "gameOver" wechselt, oder 500 Steine platziert worden sind (um die episoden Länge zu begrenzen).

Wenn die Episode vorbei ist werden folgende werte returned:
score_achieved, number_of_lines_cleared, single_line_clears, double_line_clears, triple_line_clears, quadruple_line_clears, frames_in_game, blocks_placed, score_over_time, lines_cleared_over_time, aggregate_height_over_time, bumpiness_over_time

diese werte werden benutzt um den Agenten, nachdem alle Agenten innerhalb einer Generation gespielt haben, zu bewerten und erlauben es die KI zu optimeren

In [None]:
# let AI play game based on best position score
def AI_Game_loop(a, b, c, d):
    blockSize = 20
    boardColNum = 10
    boardRowNum = 20
    boardLineWidth = 10
    blockLineWidth = 1
    scoreBoardWidth = blockSize * (boardColNum // 2)
    boardPosX = DISPLAY_WIDTH * 0.3
    boardPosY = DISPLAY_HEIGHT * 0.15

    mainBoard = MainBoard(blockSize, boardPosX, boardPosY, boardColNum, boardRowNum, boardLineWidth, blockLineWidth,
                          scoreBoardWidth)

    xChange = 0

    gameExit = False

    # for each position we need to save the x position, the rotation and the score
    # for this we will use three arrays to make reading the information easier

    position_values = []
    rotation_mat = []
    position_mat = []

    step = 0
    position_step = 0
    done = False
    positioned = False

    print_info = True

    # Statistic trackers _ End of Game
    score_achieved = 0
    number_of_lines_cleared = 0
    single_line_clears = 0
    double_line_clears = 0
    triple_line_clears = 0
    quadruple_line_clears = 0
    frames_in_game = 0
    blocks_placed = 0

    # timed statistics _ take every 200 frames
    score_over_time = []
    aggregate_height_over_time = []
    bumpiness_over_time = []
    lines_cleared_over_time = []

    while not gameExit:  # Stay in this loop unless the game is quit

        if mainBoard.gameStatus == 'running':
            
            # Keep track of frame count (divided by FPS will give Time)
            frames_in_game += 1

            # Record timed statistics every 200 frames
            if gameClock.frameTick%200 == 0:
                score_over_time.append(mainBoard.score)
                aggregate_height_over_time.append(calc_aggregate_height(get_Blockmat_noPiece(mainBoard)))
                bumpiness_over_time.append(calc_bumpiness(get_Blockmat_noPiece(mainBoard)))
                lines_cleared_over_time.append(mainBoard.lines)


            key.enter.status = 'idle'
            

            # go through all positionary checks
            # eval_sequence return values: rotation, position from left, position_score, calculated, done
            if not done:
                
                rotation, position, position_score, calculated, done = eval_sequence_LookAhead(mainBoard, step, a, b, c, d)

                # if a position score was calculated, save the blocks attributes in the arrays
                if calculated:

                    debug_blockmat = get_Blockmat(mainBoard)
                    position_values.append(position_score)
                    rotation_mat.append(rotation)
                    position_mat.append(position)

                step += 1

            # if done position in the correct place
            if done and step == 99 and positioned == False:


                # get the optimal position coordinated
                max_value = max(position_values)
                max_index = position_values.index(max_value)

                opt_rotation = rotation_mat[max_index]
                opt_position = position_mat[max_index]
                
                step = 100


            elif done and positioned == False:
                if not position_at_max(mainBoard, position_step, opt_rotation, opt_position):
                    position_step += 1

                #if position_at_max(mainBoard, step, opt_rotation, opt_position):
                else:
                    positioned = True

            # drop the piece
            elif done and positioned:

                # Debug Info
                if print_info == True:
                    
                    line_clears_this_move = calc_lines_cleared(get_next_blockmat(mainBoard))

                    if line_clears_this_move == 1:
                        single_line_clears += 1
                    elif line_clears_this_move == 2:
                        double_line_clears += 1
                    elif line_clears_this_move == 3:
                        triple_line_clears += 1
                    elif line_clears_this_move == 4:
                        quadruple_line_clears += 1

                    print_info = False

                if mainBoard.piece.status == 'moving':
                    mainBoard.piece.move_piece_down()

                else:
                    # piece is dropped, reset to start over with next block

                    blocks_placed += 1
                    position_values = []
                    rotation_mat = []
                    position_mat = []

                    done = False
                    positioned = False
                    print_info = True
                    step = 0
                    position_step = 0

        # press enter if the game is in the first start
        if mainBoard.gameStatus == 'firstStart':

            key.enter.status = 'pressed'

        # When game over, return the game statistics needed statistics...
        if mainBoard.gameStatus == 'gameOver' or blocks_placed == 500:
                    
            score_achieved = mainBoard.score
            number_of_lines_cleared = mainBoard.lines

            print("\n")
            print(f"SCORE ACHIEVED: {score_achieved}")
            print(f"CLEARED LINES:  {number_of_lines_cleared}")

            return score_achieved, number_of_lines_cleared, single_line_clears, double_line_clears, triple_line_clears, quadruple_line_clears, frames_in_game, blocks_placed, score_over_time, lines_cleared_over_time, aggregate_height_over_time, bumpiness_over_time

        # Events need to be obtained for display to be shown
        for event in pygame.event.get():
            if event.type == pygame.QUIT:  # Looks for quitting event in every iteration (Meaning closing the game window)
                gameExit = True

        gameDisplay.fill(BLACK)  # Whole screen is painted black in every iteration before any other drawings occur

        mainBoard.gameAction()  # Apply all the game actions here
        mainBoard.draw()  # Draw the new board after game the new game actions
        gameClock.update()  # Increment the frame tick

        pygame.display.update()  # Pygame display update
        clock.tick(5000)  # Pygame clock tick function(200 fps) --> Quicker execution of the algorithm...

### train_for_episodes

Funktion welches einen agenten für die übergene anzahl von episoden das Tetris Spiel spielen lässt. Der Parameter generation wird später benutzt für die Speicherung der Daten.

Nach jeder Abgeschlossenen Episodes werden die Statistiken in einer externen csv datei abgespeichert.

Sind alle episoden durchgelaufen wird der durchschitts score des Agenten berechnet, auf der csv datei hinzugefügt und dan alls return wert ausgegeben. der return wert ist ein Float

In [None]:
# Go through a certain number of episodes with one agent and save the data in a csv file
def train_for_episodes(generation, agent, episodes):

    # Sum up all the scores to be able to get mean score of the agent
    sum_score = 0
    
    for episode in range(episodes):
        
        # Init pygame...
        pygame.init()
        pygame.font.init()

        DISPLAY_WIDTH = 800
        DISPLAY_HEIGHT = 600

        gameDisplay = pygame.display.set_mode((DISPLAY_WIDTH, DISPLAY_HEIGHT))
        pygame.display.set_caption('Tetris')
        clock = pygame.time.Clock()
        
        # Execute the episode and get the Data (Set up pygame parameters as well)
        score, lines_cleared, s_line_clears, d_line_clears, t_line_clears, q_line_clears, time, blocks_placed, score_over_time, lines_cleared_over_time, aggregate_height_over_time, bumpiness_over_time = AI_Game_loop(agent[1], agent[2], agent[3], agent[4]) 
            
        sum_score += score
        
        print(f"--- Episode {episode} Complete ---")
            
        # After finishing the episode, open csv file and save the data
        with open(f'Training_Data/TetBot_LookAhead_Gen_{generation}.csv', 'a', encoding='UTF8', newline='') as f:
            writer = csv.writer(f)
            
            # insert episode description
            writer.writerow([f"Generation:"])
            writer.writerow([generation])
            writer.writerow([f"Agent:"])
            writer.writerow([agent[0]])
            writer.writerow([f"Parameters Used: {agent[1]}, {agent[2]}, {agent[3]}, {agent[4]}"])
            writer.writerow([f"Epsisode:"])
            writer.writerow([episode])
            
            # blank line (for formatting)
            writer.writerow(" ")
            
            # insert episode data
            writer.writerow([f"Score Achieved:"])
            writer.writerow([score])
            writer.writerow([f"Lines Cleared:"])
            writer.writerow([lines_cleared])
            writer.writerow([f"Single Line Clears:"])
            writer.writerow([s_line_clears])
            writer.writerow([f"Double Line Clears:"])
            writer.writerow([d_line_clears])
            writer.writerow([f"Triple Line Clears:"])
            writer.writerow([t_line_clears])
            writer.writerow([f"Quadruple Line Clears:"])
            writer.writerow([q_line_clears])
            
            # since we get the time in frames, and the game runs in 200 fps, to get seconds we divide time by 200
            writer.writerow([f"Episode Length: {time/200}s"])
            writer.writerow([f"Blocks Placed (Max 500): {blocks_placed}"])
            writer.writerow(" ")
            
            # timed statistics
            writer.writerow(["Timed Statistics taken every 200 in game frames"])
            writer.writerow(["Score Over Time"])
            writer.writerow(score_over_time)
            writer.writerow(["Lines Cleared Over Time"])
            writer.writerow(lines_cleared_over_time)
            writer.writerow(["Aggregate Height Over Time"])
            writer.writerow(aggregate_height_over_time)
            writer.writerow(["Bumpiness Over Time"])
            writer.writerow(bumpiness_over_time)
            writer.writerow(" ")
            
    mean_score = sum_score/episodes
    with open(f'Training_Data/TetBot_LookAhead_Gen_{generation}.csv', 'a', encoding='UTF8', newline='') as f:
        writer = csv.writer(f)    
        writer.writerow([f"Agent Mean Score:"])
        writer.writerow([mean_score])
        writer.writerow(["----------------------------"])
        writer.writerow(" ")
    
    return sum_score/episodes


---

Als nächsten können wir eine Liste von agenten kreieren. Diese Liste entpricht unserer Population und der Generation 0

In [None]:
# Initialise the first agents 

agent1 = [1, -0.16832757769902507, -0.07969240348619844, 0.5877047189074952, -0.9972892156845388]
agent2 = [2, -0.14954607467217684, -0.9774968347336302, 0.13427028912517958, -0.2656020416873196]
agent3 = [3, -0.8258790328448274, -0.8404444078192465, 0.53307541035142, -0.8005901004984177]
agent4 = [4, -0.9334359573824076, -0.045904963199957294, 0.6503535156893778, -0.6061473427950209]
agent5 = [5, -0.829727580586907, -0.41975582988738913, 0.89918899074433, -0.07084232044026251]
agent6 = [6, -0.13600271814013787, -0.253519858157485, 0.1962860915390705, -0.7289177596543426]
agent7 = [7, -0.8825819986662627, -0.12109975544550722, 0.4750358319413158, -0.842048199192208]
agent8 = [8, -0.6148155894252068, -0.13509881681925928, 0.3842068562457456, -0.6921409976087427]
agent9 = [9, -0.23616689030780524, -0.561639570397952, 0.9631285951239456, -0.10291717117694621]
agent10 = [10, -0.02833023645190702, -0.6992758306876569, 0.40806656324928814, -0.15988201219420206]

# Create agent list (generation)
agents = [agent1, agent2, agent3, agent4, agent5, agent6, agent7, agent8, agent9, agent10]

---

Beispiel: initialisierung einer zufälligen Population

In [None]:
# Initialise Random Agents

agent1 = [1, -np.random.random(), -np.random.random(), np.random.random(), -np.random.random()]
agent2 = [2, -np.random.random(), -np.random.random(), np.random.random(), -np.random.random()]
agent3 = [3, -np.random.random(), -np.random.random(), np.random.random(), -np.random.random()]
agent4 = [4, -np.random.random(), -np.random.random(), np.random.random(), -np.random.random()]
agent5 = [5, -np.random.random(), -np.random.random(), np.random.random(), -np.random.random()]
agent6 = [6, -np.random.random(), -np.random.random(), np.random.random(), -np.random.random()]
agent7 = [7, -np.random.random(), -np.random.random(), np.random.random(), -np.random.random()]
agent8 = [8, -np.random.random(), -np.random.random(), np.random.random(), -np.random.random()]
agent9 = [9, -np.random.random(), -np.random.random(), np.random.random(), -np.random.random()]
agent10 = [10, -np.random.random(), -np.random.random(), np.random.random(), -np.random.random()]

# Create agent list (generation)
agents = [agent1, agent2, agent3, agent4, agent5, agent6, agent7, agent8, agent9, agent10]

### train_generation(generation, agents, episodes)

Funktion welches eine liste von agenten (population) und eine anzahl von episoden übergeben bekommt. Es wird dann jeder agent innerhalb der population für die anzahl von episoden trainiert. 

Nachdem alle agenten gespielt haben wird der durchschnitts wert von jedem agenten als array returned. Diese werte werden dann in der CSV datei ebenfalls abgespeichert. Außerdem wird noch die population (agents) welche in dieser Generation gespielt haben in die CSV hinzugefügt.

In [None]:
# Generation Training

def train_generation(generation, agents, episodes):
    
    generation_results = []
    
    for agent in agents:
         
        # Let the agent run the episodes
        mean_score = train_for_episodes(generation, agent, episodes)
        generation_results.append(mean_score)
        
        print(f"---- Agent {agent[0]} Completed all Episodes ----")
        
    # After finishing the generation, add the generation results to the last row
    with open(f'Training_Data/TetBot_LookAhead_Gen_{generation}.csv', 'a', encoding='UTF8', newline='') as f:
        writer = csv.writer(f)
        writer.writerow(" ")
        writer.writerow(["--- AGENT MEAN SCORES ---"])
        writer.writerow(generation_results)
        writer.writerow(" ")
        writer.writerow(["Agents:"])
        writer.writerow(agents)
        writer.writerow(" ")
        writer.writerow(["-------------------------------------------"])
        writer.writerow(" ")
        
    return generation_results
 
# This works!

---

### Optimierungen

Nach dem jetzt die Hauptlogik der KI implemtiert ist, muss die Optimierung eingeführt werden


#### Create_new_population(agents, gent_results)

wir übergeben der Funktion ein liste vin agenten (population) und deren erspielten punktzahlen

Es werden dann 4 zufällige agenten aus der Population ausgewählt. 2 mal 2 paare. Diese paare erzeugen dann durch die funktion create_offspring() ein neuen agenten. Da wir zwei paare haben werden 2 neue Agenten kreiert. Wir löschen dann die zwei Agenten aus der Population die am schlechtesten gespielt haben. Danach fügen wir die zwei neuen Agenten in die Population ein. 

der Return wert dieser Funktion ist die liste der neuen Agenten (die neue Population).

In [None]:
def create_new_Population(agents, gen_results):
    
    # Generate two random integers between 0 and 9 (Parent Individuals)
    random1 = random.randint(0, 9)
    random2 = random.randint(0, 9)
        
    # Make sure theser are not the same
    while random1 == random2:
        random2 = random.randint(0, 9)
        
    # Generate another two randome integers
    random3 = random.randint(0, 9)
    random4 = random.randint(0, 9)
    
    # Make sure this are uniqe as well
    while random3 == random1 or random3 == random2:
        random3 = random.randint(0, 9)
        
    while random4 == random1 or random4 == random2 or random4 == random3:
        random4 = random.randint(0, 9)
        
        
    print(random1, random2, random3, random4)
    # Take the two Agents and create the new offspring
    new_agent1 = create_offspring(agents[random1], gen_results[random1], agents[random2], gen_results[random2])
    new_agent2 = create_offspring(agents[random3], gen_results[random3], agents[random4], gen_results[random4])
    
    # Delete the two lowest scoring agents
    for x in range(2):
        
        del_index = gen_results.index(min(gen_results))
        
        temp_score = gen_results[del_index]
        temp_agent_tag = agents[del_index][0]
        
        del agents[del_index]
        del gen_results[del_index]
        
        print(f"Delete Agent {temp_agent_tag}, Agent scored: {temp_score}")
        
    # Append the new agents
    agents.append(new_agent1)
    agents.append(new_agent2)
    
    # Fix the agents tags
    tag = 1
    for agent in agents:
        agent[0] = tag
        tag += 1
        
    # return the agent list
    return agents
   
   
    
    

### create_offspring(agent1, mean_agent1, agent2, mean_agent2, mutation_factor = 0.1)

Diese funktion nimmt 2 agenten und deren erzielte durchschnitts punktzahl und erstellt anhand diesen Daten ein neuen agenten (child bzw. offsping).

Dazu muss als erstes ein gewicht ermittelt werden da die zusammensetzung (crossover) der agenten auf einem sog. weighted average basiert. 

Die weighting ist das verhältniss der durchschnitts punktzahlen von den agenten zueinander. 

e.g agent1: mean_score = 1000
    agent2: mean_score = 300
    
    w1 = 0.7
    w2 = 0.3
    
Die zusammensetzung der chromosome des neuen Agenten stellt sich dann wie folgt zusammen:

$$ a_{neu} = w_{1} * a_{1} + w_{2} * a_{2} $$
$$ b_{neu} = w_{1} * b_{1} + w_{2} * b_{2} $$
$$ c_{neu} = w_{1} * c_{1} + w_{2} * c_{2} $$
$$ d_{neu} = w_{1} * d_{1} + w_{2} * d_{2} $$

der Vektor der sich daraus ergibt wir in neuer agent in einem array returned.

Es wir ausserdem der Mutations Faktor mit einberechnet. Dieser Mutations Faktor repräsentiert die wahrscheinlichkeit das der neue Agent mutiert. 

Wenn dies zutrifft wird eines der chromosome bis zu +- 0.2 verändert.

Nachdem die Mutations hinzugefügt worden ist wird der Vektor normalisiert und dan zurück gegeben.


In [None]:
# Create offpsring from two agents based on Weighted Average and mutation factor
def create_offspring(agent1, mean_agent1, agent2, mean_agent2 ,mutation_factor = 0.1):
    
    mutate = False
    
    print(agent1, mean_agent1)
    print(agent2, mean_agent2)
    
    # Does the offspring mutate?
    if np.random.random() < mutation_factor:
        mutate = True
    
    # init variables
    fittest = 0
    weighting = [0,0]
    
    new_agent = []
    
    # Identify the stronger individual and calculate weightings that will apply
    if mean_agent1 > mean_agent2:
        fittest = 1
        weighting[0] = mean_agent2/mean_agent1
        weighting[1] = 1 - weighting[0]
        
    else:
        fittest = 2
        weighting[0] = mean_agent1/mean_agent2
        weighting[1] = 1 - weighting[0]
        
    weight1 = 0
    weight2 = 0
     
    # The stronger agent gets the stronger weighting
    # This method is used to ensure each agent gets the correct weighting
    if fittest == 1:
        weight1 = max(weighting)
        weight2 = min(weighting)
        
    if fittest == 2:
        weight1 = min(weighting)
        weight2 = max(weighting)
    
    
    # This Weighting method is not correct if the ratio is greater than 0.5 (e.g 2/3 will be weighted wrong)
    
    #if fittest == 1:
        #weighting = (mean_agent2/mean_agent1)
        #weight1 = 1-weighting
        #weight2 = weighting
        #print(fittest, weight1, weight2)
        
    #else:
        #weighting = (mean_agent1/mean_agent2)
        #weight1 = weighting
        #weight2 = 1-weighting
        #print(fittest, weight1, weight2)
        
    
    # Go through the parameters and adjust based on weighting
    for x in range(4):
            new_Parameter = (weight1 * agent1[x+1] + weight2 * agent2[x+1])
            new_agent.append(new_Parameter)
            
    # If mutated, add the mutation to one of the parameters and then normalize the vector
    if mutate:
        
        print("Mutation")
        
        # Select a random parameter
        mutation_index = random.randint(0,3)
        
        # Get the amount to be changed
        mutation = random.uniform(0., 0.2)
        
        # Apply the Mutation
        new_agent[mutation_index] += mutation
        
         # Normalize the Vector
        npAgent = np.array(new_agent)
        norm = np.linalg.norm(npAgent)
        norm_npAgent = npAgent/norm
        
        new_agent = norm_npAgent.tolist()
        
    # Add the Agent Tag to the beginning of the array and then return
    new_agent.insert(0, 11)
    
    return new_agent
    
        
        

---

### Optimize(agents, train_for_generations):

Diese Funktion ist die Umsetzung des Genetischen Agorithmus. Hier kommen alle implementierten Funktionen zusammen.

der Parameter Agents ist die population in der 0ten Generation

der Parameter train_for_generations besagt für wie viele Generationen die KI trainiert werden soll.

Nachdem eine Generation durch gelaufen ist, wird mit create_new_population() die nächste generation erstellt. 
Es wird dann, bis die gewünschte Generation erreicht ist, diese schleife wiederholt.

Nach jeder generation wird der delta wert zu der vorherigen Generation ausgerechnet um verfolgen zu können wie der algorithmus seit der Letzten generation sich verbessert hat.

der Return wert dieser Funktion ist die Population der letzen Generation, und deren ergebnisse.

In [None]:
# Run Generations until Theta Value is Passed

def Optimize(agents, train_for_generations):
    
    generation = 0
    
    # Train one generation to get the initial results
    gen_results = train_generation(generation, agents, 10)
    
    # Adjust the population
    agents = create_new_Population(agents, gen_results)
    
    generation += 1
    
    for generations in range(train_for_generations):
        
        # Get results of the new generation
        new_results = train_generation(generation, agents, 10)
        
        #Adjust the population with the new scores
        agents = create_new_Population(agents, new_results)
            
        # Calculate delta
        sum_gen = 0
        sum_new = 0
        
        for x in range(len(gen_results)):
            sum_gen += gen_results[x]
            sum_new += new_results[x]
            
        delta = (sum_new - sum_gen)/sum_gen
        
        with open(f'Training_Data/TetBot_LookAhead_Gen_{generation}.csv', 'a', encoding='UTF8', newline='') as f:
            writer = csv.writer(f)
            writer.writerow(" ")
            writer.writerow("-------------")
            writer.writerow([f"Delta: {delta}"])
            
        gen_results = new_results
        generation += 1
    
    
    print(f"Trained for {train_for_generations} Generation....")
        
    return agents, gen_results
        
        
        

    

In [None]:
# Run the Optimization ---> Train the AI

# Pygame Setup
clock = pygame.time.Clock()
key = GameKeyInput()
gameClock = GameClock()

# Optimize
new_agents, gen_results = Optimize(agents, 10)

In [None]:
#-------------------------------------

# AGENT SAMPLE RUN

clock = pygame.time.Clock()
key = GameKeyInput()
gameClock = GameClock()
AI_Game_loop(-0.9885540891258398, -0.5754498095636851, 0.5513171231780933, -0.39665729894004476)


#-------------------------------------

In [None]:
# -------------------------------

# GENERATION SAMPLE RUN
clock = pygame.time.Clock()
key = GameKeyInput()
gameClock = GameClock()

gen_results = train_generation(1, agents, 10)
print(gen_results)

# -------------------------------

In [None]:
# SAMPLE RUN RESULT
gen_results = [332.0,2088.0,3960.0,1640.0,2560.0,444.0,2242.0,854.0,6268.0,10766.0]

In [None]:
# SAMPLE NEW GENERATION
print(agents)
print(" ")
print(create_new_Population(agents, gen_results))

Daten Analyse Sehr wichtig:

Wie beeinfussen die Parameter die Spiel weise:

Beispiele aus den Daten nehmen!
e.g Gen 1 Agent 2 --> Vermeidet löcher sehr. ist Bumpiness eher egal. Baut daher sehr unebene felder die aber schnell mit einem einzelenen block weg gemacht werden können. Problem. Da auch höhe nicht stark gewichetet ist und line clears auch nicht, baut er sich sehr schnell ein. Kriegt jedoch hohe punktzahl weil er multi line clears bekommt!

Or the fitst agent for example which has a really high bumpiness weighting and everything else is low, so it simply try to create a smooth playing field....

These need to work in tandem to make the best agent

a too high reward on line clears will make you take the lines without wanting to go for a combo.... (immediate reward)

Exploration vs. Exploitation

It seems like a lower one here is actually better sometimes

Über dieses verhalten reden wenn die Heuristic erklärt wird. Sehr wichtig...

Durch alle Daten Gehen und diese erklären. 
Welche sache bevorzugen Multi_line clears etc....

Overtime Statistics to show that woukd be good:
Delta, Score, Lines on average per generation....

What Graphs to make? Update the generation overview of the agents with score and parameters etc...

In graphs show: Score over Generations, average time blocks placed per generation, theta (delta) change over generations...

Also look at how certain parameters prioritize multiline clears....


We should also track delta over time... see how the program learns. 

Also: We notice delta falling of substantially after a few generation. 
We come to the conclusion. Variance within this system is very high. Thusly it would make more sense to make fewer generations, but increase the episodes each agent gets to play, to compensate for this variance

Variance is high because the AI is learning to play with only on piece, no look ahead piece. Therefore the randomness of the game being played in this way has to be compensated for...

----

We ran the Agents for 15 Generations. Not really as successful as it should be. 
There was a rise in Delta increase for a few episodes, but this evened out relativly fast.
After episode 6, it seemed like a maximum was achieved. 

A few adjustments will be made:

Went from 10 episodes to 50 episodes per agent to account for the high variance within the environment
Increased the Frame rate to 1000

Made a change to the Fittness Calculation
Made line clears more important as aggregate height increases
Put it into google colab....

Google Collab - no video, remove display an draw functions...


---

Possibility to make the AI also take into account the lookahead piece. (to maybe negate the large variance

How to do it?

1. for each position and rotation of the current game. The AI checks how good the piece placement will be (immediate)

2. To make the game take into account the look ahead piece, we can take the possible blockmat that that rotation and position of the current piece would create, create a new mainboard with that blockmat (with the reverse blockmat function) and have the look ahead piece go through all possible positions. Get the highest score the lookahead piece could achieve with this blocmat, and add that to the score of the current piece

3. change the csv files to be easier readible in excel...




Interesting things: High priority for lowering height, and holes, but low prio for lines and bumpiness will cause it to make toweres. (But the beginning is always amazing, leaves very very little holes, could easily make quadra clears...

The cool thing about this AI is also, depending on what you choose to select as your fitness (criteria for elimination), the AI will begin to evolve to maximize that output...

In [None]:
# COMMIT CHANGES WHEN YOU CLEANED UP THE NOTEBOOK