<a href="https://colab.research.google.com/github/Radu25/An4Sem1-InteligentaArtificiala-Laboratoare/blob/main/5_MinMax.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# MinMax

MinMax este un algoritm de luare a deciziilor pentru diferite sisteme de inteligență artificială. Ideea pe care se bazează algoritmul MinMax este acceea de maximizare a câștigului minim.

Valoarea maximin reprezintă cea mai ridicată valoare pe care un agent o poate obține fără a ști acțiunile celuilalt jucător. 

Cum se aplică MinMax?
1. se definesc 2 jucători: MAX - cel care are ca scop maximizarea rezultatului jocului, și MIN - cel care are ca scop minimizarea rezultatului jocului.
2. se reprezintă jocul sub forma unui arbore din perspectiva jucătorului MAX. Frunzele arborelui vor reprezenta valorile diferitelor situatii finale ale jocului. Aceste valori le definim in funcție de problemă. Exemplu:
  * victorie MAX: 100 - adancimea arborelui
  * victorie MIN: -100 + adancimea arborelui
  * remiza: 0 - adancimea arborelui

3. Scopul jucatorului MAX: sa dirijeze jocul înspre frunzele cu valori maxime.
4. Scopul jucatorului MIN: sa dirijeze jocul înspre frunzele cu valori minime. Jucătorul MIN este o reprezentare a adversarului. Presupunem deci că adversarul va lua întotdeauna deciziile cele mai bune pentru el.
5. Cum decidem pe ce ramură va înainta jocul? Pornim de la frunze, și, în funcție de perspectiva din care urmează să luăm decizia (MIN sau MAX) alegem pe care ramură să înaintăm.


Un exemplu de aplicare a MinMax pe un arbore de mici dimensiuni găsiți [aici](https://www.youtube.com/watch?v=STjW3eH0Cik&t=970s).




## Aplicație: X și O
1. Implementați funcția *check_win*.
2. Imbunatatiti modul de joc al agentului artificial, utilizând algoritmul MinMax. 
3. BONUS: Analizați **soluția propusă** la și propuneți îmbunătățiri.

In [None]:
EMPTY = " "
X = "X"
O = "0"
N = 3
playground = [[EMPTY for i in range(N)] for j in range(N)]
 
 
def move(CH, lin, col):
  if lin < 0 or lin >= N or col < 0 or col >= N:
    return False
 
  if playground[lin][col] == EMPTY:
    playground[lin][col] = CH
    return True
 
  return False
 
def agent_move(O):
  for i in range(N):
    for j in range(N):
      if move(O, i, j):
        return
 
 
def check_win():
  # print the winning player
  pass #return True when game over
 
game_over = False
 
while not game_over:
  lin = int(input("Linia = "))
  col = int(input("Coloana = "))
  move(X, lin, col)
 
  agent_move(O)
 
  game_over = check_win()
 
  for line in playground:
    print(line)

## Solutie propusă

In [None]:
import copy
import numpy as np
 
EMPTY = " "
X = "X"
O = "0"
N = 3

def move(CH, lin, col, playground):
  if lin < 0 or lin >= N or col < 0 or col >= N:
    return False
 
  if playground[lin][col] == EMPTY:
    playground[lin][col] = CH
    return True
 
  return False 

def doMove(CH, move, board):
  if move[0] < 0 or move[0] >= N or move[1] < 0 or move[1] >= N:
    return False
 
  if board[move[0]][move[1]] == EMPTY:
    board[move[0]][move[1]] = CH
    return True
 
  return False
 
def undoMove(move, board):
  if move[0] < 0 or move[0] >= N or move[1] < 0 or move[1] >= N:
    return False
 
  board[move[0]][move[1]] = EMPTY
 
def possibleMoves(board):
  moves = []
  for i in range(N):
    for j in range(N):
      if board[i][j] == EMPTY:
        moves.append((i,j))
  return moves
 
def evaluate(board, depth = 0, isMaximizingPlayer = False):
  final, player = check_win(board)
  if final:
    if player == O:
      return 100 - depth
    elif player == EMPTY:
      return -depth
    else:
      return -100 + depth
 
  if isMaximizingPlayer:
      evals = []
      for move in possibleMoves(board):
        doMove(O, move, board)
        evals.append(evaluate(board, depth + 1, False))
        undoMove(move, board)
      bestVal = max(evals)
  else:
      evals = []
      for move in possibleMoves(board):
        doMove(X, move, board)
        evals.append(evaluate(board, depth + 1, True))
        undoMove(move, board)
      bestVal = min(evals)
 
  return bestVal
 
def print_computed_values(moves, evals):
  moves = { move : eval for move, eval in zip(moves, evals)}
  for i in range(N):
    for j in range(N):
      if (i,j) in moves:
        print(moves[(i,j)], end="\t")
      else:
        print('__', end="\t")
    print()

def agent_move(O, board):
  best_move = None
  moves = possibleMoves(board)
  
  evals = []
  for move in possibleMoves(board):
    doMove(O, move, board)
    evals.append(evaluate(board, 0, False))
    undoMove(move, board)
 
  best_move = moves[np.argmax(evals)]
  print_computed_values(moves, evals)
  
  doMove(O, best_move, board)
 
 
def check_win(board):
  for line in range(N):
    if board[line][0] != EMPTY:
      if board[line][0] == board[line][1] and board[line][1] == board[line][2]:
        return (True, board[line][0])
 
  for col in range(N):
    if board[0][col] != EMPTY:
      if board[0][col] == board[1][col] and board[1][col] == board[2][col]:
        return (True, board[0][col])
 
  if board[1][1] != EMPTY:
    if (board[1][1] == board[0][0] and board[1][1] == board[2][2]) or \
    (board[0][2] == board[1][1] and board[2][0] == board[1][1]):
        return (True, board[1][1])
  if not possibleMoves(board):
    return (True, EMPTY)
 
  return (False, EMPTY)
 
game_over = False
 
playground = [[EMPTY for i in range(N)] for j in range(N)]

while not game_over:
  lin = int(input("Linia = "))
  col = int(input("Coloana = "))

  move(X, lin, col, playground)
  game_over, _ = check_win(playground) # jocul se poate termina dupa mutarea utilizatorului
  
  if not game_over:
    agent_move(O, playground)
    game_over, _ = check_win(playground)
  
  for line in playground:
    print(line)