# Laboratorio 6

## Integrantes

### Sergio Orellana - 221122

### Andre Marroquin - 22266

### Rodrigo Mansilla - 22611

# Link del repositorio

https://github.com/mar22266/LABORATORIOS-IA.git

# Link del video

https://youtu.be/3FzwNv2SR60


# Tasks 1 - Teoría


1. **En un juego de suma cero para dos jugadores, ¿cómo funciona el algoritmo minimax para determinar la estrategia óptima para cada jugador? ¿Puede explicarnos el concepto de "valor minimax" y su importancia en este contexto?**

El algoritmo minimax es una técnica utilizada en la teoría de juegos, especialmente en juegos de suma cero con dos jugadores, para determinar la estrategia óptima de cada participante. Este algoritmo asume que ambos jugadores actuarán de manera óptima: uno buscará maximizar su ganancia (Max) y el otro minimizará la ganancia del oponente (Min).​

El proceso del algoritmo consiste en explorar todas las posibles jugadas futuras, construyendo un árbol de decisiones donde cada nodo representa un estado del juego. En este árbol, los nodos correspondientes al jugador Max seleccionan el valor máximo de sus posibles movimientos, mientras que los nodos del jugador Min eligen el valor mínimo. Este proceso continúa recursivamente hasta alcanzar las hojas del árbol, que representan los estados finales del juego con sus respectivas evaluaciones.​

El valor minimax es el resultado numérico obtenido al evaluar cada nodo del árbol según este procedimiento. Este valor representa la mejor puntuación que un jugador puede asegurar, considerando que el oponente también jugará de manera óptima. Es fundamental en este contexto porque guía a cada jugador en la elección de sus movimientos, garantizando que adopten la estrategia que maximiza sus beneficios o minimiza sus pérdidas, dependiendo de su rol en el juego.​

2. **Compare y contraste el algoritmo minimax con la poda alfa-beta. ¿Cómo mejora la poda alfa-beta la eficiencia del algoritmo minimax, particularmente en árboles de caza grandes? Proporcione un ejemplo para ilustrar la diferencia en la complejidad computacional entre la poda minimax y alfa-beta.**

El algoritmo minimax evalúa exhaustivamente todas las posibles jugadas futuras hasta una cierta profundidad, lo que puede ser computacionalmente costoso, especialmente en juegos con un gran número de posibles movimientos. La poda alfa-beta es una técnica que optimiza el algoritmo minimax al reducir la cantidad de nodos que se evalúan en el árbol de decisiones. Esta técnica descarta ramas del árbol que no influirán en la decisión final, basándose en los valores alfa y beta, que representan los límites actuales de las mejores opciones encontradas para los jugadores Max y Min, respectivamente.

Al implementar la poda alfa-beta, se evita la evaluación de movimientos que no afectarán el resultado final, lo que mejora significativamente la eficiencia del proceso de búsqueda. En el mejor de los casos, la poda alfa-beta puede reducir el número de nodos evaluados de $O(b^d)$ a $O(b^{d/2})$, donde b es el factor de ramificación y d la profundidad del árbol. Esto implica que, con poda alfa-beta, se puede explorar el doble de profundidad en el mismo tiempo que con el algoritmo minimax estándar.

Por ejemplo, en un juego con un factor de ramificación de 4 y una profundidad de 6, el algoritmo minimax evaluaría hasta $4^6 = 4,096$ nodos. Con una poda alfa-beta eficiente, este número podría reducirse a aproximadamente $4^3 = 64$ nodos, lo que representa una mejora sustancial en términos de complejidad computacional.

3.  **¿Cuál es el papel de expectiminimax en juegos con incertidumbre, como aquellos que involucran nodos de azar o información oculta? ¿En qué se diferencia el expectiminimax del minimax en el manejo de resultados probabilísticos y cuáles son los desafíos clave que aborda?**

El algoritmo expectiminimax es una extensión del algoritmo minimax diseñada para manejar juegos que incorporan elementos de azar o información incompleta. Mientras que el minimax asume decisiones deterministas de los jugadores, el expectiminimax introduce nodos de azar en el árbol de decisiones para representar eventos aleatorios, como el lanzamiento de un dado o la aparición de cartas en un juego.​

En el árbol de decisiones del expectiminimax, además de los nodos Max y Min, se incluyen nodos de azar que representan las posibles situaciones aleatorias del juego. Estos nodos se evalúan calculando el valor esperado de todas las posibles salidas, ponderadas por sus respectivas probabilidades. Esta incorporación permite que el algoritmo maneje de manera efectiva los resultados probabilísticos y tome decisiones óptimas considerando tanto las acciones del oponente como los eventos aleatorios.​

La principal diferencia entre minimax y expectiminimax radica en la gestión de la incertidumbre. Mientras que minimax solo considera las decisiones de los jugadores, expectiminimax integra también las probabilidades de eventos aleatorios, proporcionando una estrategia más robusta en juegos donde el azar desempeña un papel significativo.​

Por ultimo, uno de los desafíos clave que aborda el expectiminimax es la complejidad computacional, ya que la introducción de nodos de azar aumenta significativamente el tamaño del árbol de decisiones. Además, requiere un conocimiento preciso de las probabilidades asociadas a cada evento aleatorio, lo cual puede ser complejo de determinar en ciertos juegos.


# Task 2 - Connect Four


In [None]:
import math
import random
import copy

# Dimensiones del tablero
ROW_COUNT = 6
COLUMN_COUNT = 7

# Definición de piezas: 0 vacío, 1 y 2 jugadores
EMPTY = 0


# Crea el tablero vacío
def create_board():
    # Retorna una matriz 6x7 con ceros
    board = [[EMPTY for _ in range(COLUMN_COUNT)] for _ in range(ROW_COUNT)]
    return board


# Coloca la pieza en el tablero en row, col
def drop_piece(board, row, col, piece):
    board[row][col] = piece


# Verifica si la columna tiene espacio
def is_valid_location(board, col):
    return board[0][col] == EMPTY


# Retorna la fila más baja libre en la columna
def get_next_open_row(board, col):
    for r in range(ROW_COUNT - 1, -1, -1):
        if board[r][col] == EMPTY:
            return r
    return None


# Revisa si hay 4 en línea para la pieza
def winning_move(board, piece):
    # Horizontal
    for r in range(ROW_COUNT):
        for c in range(COLUMN_COUNT - 3):
            if (
                board[r][c] == piece
                and board[r][c + 1] == piece
                and board[r][c + 2] == piece
                and board[r][c + 3] == piece
            ):
                return True
    # Vertical
    for c in range(COLUMN_COUNT):
        for r in range(ROW_COUNT - 3):
            if (
                board[r][c] == piece
                and board[r + 1][c] == piece
                and board[r + 2][c] == piece
                and board[r + 3][c] == piece
            ):
                return True
    # Diagonal positiva
    for r in range(3, ROW_COUNT):
        for c in range(COLUMN_COUNT - 3):
            if (
                board[r][c] == piece
                and board[r - 1][c + 1] == piece
                and board[r - 2][c + 2] == piece
                and board[r - 3][c + 3] == piece
            ):
                return True
    # Diagonal negativa
    for r in range(ROW_COUNT - 3):
        for c in range(COLUMN_COUNT - 3):
            if (
                board[r][c] == piece
                and board[r + 1][c + 1] == piece
                and board[r + 2][c + 2] == piece
                and board[r + 3][c + 3] == piece
            ):
                return True
    return False


# Retorna la lista de posiciones que conforman la línea ganadora
def get_winning_positions(board, piece):
    for r in range(ROW_COUNT):
        for c in range(COLUMN_COUNT - 3):
            if (
                board[r][c] == piece
                and board[r][c + 1] == piece
                and board[r][c + 2] == piece
                and board[r][c + 3] == piece
            ):
                return [(r, c + i) for i in range(4)]
    for c in range(COLUMN_COUNT):
        for r in range(ROW_COUNT - 3):
            if (
                board[r][c] == piece
                and board[r + 1][c] == piece
                and board[r + 2][c] == piece
                and board[r + 3][c] == piece
            ):
                return [(r + i, c) for i in range(4)]
    for r in range(3, ROW_COUNT):
        for c in range(COLUMN_COUNT - 3):
            if (
                board[r][c] == piece
                and board[r - 1][c + 1] == piece
                and board[r - 2][c + 2] == piece
                and board[r - 3][c + 3] == piece
            ):
                return [(r - i, c + i) for i in range(4)]
    for r in range(ROW_COUNT - 3):
        for c in range(COLUMN_COUNT - 3):
            if (
                board[r][c] == piece
                and board[r + 1][c + 1] == piece
                and board[r + 2][c + 2] == piece
                and board[r + 3][c + 3] == piece
            ):
                return [(r + i, c + i) for i in range(4)]
    return []


# Retorna las columnas disponibles para jugar
def get_valid_locations(board):
    valid_locations = []
    for col in range(COLUMN_COUNT):
        if is_valid_location(board, col):
            valid_locations.append(col)
    return valid_locations


# Verifica si el juego terminó
def is_terminal_node(board):
    return (
        winning_move(board, 1)
        or winning_move(board, 2)
        or len(get_valid_locations(board)) == 0
    )


# Evalúa una ventana de 4 celdas
def evaluate_window(window, piece):
    score = 0
    opponent_piece = 1 if piece == 2 else 2
    if window.count(piece) == 4:
        score += 100
    elif window.count(piece) == 3 and window.count(EMPTY) == 1:
        score += 5
    elif window.count(piece) == 2 and window.count(EMPTY) == 2:
        score += 2
    if window.count(opponent_piece) == 3 and window.count(EMPTY) == 1:
        score -= 4
    return score


# Evaluación heurística del tablero
def score_position(board, piece):
    score = 0
    center_column = [board[r][COLUMN_COUNT // 2] for r in range(ROW_COUNT)]
    score += center_column.count(piece) * 3
    for r in range(ROW_COUNT):
        row_array = board[r]
        for c in range(COLUMN_COUNT - 3):
            window = row_array[c : c + 4]
            score += evaluate_window(window, piece)
    for c in range(COLUMN_COUNT):
        col_array = [board[r][c] for r in range(ROW_COUNT)]
        for r in range(ROW_COUNT - 3):
            window = col_array[r : r + 4]
            score += evaluate_window(window, piece)
    for r in range(ROW_COUNT - 3):
        for c in range(COLUMN_COUNT - 3):
            window = [board[r + i][c + i] for i in range(4)]
            score += evaluate_window(window, piece)
    for r in range(3, ROW_COUNT):
        for c in range(COLUMN_COUNT - 3):
            window = [board[r - i][c + i] for i in range(4)]
            score += evaluate_window(window, piece)
    return score


# Algoritmo minimax con o sin poda alfa-beta
def minimax(board, depth, alpha, beta, maximizingPlayer, piece, use_pruning):
    valid_locations = get_valid_locations(board)
    terminal = is_terminal_node(board)
    opponent_piece = 1 if piece == 2 else 2
    if depth == 0 or terminal:
        if terminal:
            if winning_move(board, piece):
                return (None, math.inf)
            elif winning_move(board, opponent_piece):
                return (None, -math.inf)
            else:
                return (None, 0)
        else:
            return (None, score_position(board, piece))
    if maximizingPlayer:
        value = -math.inf
        best_col = random.choice(valid_locations)
        for col in valid_locations:
            row = get_next_open_row(board, col)
            b_copy = copy.deepcopy(board)
            drop_piece(b_copy, row, col, piece)
            new_score = minimax(
                b_copy, depth - 1, alpha, beta, False, opponent_piece, use_pruning
            )[1]
            if new_score > value:
                value = new_score
                best_col = col
            if use_pruning:
                alpha = max(alpha, value)
                if alpha >= beta:
                    break
        return best_col, value
    else:
        value = math.inf
        best_col = random.choice(valid_locations)
        for col in valid_locations:
            row = get_next_open_row(board, col)
            b_copy = copy.deepcopy(board)
            drop_piece(b_copy, row, col, piece)
            new_score = minimax(
                b_copy, depth - 1, alpha, beta, True, opponent_piece, use_pruning
            )[1]
            if new_score < value:
                value = new_score
                best_col = col
            if use_pruning:
                beta = min(beta, value)
                if alpha >= beta:
                    break
        return best_col, value


# Imprime el tablero; resalta las posiciones ganadoras en rojo
def print_board(board, winning_positions=[]):
    for r in range(ROW_COUNT):
        row_str = ""
        for c in range(COLUMN_COUNT):
            cell = board[r][c]
            if (r, c) in winning_positions:
                row_str += "\033[91m" + str(cell) + "\033[0m" + " "
            else:
                row_str += str(cell) + " "
        print(row_str)
    print("")  # Se quitan los índices de columna


# Función principal de juego
def iniciar_juego(mode="human_vs_ai", depth=4):
    board = create_board()
    game_over = False
    turn = 0
    print_board(board)
    while not game_over:
        if mode == "human_vs_ai":
            if turn == 0:
                valid_cols = get_valid_locations(board)
                col = -1
                while col not in valid_cols:
                    try:
                        col = int(input(f"Col (0-{COLUMN_COUNT-1}): "))
                        if col not in valid_cols:
                            print("No válido, intente otra vez.")
                    except ValueError:
                        print("Entrada inválida.")
                row = get_next_open_row(board, col)
                drop_piece(board, row, col, 1)
                if winning_move(board, 1):
                    winning_pos = get_winning_positions(board, 1)
                    print_board(board, winning_pos)
                    print("¡Ganaste!")
                    game_over = True
                else:
                    print_board(board)
            else:
                print("IA pensando...")
                use_pruning = True
                col, score = minimax(
                    board, depth, -math.inf, math.inf, True, 2, use_pruning
                )
                if col is None:
                    print("Empate!")
                    game_over = True
                else:
                    row = get_next_open_row(board, col)
                    drop_piece(board, row, col, 2)
                    if winning_move(board, 2):
                        winning_pos = get_winning_positions(board, 2)
                        print_board(board, winning_pos)
                        print("IA gana.")
                        game_over = True
                    else:
                        print_board(board)
            turn = (turn + 1) % 2
        elif mode == "ai_vs_ai":
            if turn == 0:
                print("IA sin poda...")
                use_pruning = False
                col, score = minimax(
                    board, depth, -math.inf, math.inf, True, 1, use_pruning
                )
                piece = 1
            else:
                print("IA con poda...")
                use_pruning = True
                col, score = minimax(
                    board, depth, -math.inf, math.inf, True, 2, use_pruning
                )
                piece = 2
            if col is None:
                print("Empate!")
                game_over = True
            else:
                row = get_next_open_row(board, col)
                drop_piece(board, row, col, piece)
                if winning_move(board, piece):
                    winning_pos = get_winning_positions(board, piece)
                    print_board(board, winning_pos)
                    if turn == 0:
                        print("IA sin poda gana!")
                    else:
                        print("IA con poda gana!")
                    game_over = True
                else:
                    print_board(board)
            turn = (turn + 1) % 2
        else:
            print("Modo no válido.")
            break


# Función para iniciar el juego
def ejecutar():
    print("1. Humano vs IA")
    print("2. IA vs IA")
    mode_input = input("Elija 1 o 2: ")
    if mode_input == "1":
        print("Modo: Humano vs IA")
        iniciar_juego(mode="human_vs_ai", depth=4)
    elif mode_input == "2":
        print("Modo: IA vs IA")
        iniciar_juego(mode="ai_vs_ai", depth=4)
    else:
        print("Opción no válida.")


ejecutar()

1. Humano vs IA
2. IA vs IA
Modo: IA vs IA
0 0 0 0 0 0 0 
0 0 0 0 0 0 0 
0 0 0 0 0 0 0 
0 0 0 0 0 0 0 
0 0 0 0 0 0 0 
0 0 0 0 0 0 0 

IA sin poda...
0 0 0 0 0 0 0 
0 0 0 0 0 0 0 
0 0 0 0 0 0 0 
0 0 0 0 0 0 0 
0 0 0 0 0 0 0 
0 0 0 1 0 0 0 

IA con poda...
0 0 0 0 0 0 0 
0 0 0 0 0 0 0 
0 0 0 0 0 0 0 
0 0 0 0 0 0 0 
0 0 0 0 0 0 0 
0 0 2 1 0 0 0 

IA sin poda...
0 0 0 0 0 0 0 
0 0 0 0 0 0 0 
0 0 0 0 0 0 0 
0 0 0 0 0 0 0 
0 0 1 0 0 0 0 
0 0 2 1 0 0 0 

IA con poda...
0 0 0 0 0 0 0 
0 0 0 0 0 0 0 
0 0 0 0 0 0 0 
0 0 0 0 0 0 0 
0 0 1 2 0 0 0 
0 0 2 1 0 0 0 

IA sin poda...
0 0 0 0 0 0 0 
0 0 0 0 0 0 0 
0 0 0 0 0 0 0 
0 0 1 0 0 0 0 
0 0 1 2 0 0 0 
0 0 2 1 0 0 0 

IA con poda...
0 0 0 0 0 0 0 
0 0 0 0 0 0 0 
0 0 2 0 0 0 0 
0 0 1 0 0 0 0 
0 0 1 2 0 0 0 
0 0 2 1 0 0 0 

IA sin poda...
0 0 0 0 0 0 0 
0 0 0 0 0 0 0 
0 0 2 0 0 0 0 
0 0 1 1 0 0 0 
0 0 1 2 0 0 0 
0 0 2 1 0 0 0 

IA con poda...
0 0 0 0 0 0 0 
0 0 2 0 0 0 0 
0 0 2 0 0 0 0 
0 0 1 1 0 0 0 
0 0 1 2 0 0 0 
0 0 2 1 0 0 0 

IA sin poda...
0 0

# Referencias

El código se generó usando el siguiente prompt:

"ayudame con la validacion de reglas y la implementacion del algoritmo minimax para este codigo connect 4. porfavor"

Con base en este prompt, se utilizó una herramienta de IA generativa (ChatGPT) para obtener una versión base que incluyera:

Validación de reglas y creación del tablero:
Se definió el tablero como una matriz de 6 filas por 7 columnas, se programaron funciones para validar jugadas (por ejemplo, verificar si una columna tiene espacio, obtener la fila disponible y detectar jugadas ganadoras mediante revisiones horizontales, verticales y diagonales).

Implementación del algoritmo minimax:
Se implementó el algoritmo minimax, con la opción de activar o desactivar la poda alfa-beta, siguiendo el esquema habitual del algoritmo para juegos competitivos. Esto incluye la generación de posibles movimientos, la evaluación heurística del tablero y el uso de poda para mejorar la eficiencia en la búsqueda de la jugada óptima.

- La técnica de poda alfa-beta: mejora tu algoritmo minimax. (2024, 10 marzo). https://www.toolify.ai/es/ai-news-es/la-tcnica-de-poda-alfabeta-mejora-tu-algoritmo-minimax-2698814

- Academy, E. (2024, 11 junio). ¿Qué es el principio minimax en la teoría de juegos y cómo se aplica a juegos de dos jugadores como el ajedrez o el Go? - Academia EITCA. EITCA Academy. https://es.eitca.org/inteligencia-artificial/eitc-ai-arl-aprendizaje-por-refuerzo-avanzado/casos-de-estudio/estudio-de-caso-de-juegos-cl%C3%A1sicos/revisi%C3%B3n-de-examen-estudio-de-caso-de-juegos-cl%C3%A1sicos/%C2%BFQu%C3%A9-es-el-principio-minimax-en-la-teor%C3%ADa-de-juegos-y-c%C3%B3mo-se-aplica-a-juegos-de-dos-jugadores-como-el-ajedrez-o-el-go%3F/

- La técnica de poda alfa-beta: mejora tu algoritmo minimax. (2024, marzo 10). https://www.toolify.ai/es/ai-news-es/la-tcnica-de-poda-alfabeta-mejora-tu-algoritmo-minimax-2698814
