In [None]:
%pip install numpy
import numpy as np


A celúla acima instala e importa a biblioteca numpy, necessaria pois usamos arrays do numpy para representar a board

In [1]:
# Definição de algumas constantes usadas durante o código
NUM_ROW = 6
NUM_COL = 7
EMPTY = "-"
PLAYER_PIECE = "X"
AI_PIECE = "O"

In [None]:
def get_segments(board):
        segments = []
        # Verifica linhas e colunas
        for i in range(NUM_ROW):
            line = board[i]
            for j in range(4):
                segments.append(line[j : j + 4])
            col = board[:, i]
            for j in range(3):
                segments.append(col[j : j + 4])

        # Verifica a ultima coluna
        col = board[:, NUM_COL - 1]
        for j in range(3):
            segments.append(col[j : j + 4])

        # Verifica as diagonais principais
        for i in range(-2, 4):
            dia = np.diag(board, i)
            for j in range(len(dia) - 3):
                segments.append(dia[j : j + 4])

        # Dá flip no array e verifica as diagonais principais do array flipado
        # (equivalentes às diagonais perpendiculares às principais do array original)
        state_tr = np.fliplr(board)
        for i in range(-2, 4):
            dia = np.diag(state_tr, i)
            for j in range(len(dia) - 3):
                segments.append(dia[j : j + 4])
        return segments

def gen_dict():
    board = [[f"{i},{j}" for j in range(7)]for i in range(6)]
    board = np.array(board)
    segments = get_segments(board)
    index_dict = {}
    position_dict = {}
    for j in range(7):
        for i in range(6):
            temp = []
            for z,segment in enumerate(segments):
                if f"{i},{j}" in segment:
                    temp.append(z)
                index_dict[(i,j)] = temp
                position_dict[(i,j)] = [[tuple(map(int, pos.split(","))) for pos in segments[index]] for index in temp]
    return index_dict,position_dict
index_dict, pos_dict = gen_dict()

O código acima gera dois dicionarios usados no calcúlo das heuristicas de segmentos da board, ambos tem como chave uma posição da board, já os valores são:
- index_dict: Os indices dos segmentos na lista de heuristica, que terão suas heuristicas alteradas ao colocar uma peça nessa posição.
- pos_dict: Uma lista das listas de posições contidas no segmentos que contem a posição chave

exemplo:
- index_dict[(1,2)] = [7, 8, 9, 18, 19, 51, 52, 68]
- pos_dict[(1,2)] = [[(1, 0), (1, 1), (1, 2), (1, 3)], [(1, 1), (1, 2), (1, 3), (1, 4)], [(1, 2), (1, 3), (1, 4), (1, 5)], [(0, 2), (1, 2), (2, 2), (3, 2)], [(1, 2), (2, 2), (3, 2), (4, 2)], [(0, 1), (1, 2), (2, 3), (3, 4)], [(1, 2), (2, 3), (3, 4), (4, 5)], [(0, 3), (1, 2), (2, 1), (3, 0)]]

In [None]:
#Pequena função que pega uma lista de tamanho qualquer e retorna uma lista de todos os segmentos de 4 elementos contidos nessa lista
def segmentate(input):
    out = []
    for i in range(len(input) - 3):
        out.append(input[i:i+4])
    return out

A seguir temos a definição da classe game, que representa um jogo, nela se tem os atributos:
- game_winner: armazena quem ganhou o jogo ou a peça vazia, caso ninguem tenha ganhado
- board_is_full: boolean que fica verdadeiro quando todas as colunas estão cheias
- segment_heuristics: lista da heuristica de cada segmento
- self.board: array que representa o tabuleiro
- self.last_move: guarda quem jogou por ultimo


In [None]:
class game:
    #turn = 0
    def __init__(self):
        self.game_winner = EMPTY  # variáveis que controlam o fim do jogo
        self.board_is_full = False
        self.segment_heuristics = [0 for _ in range (69)]
        self.board = np.full([NUM_ROW, NUM_COL], EMPTY)
        self.last_move = None

    def drawBoard(self):
        for i in range(7): print(i, end=" ") #imprime os numeros das colunas
        print() # coloca newline
        for line in np.flip(self.board, 0):
            for piece in line:
                print(piece, end=" ")
            print()# coloca newline
        return

    """Dado um input, verifica a função availableCollumns para saber se é válido.
    Se não for pede novamente o input, do contrário usa a função putGamePiece para alterar a board."""

    def playOneTurn(self):
        available = self.availableCollumns()
        try:  # error handling
            collumn = int(
                input("Choose in which collumn do you wanna play or press 9 to quit: ")
            )
        except:
            collumn = -1

        while collumn not in available:
            if collumn == 9:
                quit()  # opção para quitar
            try:  # more error handlings
                collumn = int(
                    input(
                        "The collumn you selected is either full or invalid, choose another one or press 9 to quit: "
                    )
                )
            except:
                collumn = -1
        self.putGamePiece(collumn, PLAYER_PIECE)
        return

    """Verifica qual a próxima row vazia e alterar a põe a peça nesta row. 
    Checa após cada movimento a função check_win_after_move para saber se houve ganhador."""

    def putGamePiece(self, collumn, piece):
        available = self.availableCollumns()
        if collumn not in available:
            print("The last move was invalid, below is the last state of the board and the move made, the game will quit")
            self.drawBoard()
            print("last move = {collumn}")
            quit()

        piece_placement = self.nextEmptyRowinCollumn(collumn)
        self.board[piece_placement][collumn] = piece
        if self.check_win_after_move(piece_placement, collumn, piece):
            self.game_winner = piece  # checar se houve ganhador
        elif not self.availableCollumns():
            self.board_is_full = True  # se não há colunas vazias, a board está cheia
        # not list aparentemente é um dos jeitos mais eficientes de checar se uma lista está vazia, python é estranho - M
        self.update_heuristics(piece_placement, collumn)
        self.last_move = collumn
        return

    """Checa a última row para saber quais colunas não estão cheias. Retorna a lista de colunas."""

    def availableCollumns(self):
        available = []
        for i, value in enumerate(self.board[NUM_ROW - 1]):
            if value == EMPTY:
                available.append(i)
        return available

    """Dado uma coluna, verifica qual a próxima row vazia. Retorna o número da row."""

    def nextEmptyRowinCollumn(self, collumn):
        for i, value in enumerate(self.board[:, collumn]):
            if value == EMPTY:
                return i
        return

    """Função que checa se houve vitória após cada movimento. 
    Verifica somente os segmentos que contém a peça em [move_row, move_col]."""
    def check_win_after_move(self, move_row, move_col, piece):
        # verificar se houve vitória na row
        row_count = 0
        for i in range(move_row - 3, move_row + 4):
            if i in range(0, NUM_ROW) and self.board[i][move_col] == piece:
                row_count += 1
            else:
                row_count = 0
            if row_count == 4:
                return True

        # verificar se houve vitória na coluna
        collumn_count = 0
        for j in range(move_col - 3, move_col + 4):
            if j in range(NUM_COL) and self.board[move_row][j] == piece:
                collumn_count += 1
            else:
                collumn_count = 0
            if collumn_count == 4:
                return True

        # verificar se houve vitória na diagonal principal e adjacentes
        downrightdiag_count = 0
        for k in range(-3, 4):
            i = move_row + k
            j = move_col + k
            if (
                i in range(NUM_ROW)
                and j in range(NUM_COL)
                and self.board[i][j] == piece
            ):
                downrightdiag_count += 1
            else:
                downrightdiag_count = 0
            if downrightdiag_count == 4:
                return True

        # verificar se houve vitória na diagonal secundária e adjacentes
        upleftdiag_count = 0
        for k in range(-3, 4):
            i = move_row - k
            j = move_col + k
            if (
                i in range(NUM_ROW)
                and j in range(NUM_COL)
                and self.board[i][j] == piece
            ):
                upleftdiag_count += 1
            else:
                upleftdiag_count = 0
            if upleftdiag_count == 4:
                return True
        return False

    # função que começa o jogo
    def start_ai(self):
        starts = int(input("\nChoose which AI to play against: 0 = A*; 1 = mini-max; 2 = AlphaBeta; 3 = MCTS: "))
        if starts not in range(4):
            self.start_ai()
        return starts

    # não está em uso ainda
    # explicar o que faz pls
    def movelist_2_board(self, moves):
        nextPiece = PLAYER_PIECE  # o jogo tem que começar com o player
        oldPiece = AI_PIECE
        for move in moves:
            if not self.board_is_full and move in self.availableCollumns():
                self.putGamePiece(move, nextPiece)
                nextPiece, oldPiece = oldPiece, nextPiece

    # retorna lista com todos os segmentos de 4 em todas as direções
                
    def get_segments(self):
        segments = []
        # Verifica linhas e colunas
        for i in range(NUM_ROW):
            line = self.board[i]
            for j in range(4):
                segments.append(line[j : j + 4])
            col = self.board[:, i]
            for j in range(3):
                segments.append(col[j : j + 4])

        # Verifica a ultima coluna
        col = self.board[:, NUM_COL - 1]
        for j in range(3):
            segments.append(col[j : j + 4])

        # Verifica as diagonais principais
        for i in range(-2, 4):
            dia = np.diag(self.board, i)
            for j in range(len(dia) - 3):
                segments.append(dia[j : j + 4])

        # Dá flip no array e verifica as diagonais principais do array flipado
        # (equivalentes às diagonais perpendiculares às principais do array original)
        state_tr = np.fliplr(self.board)
        for i in range(-2, 4):
            dia = np.diag(state_tr, i)
            for j in range(len(dia) - 3):
                segments.append(dia[j : j + 4])
        return segments
    def segments_that_intersect(self, move_row, move_col):
        segments = [[self.board[pos[0],pos[1]] for pos in list] for list in pos_dict[(move_row,move_col)]]
        return segments

    # avalia um segmento e retorna a sua pontuação
    def update_heuristics(self,move_row,move_col):
        indexes = index_dict[(move_row,move_col)]
        segments = self.segments_that_intersect(move_row, move_col)             
        for i in range(len(indexes)):
            self.segment_heuristics[indexes[i]] = self.evaluate(segments[i])

    def evaluate(self, segment):
        count_x = 0
        count_o = 0

        for i in segment:
            if i == PLAYER_PIECE:
                count_x += 1
            elif i == AI_PIECE:
                count_o += 1

        if (count_x == 0 and count_o == 0) or (count_x > 0 and count_o > 0):
            return 0

        match count_x:
            case 1:
                return 1
            case 2:
                return 10
            case 3:
                return 50
            case 4:
                return 512

        match count_o:
            case 1:
                return -1
            case 2:
                return -10
            case 3:
                return -50
            case 4:
                return -512

    # avalia todos as posições para descobrir se há vencedor
    def evaluate_all(self):
        if self.game_winner == PLAYER_PIECE:
            return 512
        elif self.game_winner == AI_PIECE:
            return -512
        elif self.board_is_full:
            return 0
        else:
            sum = 0
            if self.player() == PLAYER_PIECE:
                sum = sum + 16
            elif self.player() == AI_PIECE:
                sum = sum - 16
            for segment in self.get_segments():
                sum = sum + self.evaluate(segment)
            return sum

    """Verifica se um determinado estado é um estado terminal/final 
    (estado em que um dos jogadores ganhou ou em que não há ações possíveis)"""

    def terminal(self):
        if self.game_winner == PLAYER_PIECE or self.game_winner == AI_PIECE:
            return True
        else:
            return self.board_is_full
        """
        elif len(self.availableCollumns())==0:
            return True
        else:
            return False
        """

    """Recebe um estado e retorna o vencedor (no caso deste existir)"""

    def checkwin_wholeboard(self):
        for (
            segment
        ) in self.get_segments():  # Itera sobre todos os segmentos de tamanho 4
            if np.array_equal(segment, ["X", "X", "X", "X"]):
                return "X"
            elif np.array_equal(segment, ["O", "O", "O", "O"]):
                return "O"
        return None

    """Otimização da função player. Utiliza self.turn para avaliar qual o jogador atual.
    Não está em uso em outras classes."""

    """    
    def player_(self):
        if self.board_is_full:
            return None
        elif self.turn % 2 == 0:
            return PLAYER_PIECE
        else:
            return AI_PIECE"""

    """Recebe um estado e retorna o jogador nesse turno."""

    def player(self):
        cx = 0  # contador de X
        co = 0  # contador de O
        for i in range(6):
            a = self.board[i]
            for j in range(7):
                b = a[j]
                if b == PLAYER_PIECE:
                    cx += 1
                elif b == AI_PIECE:
                    co += 1
        # caso do tabuleiro estar completamente ocupado
        if cx + co == NUM_COL * NUM_ROW:
            return None

        # Se o número de X's for menor ou igual ao numéro de O's, então é a vez de X jogar.
        if cx <= co:
            return PLAYER_PIECE
        else:
            return AI_PIECE

    def utility(self):
        if self.game_winner == PLAYER_PIECE:
            return 512
        elif self.game_winner == AI_PIECE:
            return -512
        else:
            return 0