# Pipeline de Pré-processamento - Tic Tac Toe
**Author**: Gabriela Dellamora Paim, Bruno Duarte Carlan

**Version**: 12/04/2025

**Python Ver**: 3.13.1

In [None]:
import pandas as pd

PATH_OLD = './data_old/tic-tac-toe.data'
PATH_NEW = './data_processed.csv'
PATH_ON_GOING = './data_ongoing.csv'
X_WIN   = X = '1'
O_WIN   = O ='-1'
DRAW    = '0'
ONGOING = '0.5'

In [None]:
# Dataframe onde X sempre é quem começa
df = pd.read_csv(PATH_OLD, index_col=False)
df.columns = ['0', '1', '2', '3', '4', '5', '6', '7', '8', 'category']
df.describe()

# Tratar Dados Existentes

In [None]:
# Para facilitar a diferenciacao entre X venceu e O venceu
df.replace(to_replace={'positive' : X_WIN}, inplace=True)

In [None]:
'''
Removemos as observações em que O inicia o jogo pois:
1 - Não segue as regras originais do jogo
2 - Vamos diminuir o escopo de observações devido a limitação de 32 observações DRAW
'''
# Observações onde O começa
# df_o_begins = df_x_begins.replace(to_replace={'o':'x', 'x':'o', X_WIN:O_WIN}).copy()

# df_finished_tables = pd.concat([df_x_begins, df_o_begins], ignore_index=True).copy()
# print(f'BEFORE={df_x_begins.shape} : AFTER={df_finished_tables.shape}')
# df_o_begins.describe()
print(df.category.unique())
df.describe()

In [None]:
def get_state(symbol):
    ''' Retorna simbolo utilizado pela pipeline.'''
    match symbol.lower():
        case 'o': return O_WIN
        case 'x': return X_WIN
    return DRAW

def check_wins(obs):
    '''Valida estado final do jogo. Pode ser O_WIN, X_WIN e DRAW. Trata casos que não precisam de alteração'''
    # lazy evaluation
    if obs.category != 'negative':
        return obs.category

    # Diagonais
    if (obs.iloc[0] == obs.iloc[4] == obs.iloc[8]) or (obs.iloc[2] == obs.iloc[4] == obs.iloc[6]):
        return get_state(obs.iloc[4])

    for i in range(3):
        # Linhas
        if obs.iloc[0 + i] == obs.iloc[3 + i] == obs.iloc[6 + i]:
            s = get_state(obs.iloc[0 + i])
            if s != DRAW:
                return s
        # Colunas
        if obs.iloc[0 + (i * 3)] == obs.iloc[1 + (i * 3)] == obs.iloc[2 + (i * 3)]:
            s = get_state(obs.iloc[0 + (i * 3)])
            if s != DRAW:
                return s
    return DRAW

In [None]:
df['category'] = df.apply(check_wins, axis=1)

In [None]:
print(df.category.unique())
print(f'Total={df.shape}')
print(f'Draw={df[df.category == DRAW].shape}')
df.describe()
df[df.category == DRAW].sample(10)

In [None]:
# Exportar
df.to_csv(PATH_NEW, index=False)

In [None]:
df_ongoing = pd.read_csv(PATH_ON_GOING)
df_ongoing['category'] = '~'
df_ongoing = df_ongoing[['0', '1', '2', '3', '4', '5', '6', '7', '8', 'category']]

In [None]:
df_concat = pd.concat([df, df_ongoing], ignore_index=True)
df_concat.to_csv('data_processed.csv', index=False)