# Jogo da velha (Tic Tac Toe)
### Classificação do resultado final do jogo
<hr>

#### User Story:

Como jogador e entusiasta de jogos de tabuleiro, quero ter acesso às chances de vitória do jogador que joga com "x", com base nos espaços em branco restantes no tabuleiro. Para poder desenvolver estratégias de jogadas mais eficazes, aumentando minhas chances de vencer.

#### Detalhamento simples:
1. Será utilizado um conjunto de dados que represente várias configurações de tabuleiros de jogos da velha, onde cada posição é ocupada por "x", "o" ou estar vazia ("b").
2. Será necessário pré-processar os dados, convertendo as posições ocupadas pelos jogadores em uma representação numérica. Onde, "x" será convertido em 2, "o" em 1 e "b" em 0.
3. Será utilizada uma abordagem de aprendizado supervisionado para treinar um modelo de machine learning capaz de prever a probabilidade de vitória do jogador que joga com "x", com base nos espaços em branco restantes no tabuleiro.
4. O conjunto de dados será dividido em um conjunto de treinamento e um conjunto de teste para avaliar a acurácia do modelo.
5. Diversos algoritmos de machine learning serão explorados, como regressão logística, árvores de decisão, random forest e SVM, para treinar o modelo.
6. O modelo será treinado com o conjunto de treinamento, onde aprenderá os padrões e características que indicam as chances de vitória do jogador que joga com "x".
7. Após o treinamento, o modelo será avaliado utilizando o conjunto de teste, onde a acurácia será calculada como a proporção de previsões corretas em relação ao número total de casos avaliados.
8. Com base na acurácia obtida, será possível determinar a eficácia do modelo em prever corretamente as chances de vitória do jogador que joga com "x".
9. Após a análise da acurácia, o modelo poderá ser implantado para fornecer a probabilidade de vitória em tempo real, considerando as configurações do tabuleiro fornecidas pelo usuário.
10. O resultado da acurácia (ou a probabilidade de vitória) pode ser apresentado ao usuário final por meio de uma interface de usuário (UI).

#### Informações dos atributos:                         

1. top-left-square: {x,o,b} 
2. top-middle-square: {x,o,b} 
3. top-right-square: {x,o,b}                        
4. middle-left-square: {x,o,b} 
5. middle-middle-square: {x,o,b} 
6. middle-right-square: {x,o,b} 
7. bottom-left-square: {x,o,b} 
8. bottom-middle-square: {x,o,b} 
9. bottom-right-square: {x,o,b} 
10. Class: {positive,negative}

<img src = "https://cdn-icons-png.flaticon.com/512/2911/2911124.png" width=150>

In [1]:
from src.save_dict import DictCSVWriter
from src.runner import ClassificationRunner
from src.dataset import Dataset, Preprocessing
from src.classification_model import ClassificationModel

#### Carregamento e exibição do dataset

In [2]:
DATASET_PATH = "data/tic-tac-toe.data"
COLUMNS = ["TopLeft", "TopMiddle", "TopRight", "MiddleLeft", "MiddleMiddle",
         "MiddleRight", "BottomLeft", "BottomMiddle", "BottomRight", "Class" ]

In [3]:
# carrega o dataset
dataset = Dataset(DATASET_PATH, COLUMNS)
data = dataset.load_data()

In [4]:
# exibe o dataset
data

Unnamed: 0,TopLeft,TopMiddle,TopRight,MiddleLeft,MiddleMiddle,MiddleRight,BottomLeft,BottomMiddle,BottomRight,Class
0,x,x,x,x,o,o,x,o,o,positive
1,x,x,x,x,o,o,o,x,o,positive
2,x,x,x,x,o,o,o,o,x,positive
3,x,x,x,x,o,o,o,b,b,positive
4,x,x,x,x,o,o,b,o,b,positive
...,...,...,...,...,...,...,...,...,...,...
953,o,x,x,x,o,o,o,x,x,negative
954,o,x,o,x,x,o,x,o,x,negative
955,o,x,o,x,o,x,x,o,x,negative
956,o,x,o,o,x,x,x,o,x,negative


#### Pré processamento dos dados
Convertendo as posições em uma representação numérica - "x": 2, "o":1 e "b": 0

In [5]:
preprocessor = Preprocessing()
encoded_data = preprocessor.label_encode(data)

encoded_data

Unnamed: 0,TopLeft,TopMiddle,TopRight,MiddleLeft,MiddleMiddle,MiddleRight,BottomLeft,BottomMiddle,BottomRight,Class
0,2,2,2,2,1,1,2,1,1,1
1,2,2,2,2,1,1,1,2,1,1
2,2,2,2,2,1,1,1,1,2,1
3,2,2,2,2,1,1,1,0,0,1
4,2,2,2,2,1,1,0,1,0,1
...,...,...,...,...,...,...,...,...,...,...
953,1,2,2,2,1,1,1,2,2,0
954,1,2,1,2,2,1,2,1,2,0
955,1,2,1,2,1,2,2,1,2,0
956,1,2,1,1,2,2,2,1,2,0


Convertendo os espaços em branco no tabuleiro em 1.0 e restante em 0.0

In [6]:
transformed_df = preprocessor.apply_map(encoded_data)

transformed_df

Unnamed: 0,TopLeft,TopMiddle,TopRight,MiddleLeft,MiddleMiddle,MiddleRight,BottomLeft,BottomMiddle,BottomRight,Class
0,0.0,0.0,0.0,0.0,0.0,0.0,0.0,0.0,0.0,0.0
1,0.0,0.0,0.0,0.0,0.0,0.0,0.0,0.0,0.0,0.0
2,0.0,0.0,0.0,0.0,0.0,0.0,0.0,0.0,0.0,0.0
3,0.0,0.0,0.0,0.0,0.0,0.0,0.0,1.0,1.0,0.0
4,0.0,0.0,0.0,0.0,0.0,0.0,1.0,0.0,1.0,0.0
...,...,...,...,...,...,...,...,...,...,...
953,0.0,0.0,0.0,0.0,0.0,0.0,0.0,0.0,0.0,1.0
954,0.0,0.0,0.0,0.0,0.0,0.0,0.0,0.0,0.0,1.0
955,0.0,0.0,0.0,0.0,0.0,0.0,0.0,0.0,0.0,1.0
956,0.0,0.0,0.0,0.0,0.0,0.0,0.0,0.0,0.0,1.0


#### Separando os dados em features e label em seguida em Treino e Teste

In [7]:
# Divide o conjunto de dados em features and labels
X, y = dataset.split_data(transformed_df, "Class")

X.shape, y.shape

((958, 9), (958,))

In [8]:
# Divide o conjunto de dados em conjuntos de treino e teste
X_train, X_test, y_train, y_test = dataset.train_test_split(X, y, test_size=0.2, random_state=351)

In [9]:
X_train.shape, y_train.shape

((766, 9), (766,))

### 1. Realizando a Classificação
1.1 Classificadores utilizados: Random Forest, Support Vector Machine, Logistic Regression e Decision Tree

In [10]:
# Instancia o runner de classificação com os modelos desejados
random_forest = ClassificationModel("RandomForest")
svm = ClassificationModel("SVM")
logistic_regression = ClassificationModel("LogisticRegression")
decision_tree = ClassificationModel("DecisionTree")

# classificadores
models = {
    "Random Forest": random_forest,
    "Support Vector Machine": svm,
    "Logistic Regression": logistic_regression,
    "Decision Tree": decision_tree
}

runner = ClassificationRunner(models)

# Executa a classificação
results = runner.run_classification(X_train, y_train, X_test, y_test)

# Mostra os resultados
for model_name, accuracy in results.items():
    print(f"{model_name}: Accuracy = {accuracy}")

Random Forest: Accuracy = 0.890625
Support Vector Machine: Accuracy = 0.6458333333333334
Logistic Regression: Accuracy = 0.6145833333333334
Decision Tree: Accuracy = 0.890625


### 2 Ajustando os hiperparâmetros usando GridSearch

2.1 Classificadores otimizados: Random Forest, Support Vector Machine (SVM), Logistic Regression e Decision Tree

In [11]:
# Executa a classificação com o ajuste de hiperparâmetros
results_opt = runner.run_classification(X_train, y_train, X_test, y_test, search_type="grid")

# Exibe os resultados
for model_name, accuracy in results_opt.items():
    print(f"{model_name}: Accuracy = {accuracy}")

Random Forest: Accuracy = 0.890625
Support Vector Machine: Accuracy = 0.6145833333333334
Logistic Regression: Accuracy = 0.6145833333333334
Decision Tree: Accuracy = 0.890625


### 3 Salvando os resultados

In [12]:
# Instancia o DictCSVWriter com o caminho de arquivo desejado
csv_writer = DictCSVWriter('results/results.csv')

# Salva o dicionário em um arquivo CSV
csv_writer.save_dict_to_csv(results)

### Uma alternativa para disponibilizar o resultado do modelo para o usuário final seria por meio de uma interface de usuário (UI).

* Design da interface:
> Desenvolver uma interface visual intuitiva e amigável, onde o usuário possa interagir facilmente com o sistema. Levando em consideração elementos como botões, campos de entrada, exibição dos resultados e outras informações relevantes.

* Entrada dos dados:
> Fornecer um campo de entrada onde o usuário possa inserir as informações sobre as configurações atuais do tabuleiro, especificando as posições ocupadas pelos jogadores ("x" e "o") e os espaços vazios ("b"). A interface pode permitir que o usuário clique nas células do tabuleiro para fazer suas seleções.

* Processamento dos dados:
> Após o usuário fornecer as configurações do tabuleiro, o sistema deve processar essas informações para calcular a probabilidade de vitória do jogador que joga com "x". O modelo de machine learning será utilizado para realizar essa previsão.

* Exibição dos resultados:
> Após o processamento dos dados, exibir os resultados da probabilidade de vitória do jogador que joga com "x" na interface. Isso pode ser apresentado em forma de porcentagem ou em uma escala, indicando o nível de chance de vitória.

* Feedback e orientações:
> Além de exibir os resultados, poderá ser fornecido feedback adicional ao usuário, como dicas estratégicas com base nas probabilidades calculadas. Por exemplo, se a chance de vitória for alta, sugerir jogadas que maximizem as chances de vencer. Isso ajuda a tornar a interface interativa e orientada para o usuário.

* Atualização em tempo real:
> Se o usuário fizer alterações nas configurações do tabuleiro (por exemplo, fazer uma nova jogada), o sistema deve atualizar os cálculos e exibir os resultados atualizados em tempo real. Isso permitirá que o usuário tome decisões estratégicas com base nas informações mais recentes.

* Interface Responsiva:
> Se certificar de que a interface seja responsiva, adaptando-se a diferentes dispositivos e tamanhos de tela, como computadores desktop, tablets ou smartphones. Isso garante que o usuário possa acessar e utilizar a interface em diferentes contextos.

* Testes e validação:
> Realizar testes extensivos para garantir que a interface esteja funcionando corretamente, fornecendo resultados precisos e confiáveis. Verificar se todos os recursos estão operando conforme o esperado e fazer ajustes, se necessário, com base no feedback dos usuários.