Exemple de configuration gagnante :
['W', 'W', '.']
['W', 'W', '.']
['.', '.', '.']

Exemple de configuration perdante :
['B', 'B', '.']
['.', 'B', 'B']
['.', '.', 'B']


In [None]:
import numpy as np
from sklearn.model_selection import train_test_split
from sklearn.linear_model import LinearRegression, LogisticRegression
from sklearn.metrics import accuracy_score, classification_report, mean_squared_error

# Définir la taille du plateau (3x3)
BOARD_SIZE = 3

# Fonction pour générer une configuration aléatoire du plateau
def generate_random_board():
    return np.random.choice([-1, 0, 1], size=(BOARD_SIZE, BOARD_SIZE))

# Fonction pour évaluer si une configuration est gagnante pour les blancs
def is_winning_position(board):
    white_count = np.sum(board == 1)
    black_count = np.sum(board == -1)
    return white_count >= 6 and white_count > black_count

# Fonction pour évaluer si une configuration est perdante pour les blancs
def is_losing_position(board):
    white_count = np.sum(board == 1)
    black_count = np.sum(board == -1)
    return black_count >= 6 and black_count > white_count

# Générer 500 configurations gagnantes pour les blancs
winning_boards = []
while len(winning_boards) < 500:
    board = generate_random_board()
    if is_winning_position(board):
        winning_boards.append(board)

# Générer 500 configurations perdantes pour les blancs
losing_boards = []
while len(losing_boards) < 500:
    board = generate_random_board()
    if is_losing_position(board):
        losing_boards.append(board)

# Créer un dataset avec les configurations et leurs labels
X = np.array(winning_boards + losing_boards).reshape(-1, BOARD_SIZE * BOARD_SIZE)  # Aplatir les plateaux
y = np.array([1] * 500 + [0] * 500)  # Labels : 1 pour gagnant, 0 pour perdant

# Diviser le dataset en ensembles d'entraînement (80%) et de test (20%)
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)

# Entraîner un modèle de régression multilinéaire
linear_model = LinearRegression()
linear_model.fit(X_train, y_train)

# Prédire avec le modèle de régression multilinéaire
y_pred_linear = linear_model.predict(X_test)
# Convertir les prédictions continues en classes binaires (0 ou 1) avec un seuil de 0.5
y_pred_linear_binary = (y_pred_linear >= 0.5).astype(int)

# Entraîner un modèle de régression logistique
logistic_model = LogisticRegression(random_state=42)
logistic_model.fit(X_train, y_train)

# Prédire avec le modèle de régression logistique
y_pred_logistic = logistic_model.predict(X_test)

# Comparer les performances des deux modèles
print("=== Régression Multilinéaire ===")
accuracy_linear = accuracy_score(y_test, y_pred_linear_binary)
print(f"Précision : {accuracy_linear:.2f}")
print("Rapport de classification :")
print(classification_report(y_test, y_pred_linear_binary))

print("\n=== Régression Logistique ===")
accuracy_logistic = accuracy_score(y_test, y_pred_logistic)
print(f"Précision : {accuracy_logistic:.2f}")
print("Rapport de classification :")
print(classification_report(y_test, y_pred_logistic))

# Comparer les erreurs quadratiques moyennes (MSE)
mse_linear = mean_squared_error(y_test, y_pred_linear)
mse_logistic = mean_squared_error(y_test, y_pred_logistic)

print("\n=== Comparaison des Erreurs ===")
print(f"MSE (Régression Multilinéaire) : {mse_linear:.4f}")
print(f"MSE (Régression Logistique) : {mse_logistic:.4f}")

=== Régression Multilinéaire ===
Précision : 1.00
Rapport de classification :
              precision    recall  f1-score   support

           0       1.00      1.00      1.00       104
           1       1.00      1.00      1.00        96

    accuracy                           1.00       200
   macro avg       1.00      1.00      1.00       200
weighted avg       1.00      1.00      1.00       200


=== Régression Logistique ===
Précision : 1.00
Rapport de classification :
              precision    recall  f1-score   support

           0       1.00      1.00      1.00       104
           1       1.00      1.00      1.00        96

    accuracy                           1.00       200
   macro avg       1.00      1.00      1.00       200
weighted avg       1.00      1.00      1.00       200


=== Comparaison des Erreurs ===
MSE (Régression Multilinéaire) : 0.0121
MSE (Régression Logistique) : 0.0000


# Comparaison entre la regression multilinéaire et la régression logistique
Explications du Code:

Génération des Données :

Nous générons 500 configurations gagnantes et 500 configurations perdantes pour les blancs, comme expliqué précédemment.

Modèle de Régression Multilinéaire :

Le modèle LinearRegression prédit une valeur continue entre 0 et 1.
Les prédictions sont converties en classes binaires (0 ou 1) en appliquant un seuil de 0.5.

Modèle de Régression Logistique :

Le modèle LogisticRegression prédit directement une classe (0 ou 1).

Évaluation des Modèles :
La précision est calculée pour mesurer la performance des deux modèles.
Le rapport de classification affiche des métriques supplémentaires comme le rappel et le F1-score.
L'erreur quadratique moyenne (MSE) est utilisée pour comparer les erreurs des deux modèles.

Résultats Attendus:

Précision :
La régression logistique devrait avoir une meilleure précision que la régression multilinéaire, car elle est spécifiquement conçue pour les problèmes de classification binaire.

Exemple :

Précision (Régression Multilinéaire) : 0.85

Précision (Régression Logistique) : 0.95

Erreur Quadratique Moyenne (MSE) :

La régression logistique devrait avoir un MSE plus faible que la régression multilinéaire, car elle ajuste mieux les probabilités pour la classification.

# Proposition d'amélioration de la qualité des modèles
1. Amélioration des Caractéristiques (Feature Engineering)
Les modèles actuels utilisent uniquement les valeurs brutes des cases du plateau comme entrée. Cependant, ces informations ne capturent pas toujours les relations stratégiques sous-jacentes dans le jeu. Pour capturer des signaux plus fins, nous pouvons ajouter des caractéristiques dérivées :

Nombre de pions blancs/noirs :

Ajouter des caractéristiques:
telles que nombre_de_pions_blancs, nombre_de_pions_noirs, et leur différence.

Contrôle local :

Identifier les régions du plateau contrôlées par chaque joueur. Par exemple, si un joueur contrôle une ligne, une colonne, ou une diagonale.

Possibilités de capture :

Ajouter des indicateurs pour représenter les opportunités de capture pour chaque joueur. Par exemple, si un pion peut capturer un adversaire immédiatement.

Distance aux objectifs stratégiques :

Mesurer la distance entre les pions blancs et les zones clés du plateau où ils pourraient remporter la partie.

Caractéristiques basées sur des motifs récurrents :

Extraire des motifs spécifiques (par exemple, alignements partiels, configurations défensives) qui sont connus pour être avantageux ou désavantageux.

Exemple d'ajout de caractéristiques :

In [None]:
def extract_features(board):
    white_count = np.sum(board == 1)
    black_count = np.sum(board == -1)
    diff_count = white_count - black_count

    # Ajouter des caractéristiques supplémentaires ici
    features = [
        white_count, black_count, diff_count,
        # Exemple : Ajouter des indicateurs pour les lignes/columnes/diagonales contrôlées
        int(np.any(np.all(board == 1, axis=0))),  # Ligne blanche complète ?
        int(np.any(np.all(board == -1, axis=0)))  # Ligne noire complète ?
    ]
    return np.array(features)

# Appliquer la fonction extract_features à chaque plateau
X_train_features = np.array([extract_features(board) for board in X_train])
X_test_features = np.array([extract_features(board) for board in X_test])

2. Augmentation des Données

Les modèles peuvent manquer de généralisation si les données d'entraînement ne couvrent pas suffisamment de scénarios variés. Voici quelques techniques pour augmenter les données :

Génération de nouvelles configurations :

Générer davantage de plateaux avec des heuristiques plus complexes pour inclure des positions intermédiaires ("presque gagnées" ou "presque perdues").

Transformation du plateau :

Appliquer des rotations ou des symétries au plateau pour créer de nouvelles variations des mêmes positions. Cela permet d'augmenter artificiellement la taille du dataset.

Exemple de transformation :

In [None]:
def augment_data(boards, labels):
    augmented_boards = []
    augmented_labels = []
    for board, label in zip(boards, labels):
        # Ajouter la configuration originale
        augmented_boards.append(board)
        augmented_labels.append(label)

        # Ajouter une rotation de 90°
        rotated_board = np.rot90(board)
        augmented_boards.append(rotated_board)
        augmented_labels.append(label)

        # Ajouter une symétrie horizontale
        flipped_board = np.fliplr(board)
        augmented_boards.append(flipped_board)
        augmented_labels.append(label)
    return np.array(augmented_boards), np.array(augmented_labels)

# Appliquer l'augmentation de données
X_train_augmented, y_train_augmented = augment_data(X_train, y_train)
X_test_augmented, y_test_augmented = augment_data(X_test, y_test)

3. Utilisation de Modèles Plus Avancés

Bien que les modèles linéaires (régression multilinéaire et logistique) soient simples et interprétables, ils peuvent ne pas capturer des relations non linéaires complexes. Voici des alternatives plus puissantes :

a) Réseaux de Neurones Convolutifs (CNN)
Les CNN sont particulièrement adaptés pour capturer des relations spatiales sur des grilles, comme celles présentes dans le Fanorona malgache.

Exemple d'architecture CNN :


In [None]:
from tensorflow.keras.models import Sequential
from tensorflow.keras.layers import Conv2D, Flatten, Dense

model = Sequential([
    Conv2D(32, kernel_size=(3, 3), activation='relu', input_shape=(BOARD_SIZE, BOARD_SIZE, 1)),
    Flatten(),
    Dense(64, activation='relu'),
    Dense(1, activation='sigmoid')  # Sortie binaire (0 ou 1)
])

model.compile(optimizer='adam', loss='binary_crossentropy', metrics=['accuracy'])
model.fit(X_train.reshape(-1, BOARD_SIZE, BOARD_SIZE, 1), y_train, epochs=10, batch_size=32, validation_split=0.2)

b) Modèles Basés sur les Arbres de Décision

Des modèles comme Random Forest ou Gradient Boosting peuvent capturer des interactions complexes entre les caractéristiques sans nécessiter une architecture complexe.

Exemple avec Gradient Boosting :

In [None]:
from sklearn.ensemble import GradientBoostingClassifier

gb_model = GradientBoostingClassifier(random_state=42)
gb_model.fit(X_train_features, y_train)
y_pred_gb = gb_model.predict(X_test_features)
print(f"Précision (Gradient Boosting) : {accuracy_score(y_test, y_pred_gb):.2f}")

4. Évaluation sur des Positions Intermédiaires

Pour évaluer la capacité des modèles à détecter les positions "presque gagnées" ou "presque perdues", il est important de créer un ensemble de test spécifique contenant ces positions.

Génération de positions intermédiaires :

Créer des configurations où ni les blancs ni les noirs n'ont encore une victoire assurée, mais où l'un des joueurs a une légère avance.

Métriques spécifiques :

Utiliser des métriques comme la précision pondérée ou le F1-score pour évaluer la performance sur ces positions critiques.

5. Apprentissage Renforcé (Reinforcement Learning)

Pour capturer des stratégies plus avancées, on peut envisager des approches d'apprentissage par renforcement, où un agent apprend à jouer directement en interagissant avec l'environnement du jeu.

Approche simplifiée :

Entraîner un modèle pour prédire les mouvements optimaux à partir de positions donnés.
Utiliser cet agent pour générer des positions "presque gagnées" ou "presque perdues".
