<a href="https://colab.research.google.com/github/FAMILIAR-project/SEAI4Sport2425/blob/main/TacticAutoAssign.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

In [1]:
import numpy as np
from scipy.optimize import linear_sum_assignment

# Define the tactic we need to fill
tactic = ["GK", "ARG", "ARD", "DCG", "DCD", "MDEF", "M8", "ATTG", "MG", "MD", "ATTD"]

# Embedded player data
players_data = [
    {"Name": "Mike MAIGNAN", "Club": "AC MILAN", "Positions": "GK", "Weight": 1.0},
    {"Name": "Lucas CHEVALIER", "Club": "LOSC LILLE", "Positions": "GK", "Weight": 0.5},
    {"Name": "Brice SAMBA", "Club": "RC LENS", "Positions": "GK", "Weight": 0.5},
    {"Name": "Jonathan CLAUSS", "Club": "OGC NICE", "Positions": "ARG|ARD|DCG|DCD", "Weight": 0.5},
    {"Name": "Lucas DIGNE", "Club": "ASTON VILLA FC", "Positions": "ARG|ARD|DCG|DCD", "Weight": 1.0},
    {"Name": "Wesley FOFANA", "Club": "CHELSEA FC", "Positions": "ARG|ARD|DCG|DCD", "Weight": 1.0},
    {"Name": "Théo HERNANDEZ", "Club": "AC MILAN", "Positions": "ARG|ARD|DCG|DCD", "Weight": 1.0},
    {"Name": "Ibrahima KONATE", "Club": "LIVERPOOL FC", "Positions": "ARG|ARD|DCG|DCD", "Weight": 1.0},
    {"Name": "Jules KOUNDE", "Club": "FC BARCELONE", "Positions": "ARG|ARD|DCG|DCD", "Weight": 1.0},
    {"Name": "William SALIBA", "Club": "ARSENAL FC", "Positions": "ARG|ARD|DCG|DCD", "Weight": 1.0},
    {"Name": "Dayot UPAMECANO", "Club": "FC BAYERN MUNICH", "Positions": "ARG|ARD|DCG|DCD", "Weight": 1.0},
    {"Name": "Eduardo CAMAVINGA", "Club": "REAL MADRID CF", "Positions": "MDEF|M8|M10|MG|MD", "Weight": 1.0},
    {"Name": "Matteo GUENDOUZI", "Club": "SS LAZIO", "Positions": "MDEF|M8|M10|MG|MD", "Weight": 1.0},
    {"Name": "N’Golo KANTE", "Club": "AL ITTIHAD CLUB", "Positions": "MDEF|M8|M10|MG|MD", "Weight": 1.0},
    {"Name": "Manu KONE", "Club": "AS ROMA", "Positions": "MDEF|M8|M10|MG|MD", "Weight": 1.0},
    {"Name": "Adrien RABIOT", "Club": "OLYMPIQUE DE MARSEILLE", "Positions": "MDEF|M8|M10|MG|MD", "Weight": 0.5},
    {"Name": "Warren ZAIRE-EMERY", "Club": "PARIS-SG", "Positions": "MDEF|M8|M10|MG|MD", "Weight": 0.4},
    {"Name": "Bradley BARCOLA", "Club": "PARIS SG", "Positions": "ATTD", "Weight": 0.5},
    {"Name": "Ousmane DEMBELE", "Club": "PARIS SG", "Positions": "ATTD", "Weight": 0.5},
    {"Name": "Randal KOLO MUANI", "Club": "PARIS SG", "Positions": "ATTD|ATTG", "Weight": 0.5},
    {"Name": "Christopher NKUNKU", "Club": "CHELSEA FC", "Positions": "ATTD", "Weight": 1.0},
    {"Name": "Michael OLISE", "Club": "FC BAYERN MUNICH", "Positions": "ATTD", "Weight": 1.0},
    {"Name": "Marcus THURAM", "Club": "INTER MILAN", "Positions": "ATTD", "Weight": 1.0}
]


# Convert embedded data to required structures
players = [player['Name'] for player in players_data]
clubs = {player['Name']: player['Club'] for player in players_data}
positions_dict = {player['Name']: player['Positions'].split('|') for player in players_data}
weights = {player['Name']: player['Weight'] for player in players_data}

# Build cost matrix
num_positions = len(tactic)
num_players = len(players)
cost_matrix = np.full((num_positions, num_players), np.inf)

for i, pos in enumerate(tactic):
    for j, p in enumerate(players):
        if pos in positions_dict[p]:
            w = weights[p]
            # cost = -weight since Hungarian algorithm minimizes cost
            cost_matrix[i, j] = -w

# Solve the assignment problem
row_ind, col_ind = linear_sum_assignment(cost_matrix)

assignments = {}
for pos_idx, player_idx in zip(row_ind, col_ind):
    if cost_matrix[pos_idx, player_idx] != np.inf:
        pos_name = tactic[pos_idx]
        player_name = players[player_idx]
        assignments[pos_name] = player_name

# Output the assignments
print("Assignments:")
for pos in tactic:
    if pos in assignments:
        p = assignments[pos]
        print(f"{pos}: {p} (weight = {weights[p]})")
    else:
        print(f"{pos}: Not assigned")


Assignments:
GK: Mike MAIGNAN (weight = 1.0)
ARG: Lucas DIGNE (weight = 1.0)
ARD: Wesley FOFANA (weight = 1.0)
DCG: Théo HERNANDEZ (weight = 1.0)
DCD: Ibrahima KONATE (weight = 1.0)
MDEF: Eduardo CAMAVINGA (weight = 1.0)
M8: Matteo GUENDOUZI (weight = 1.0)
ATTG: Randal KOLO MUANI (weight = 0.5)
MG: N’Golo KANTE (weight = 1.0)
MD: Manu KONE (weight = 1.0)
ATTD: Christopher NKUNKU (weight = 1.0)


Pour chaque exercice ci-dessous, il est possible de modifier le code ci-dessus, de créer des nouvelles cellules avec du code ou avec des explications textuelles. Généralement, les exercices nécessitent très peu de modifications ou d'écritures de code

0. Expliquer en 5 phrases ce que fait le code
1. Modifier le code pour que Michael OLISE soit nécessairement titularisé
2. Modifier le code pour que que Lucas DIGNE ne soit pas titularisé
3. Modifier le code pour changer la tactique et permettre d'évoluer avec deux attaquants, un attaquant droit (ATTD), et un attaquant gauche (ATTG)
4. Vérifier que le nombre de joueurs dans la tactique est bien égal à 11. Si ce n'est pas le cas, afficher un message d'avertissement.
5. Modifier le code pour afficher le club des joueurs, en plus de la position
6. Lister tous les clubs : Écrivez un code pour afficher la liste de tous les clubs uniques représentés par les joueurs.
7. Expliquer l'impact des poids sur les assignations : Expliquez comment les poids affectent les assignations des joueurs aux positions dans le code.
8. Faire la moyenne des poids des joueurs
9. Calculer le poids maximum : Écrivez un code qui trouve et affiche le poids maximum parmi tous les joueurs.

In [2]:
import pandas as pd
data = pd.read_csv('https://raw.githubusercontent.com/acherm/SEAI4Sport2425/refs/heads/main/season_matchs_Ligue_1_2020.csv')

1. Trouver et afficher le match avec le plus grand écart de buts.
2. Calculer le nombre moyen de buts marqués par match pour toute la saison.
3. Détecter les matchs où un club à domicile a perdu malgré un xG supérieur à celui de l'adversaire.
4. Visualiser la répartition des buts marqués à domicile contre ceux marqués à l'extérieur.
5. Identifier les matches sans but marqué et afficher ces informations.
6. Déterminer et afficher les matchs avec une grande volatilité en xG (différence entre xG à domicile et à l'extérieur supérieure à 1).
7. On se propose d'étudier l'efficacité offensive par rapport aux attentes (xG). Analysez comment les clubs performent par rapport à leur xG (Expected Goals) à domicile et à l'extérieur. Discutez des clubs qui surpassent ou ne rencontrent pas leurs attentes en termes de buts marqués par rapport aux buts attendus, en vous appuyant sur les différences entre leurs performances à domicile et à l'extérieur.


