In [28]:
import pandas as pd
import plotly.graph_objects as go
from dash import Dash, dcc, html, Input, Output
import dash_table

# Charger les tables
url = 'https://fbref.com/en/comps/22/Major-League-Soccer-Stats'
tables = pd.read_html(url)

# Tables de classement Est et Ouest
table1 = tables[0][['Squad', 'W', 'D', 'L', 'GD', 'xG', 'xGD', 'Pts']]
table3 = tables[2][['Squad', 'W', 'D', 'L', 'GD', 'xG', 'xGD', 'Pts']]

# Extraire les données de la Conférence Est et Ouest
table_est = table1.copy()
table_ouest = table3.copy()

# Ajouter une colonne 'Conference' pour différencier les conférences
table_est['Conference'] = 'Est'
table_ouest['Conference'] = 'Ouest'

# Fusionner les deux tables pour pouvoir basculer facilement entre les conférences
all_teams = pd.concat([table_est, table_ouest], ignore_index=True)

# Nettoyage et filtrage des autres tables
def clean_and_filter_table(table, columns_to_keep):
    table.columns = ['_'.join(col).strip() for col in table.columns.values]
    return table[columns_to_keep]

table19_filtered = clean_and_filter_table(tables[18], ['Unnamed: 0_level_0_Squad', 'Standard_Gls', 'Expected_G-xG'])
table19_filtered.rename(columns={'Unnamed: 0_level_0_Squad': 'Squad', 'Standard_Gls': 'Goals Scored'}, inplace=True)
table25_filtered = clean_and_filter_table(tables[24], ['Unnamed: 0_level_0_Squad', 'SCA_SCA90', 'GCA_GCA90'])
table25_filtered.rename(columns={'Unnamed: 0_level_0_Squad': 'Squad'}, inplace=True)

# Fusionner les tables sur 'Squad'
df_est = pd.merge(table_est, table19_filtered, on='Squad', how='left')
df_est = pd.merge(df_est, table25_filtered, on='Squad', how='left')
df_est['Conference'] = 'Est'

df_ouest = pd.merge(table_ouest, table19_filtered, on='Squad', how='left')
df_ouest = pd.merge(df_ouest, table25_filtered, on='Squad', how='left')
df_ouest['Conference'] = 'Ouest'

# Combiner les deux DataFrames
df_total = pd.concat([df_est, df_ouest], ignore_index=True)

# Calculer les classements pour chaque configuration
df_total['Rank_All'] = df_total['Pts'].rank(method='min', ascending=False).astype(int)

# Ajouter et calculer les colonnes Rank_Est et Rank_Ouest
df_total['Rank_Est'] = df_total[df_total['Conference'] == 'Est']['Pts'].rank(method='min', ascending=False).astype('Int64')
df_total['Rank_Ouest'] = df_total[df_total['Conference'] == 'Ouest']['Pts'].rank(method='min', ascending=False).astype('Int64')

# Remplacer les valeurs manquantes par pd.NA pour éviter les erreurs avec Int64
df_total['Rank_Est'] = df_total['Rank_Est'].fillna(pd.NA)
df_total['Rank_Ouest'] = df_total['Rank_Ouest'].fillna(pd.NA)

# Créer la figure
fig = go.Figure()

# Ajouter les nuages de points pour les deux ensembles de statistiques et chaque conférence
# 1. SCA_SCA90 vs. GCA_GCA90 pour chaque conférence
# Conférence Est
df_est = df_total[df_total['Conference'] == 'Est']
fig.add_trace(go.Scatter(
    x=df_est['SCA_SCA90'], y=df_est['GCA_GCA90'],
    mode='markers',
    marker=dict(color='blue'),
    name="Conférence Est",
    customdata=df_est[['Squad', 'Rank_Est', 'Goals Scored', 'GCA_GCA90', 'SCA_SCA90']],
    hovertemplate="<b>%{customdata[0]}</b><br>Rank : %{customdata[1]}<br>Goals Scored : %{customdata[2]}<br>SCA90 : %{customdata[4]}<br>GCA90 : %{customdata[3]}<extra></extra>",
    visible=True  # Par défaut visible
))

# Conférence Ouest
df_ouest = df_total[df_total['Conference'] == 'Ouest']
fig.add_trace(go.Scatter(
    x=df_ouest['SCA_SCA90'], y=df_ouest['GCA_GCA90'],
    mode='markers',
    marker=dict(color='red'),
    name="Conférence Ouest",
    customdata=df_ouest[['Squad', 'Rank_Ouest', 'Goals Scored', 'GCA_GCA90', 'SCA_SCA90']],
    hovertemplate="<b>%{customdata[0]}</b><br>Rank : %{customdata[1]}<br>Goals Scored : %{customdata[2]}<br>SCA90 : %{customdata[4]}<br>GCA90 : %{customdata[3]}<extra></extra>",
    visible=False
))

# Toutes les conférences
fig.add_trace(go.Scatter(
    x=df_total['SCA_SCA90'], y=df_total['GCA_GCA90'],
    mode='markers',
    marker=dict(color='purple'),
    name="Toutes les Conférences",
    customdata=df_total[['Squad', 'Rank_All', 'Goals Scored', 'GCA_GCA90', 'SCA_SCA90']],
    hovertemplate="<b>%{customdata[0]}</b><br>Rank : %{customdata[1]}<br>Goals Scored : %{customdata[2]}<br>SCA90 : %{customdata[4]}<br>GCA90 : %{customdata[3]}<extra></extra>",
    visible=False
))

# 2. xG vs. Expected_G-xG pour chaque conférence
# Conférence Est
fig.add_trace(go.Scatter(
    x=df_est['xG'], y=df_est['Expected_G-xG'],
    mode='markers',
    marker=dict(color='blue'),
    name="Conférence Est (xG)",
    customdata=df_est[['Squad', 'Rank_Est', 'Goals Scored', 'xG', 'Expected_G-xG']],
    hovertemplate="<b>%{customdata[0]}</b><br>Rank : %{customdata[1]}<br>Goals Scored : %{customdata[2]}<br>xG : %{customdata[4]}<br>Expected_G-xG : %{customdata[3]}<extra></extra>",
    visible=False
))

# Conférence Ouest
fig.add_trace(go.Scatter(
    x=df_ouest['xG'], y=df_ouest['Expected_G-xG'],
    mode='markers',
    marker=dict(color='red'),
    name="Conférence Ouest (xG)",
    customdata=df_ouest[['Squad', 'Rank_Ouest', 'Goals Scored', 'xG', 'Expected_G-xG']],
    hovertemplate="<b>%{customdata[0]}</b><br>Rank : %{customdata[1]}<br>Goals Scored : %{customdata[2]}<br>xG : %{customdata[4]}<br>Expected_G-xG : %{customdata[3]}<extra></extra>",
    visible=False
))

# Toutes les conférences
fig.add_trace(go.Scatter(
    x=df_total['xG'], y=df_total['Expected_G-xG'],
    mode='markers',
    marker=dict(color='purple'),
    name="Toutes les Conférences (xG)",
    customdata=df_total[['Squad', 'Rank_All', 'Goals Scored', 'xG', 'Expected_G-xG']],
    hovertemplate="<b>%{customdata[0]}</b><br>Rank : %{customdata[1]}<br>Goals Scored : %{customdata[2]}<br>xG : %{customdata[4]}<br>Expected_G-xG : %{customdata[3]}<extra></extra>",
    visible=False
))

# Ajouter des boutons pour changer les statistiques affichées et les conférences
fig.update_layout(
    updatemenus=[
        # Bouton pour sélectionner les statistiques
        dict(
            buttons=list([
                dict(label="SCA_SCA90 vs GCA_GCA90",
                     method="update",
                     args=[{"visible": [True, False, False, False, False, False]},
                           {"xaxis.title": "SCA_SCA90", "yaxis.title": "GCA_GCA90"}]),
                dict(label="xG vs Expected G-xG",
                     method="update",
                     args=[{"visible": [False, False, False, True, True, True]},
                           {"xaxis.title": "xG", "yaxis.title": "Expected G - xG"}])
            ]),
            direction="down",
            showactive=True,
            x=0.1,
            xanchor="left",
            y=1.15,
            yanchor="top"
        ),
        # Bouton pour sélectionner la conférence
        dict(
            buttons=list([
                dict(label="Conférence Est",
                     method="update",
                     args=[{"visible": [True, False, False, True, False, False]}]),
                dict(label="Conférence Ouest",
                     method="update",
                     args=[{"visible": [False, True, False, False, True, False]}]),
                dict(label="Toutes les Conférences",
                     method="update",
                     args=[{"visible": [False, False, True, False, False, True]}])
            ]),
            direction="down",
            showactive=True,
            x=0.50,
            xanchor="left",
            y=1.15,
            yanchor="top"
        ),
    ]
)

# Création de l'application Dash
app = Dash(__name__)

# Layout de l'application
app.layout = html.Div([
    html.H1("Classement MLS"),
    # Bouton pour sélectionner la conférence
    html.Div([
        dcc.RadioItems(
            id='conference-select',
            options=[{'label': 'Est', 'value': 'Est'},
                     {'label': 'Ouest', 'value': 'Ouest'}],
            value='Est',
            inline=True
        )
    ]),
    # Menu déroulant pour trier les colonnes
    html.Div([
        dcc.Dropdown(
            id='sort-by',
            options=[{'label': col, 'value': col} for col in ['W', 'D', 'L', 'GD', 'xG', 'xGD', 'Pts']],
            value='Pts',  # Valeur de tri par défaut
            clearable=False
        )
    ], style={'width': '200px'}),
    # Table interactive
    dash_table.DataTable(
        id='ranking-table',
        columns=[{"name": col, "id": col} for col in ['Squad', 'W', 'D', 'L', 'GD', 'xG', 'xGD', 'Pts']],
        sort_action='native',
        style_cell={'textAlign': 'center'},
        style_header={'fontWeight': 'bold'},
        style_data_conditional=[
            {
                'if': {'column_id': 'Pts'},
                'backgroundColor': 'lightblue',
                'fontWeight': 'bold'
            }
        ]
    )
])

# Callback pour mettre à jour le tableau en fonction de la conférence et du tri
@app.callback(
    Output('ranking-table', 'data'),
    Input('conference-select', 'value'),
    Input('sort-by', 'value')
)
def update_table(selected_conference, sort_by):
    # Filtrer en fonction de la conférence choisie
    filtered_data = all_teams[all_teams['Conference'] == selected_conference]
    # Trier les données en fonction de la statistique choisie
    filtered_data = filtered_data.sort_values(by=sort_by, ascending=False)
    return filtered_data.to_dict('records')

if __name__ == '__main__':
    app.run_server(debug=True)
# Afficher le graphique
fig.show()




A value is trying to be set on a copy of a slice from a DataFrame

See the caveats in the documentation: https://pandas.pydata.org/pandas-docs/stable/user_guide/indexing.html#returning-a-view-versus-a-copy



A value is trying to be set on a copy of a slice from a DataFrame

See the caveats in the documentation: https://pandas.pydata.org/pandas-docs/stable/user_guide/indexing.html#returning-a-view-versus-a-copy

