In [2]:
import pandas as pd

# URL de FBref para la temporada 2019/20 (Bayern) y 2024/25 (Barça)
urls = {
    "Bayern_2019_20": "https://fbref.com/en/squads/054efa67/2019-2020/all_comps/Bayern-Munich-Stats-All-Competitions",
    "Barca_2024_25": "https://fbref.com/en/squads/206d90db/2024-2025/all_comps/Barcelona-Stats-All-Competitions"
}

# Diccionario para almacenar los datos extraídos
df_dict = {}

for team, url in urls.items():
    tables = pd.read_html(url)  # Extraer todas las tablas de la página
    
    # Extraer la tabla de jugadores con estadísticas avanzadas (usualmente la segunda o tercera tabla)
    players_stats = tables[2]  # Ajusta el índice si cambia la estructura de FBref
    
    # Limpiar la tabla
    players_stats.columns = players_stats.columns.droplevel(0)  # Quitar nivel superior de multi-índice
    players_stats = players_stats.rename(columns={"Player": "Jugador"})
    
    # Guardar en el diccionario
    df_dict[team] = players_stats

    # Exportar a CSV
    players_stats.to_csv(f"{team}_FBref_Stats.csv", index=False)
    print(f"Datos de {team} guardados en {team}_FBref_Stats.csv")

# Mostrar una vista previa de los datos
for team, df in df_dict.items():
    print(f"\n📊 {team} - Datos extraídos:")
    print(df.head())


Datos de Bayern_2019_20 guardados en Bayern_2019_20_FBref_Stats.csv
Datos de Barca_2024_25 guardados en Barca_2024_25_FBref_Stats.csv

📊 Bayern_2019_20 - Datos extraídos:
              Jugador  Nation    Pos   Age  MP  Starts    Min   90s   Gls  \
0        Manuel Neuer  de GER     GK  33.0  11      11  990.0  11.0   0.0   
1      Joshua Kimmich  de GER  DF,MF  24.0  11      10  903.0  10.0   2.0   
2  Robert Lewandowski  pl POL     FW  30.0  10      10  886.0   9.8  15.0   
3    Thiago Alcántara  es ESP     MF  28.0  10       9  819.0   9.1   0.0   
4        Serge Gnabry  de GER     FW  24.0  10       9  761.0   8.5   9.0   

   Ast  ...   Ast   G+A  G-PK  G+A-PK    xG   xAG  xG+xAG  npxG  npxG+xAG  \
0  0.0  ...  0.00  0.00  0.00    0.00  0.00  0.00    0.00  0.00      0.00   
1  4.0  ...  0.40  0.60  0.20    0.60  0.10  0.29    0.39  0.10      0.39   
2  6.0  ...  0.61  2.13  1.32    1.93  1.47  0.33    1.80  1.31      1.64   
3  2.0  ...  0.22  0.22  0.00    0.22  0.16  0.18    0.35 

In [7]:
import pandas as pd

# URLs de FBref para la presión y recuperaciones (Bayern 2019/20 y Barça 2024/25)
urls = {
    "Bayern_2019_20": "https://fbref.com/en/squads/054efa67/2019-2020/defense/Bayern-Munich-Stats-Defensive-Actions",
    "Barca_2024_25": "https://fbref.com/en/squads/206d90db/2024-2025/defense/Barcelona-Stats-Defensive-Actions"
}

# Diccionario para almacenar los datos extraídos
df_dict = {}

for team, url in urls.items():
    tables = pd.read_html(url)  # Extraer todas las tablas de la página
    
    # Verificar la estructura de las tablas extraídas
    print(f"\n📌 {team} - Tablas extraídas de FBref:")
    for i, table in enumerate(tables):
        print(f"Tabla {i} - Dimensiones: {table.shape}")

    # Seleccionar la tabla de presión y recuperaciones (usualmente la primera o segunda)
    pressure_stats = tables[1]  # Ajustar el índice si cambia la estructura de FBref
    
    # Verificar si tiene MultiIndex antes de intentar droplevel
    if isinstance(pressure_stats.columns, pd.MultiIndex):
        pressure_stats.columns = pressure_stats.columns.droplevel(0)  # Quitar multi-índice
    
    # Renombrar la columna de jugadores
    if "Player" in pressure_stats.columns:
        pressure_stats = pressure_stats.rename(columns={"Player": "Jugador"})

    # Guardar en el diccionario
    df_dict[team] = pressure_stats

    # Exportar a CSV
    pressure_stats.to_csv(f"{team}_FBref_Presion.csv", index=False)
    print(f"✅ Datos de presión y recuperaciones guardados en {team}_FBref_Presion.csv")

# Mostrar una vista previa de los datos
for team, df in df_dict.items():
    print(f"\n📊 {team} - Datos extraídos:")
    print(df.head())



📌 Bayern_2019_20 - Tablas extraídas de FBref:
Tabla 0 - Dimensiones: (35, 34)
Tabla 1 - Dimensiones: (52, 20)
Tabla 2 - Dimensiones: (4, 24)
Tabla 3 - Dimensiones: (4, 31)
Tabla 4 - Dimensiones: (31, 23)
Tabla 5 - Dimensiones: (31, 29)
Tabla 6 - Dimensiones: (31, 21)
Tabla 7 - Dimensiones: (31, 22)
Tabla 8 - Dimensiones: (31, 22)
Tabla 9 - Dimensiones: (31, 28)
Tabla 10 - Dimensiones: (35, 27)
Tabla 11 - Dimensiones: (31, 22)
Tabla 12 - Dimensiones: (3, 19)
Tabla 13 - Dimensiones: (3, 28)
✅ Datos de presión y recuperaciones guardados en Bayern_2019_20_FBref_Presion.csv

📌 Barca_2024_25 - Tablas extraídas de FBref:
Tabla 0 - Dimensiones: (38, 34)
Tabla 1 - Dimensiones: (51, 20)
Tabla 2 - Dimensiones: (5, 24)
Tabla 3 - Dimensiones: (5, 31)
Tabla 4 - Dimensiones: (29, 23)
Tabla 5 - Dimensiones: (29, 29)
Tabla 6 - Dimensiones: (29, 21)
Tabla 7 - Dimensiones: (29, 22)
Tabla 8 - Dimensiones: (29, 22)
Tabla 9 - Dimensiones: (29, 28)
Tabla 10 - Dimensiones: (38, 27)
Tabla 11 - Dimensiones: (2

In [8]:
import pandas as pd

# URLs de FBref con los datos avanzados
urls = {
    "Bayern_2019_20_Passing": "https://fbref.com/en/squads/054efa67/2019-2020/passing/Bayern-Munich-Stats-Passing",
    "Barca_2024_25_Passing": "https://fbref.com/en/squads/206d90db/2024-2025/passing/Barcelona-Stats-Passing",
    "Bayern_2019_20_Shooting": "https://fbref.com/en/squads/054efa67/2019-2020/shooting/Bayern-Munich-Stats-Shooting",
    "Barca_2024_25_Shooting": "https://fbref.com/en/squads/206d90db/2024-2025/shooting/Barcelona-Stats-Shooting",
    "Bayern_2019_20_Possession": "https://fbref.com/en/squads/054efa67/2019-2020/possession/Bayern-Munich-Stats-Possession",
    "Barca_2024_25_Possession": "https://fbref.com/en/squads/206d90db/2024-2025/possession/Barcelona-Stats-Possession",
}

# Diccionario para almacenar los datos extraídos
df_dict = {}

for dataset, url in urls.items():
    tables = pd.read_html(url)  # Extraer todas las tablas de la página
    
    # Mostrar qué tablas hay disponibles en la página
    print(f"\n📌 {dataset} - Tablas extraídas de FBref:")
    for i, table in enumerate(tables):
        print(f"Tabla {i} - Dimensiones: {table.shape}")

    # Seleccionar la tabla correcta (ajustar si FBref cambia la estructura)
    stats_table = tables[1]  # Normalmente la segunda tabla contiene los datos por jugador

    # Verificar si tiene MultiIndex antes de intentar droplevel
    if isinstance(stats_table.columns, pd.MultiIndex):
        stats_table.columns = stats_table.columns.droplevel(0)  # Quitar multi-índice

    # Renombrar la columna de jugadores
    if "Player" in stats_table.columns:
        stats_table = stats_table.rename(columns={"Player": "Jugador"})

    # Guardar en el diccionario
    df_dict[dataset] = stats_table

    # Exportar a CSV
    stats_table.to_csv(f"{dataset}.csv", index=False)
    print(f"✅ Datos guardados en {dataset}.csv")

# Mostrar una vista previa de los datos
for dataset, df in df_dict.items():
    print(f"\n📊 {dataset} - Datos extraídos:")
    print(df.head())



📌 Bayern_2019_20_Passing - Tablas extraídas de FBref:
Tabla 0 - Dimensiones: (35, 34)
Tabla 1 - Dimensiones: (52, 20)
Tabla 2 - Dimensiones: (4, 24)
Tabla 3 - Dimensiones: (4, 31)
Tabla 4 - Dimensiones: (31, 23)
Tabla 5 - Dimensiones: (31, 29)
Tabla 6 - Dimensiones: (31, 21)
Tabla 7 - Dimensiones: (31, 22)
Tabla 8 - Dimensiones: (31, 22)
Tabla 9 - Dimensiones: (31, 28)
Tabla 10 - Dimensiones: (35, 27)
Tabla 11 - Dimensiones: (31, 22)
Tabla 12 - Dimensiones: (3, 19)
Tabla 13 - Dimensiones: (3, 28)
✅ Datos guardados en Bayern_2019_20_Passing.csv

📌 Barca_2024_25_Passing - Tablas extraídas de FBref:
Tabla 0 - Dimensiones: (38, 34)
Tabla 1 - Dimensiones: (51, 20)
Tabla 2 - Dimensiones: (5, 24)
Tabla 3 - Dimensiones: (5, 31)
Tabla 4 - Dimensiones: (29, 23)
Tabla 5 - Dimensiones: (29, 29)
Tabla 6 - Dimensiones: (29, 21)
Tabla 7 - Dimensiones: (29, 22)
Tabla 8 - Dimensiones: (29, 22)
Tabla 9 - Dimensiones: (29, 28)
Tabla 10 - Dimensiones: (38, 27)
Tabla 11 - Dimensiones: (29, 22)
Tabla 12 - 