# El VAR de los Datos

### 0. Librerías, cabeceras, api keys y normalización de nombres de los equipos

In [1]:
# Importamos las librerías necesarias
import pandas as pd
import requests
from bs4 import BeautifulSoup
from selenium import webdriver
from selenium.webdriver.common.by import By
import time

import plotly.express as px

In [2]:
# cabeceras para simular un navegador web y nos dejen acceder a la página
cabeceras = {'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/91.0.4472.124 Safari/537.36'}

#### 1º DIVISIÓN

In [3]:
def normalizar_equipo_1(nombre_equipo):
    """Función para normalizar los nombres de los equipos"""
    nombre_equipo = nombre_equipo.lower().strip()
    nombre_equipo = nombre_equipo.replace(' ', '_')
    nombre_equipo = nombre_equipo.replace('á', 'a').replace('é', 'e').replace('í', 'i').replace('ó', 'o').replace('ú', 'u')
    nombre_equipo = nombre_equipo.replace('ñ', 'n')
    
    # Athletic Club
    apariciones = [
        'athletic_club',
        'athletic_de_bilbao',
        'athletic',
    ]
    if nombre_equipo in apariciones:
        return 'Athletic Club'
    
    # Atlético de Madrid
    apariciones = [
        'atletico_de_madrid',
        'atletico_madrid',
        'atletico',
    ]
    if nombre_equipo in apariciones:
        return 'Atlético de Madrid'
    
    # CA Osasuna
    apariciones = [
        'ca_osasuna',
        'osasuna',
    ]
    if nombre_equipo in apariciones:
        return 'CA Osasuna'
    
    # Celta de Vigo
    apariciones = [
        'celta_de_vigo',
        'celta_vigo',
        'celta',
        'rc_celta_de_vigo',
    ]
    if nombre_equipo in apariciones:
        return 'Celta de Vigo'
    
    # Deportivo Alavés
    apariciones = [
        'deportivo_alaves',
        'alaves',
    ]
    if nombre_equipo in apariciones:
        return 'Deportivo Alavés'
    
    # Elche CF
    apariciones = [
        'elche_cf',
        'elche',
    ]
    if nombre_equipo in apariciones:
        return 'Elche CF'
    
    # FC Barcelona
    apariciones = [
        'fc_barcelona',
        'barcelona',
        'barça',
        'barca',
    ]
    if nombre_equipo in apariciones:
        return 'FC Barcelona'
    
    # Getafe CF
    apariciones = [
        'getafe_cf',
        'getafe',
    ]
    if nombre_equipo in apariciones:
        return 'Getafe CF'
    
    # Girona FC
    apariciones = [
        'girona_fc',
        'girona',
    ]
    if nombre_equipo in apariciones:
        return 'Girona FC'
    
    # Levante UD
    apariciones = [
        'levante_ud',
        'levante',
    ]
    if nombre_equipo in apariciones:
        return 'Levante UD'
    
    # Rayo Vallecano
    apariciones = [
        'rayo_vallecano',
        'rayo',
    ]
    if nombre_equipo in apariciones:
        return 'Rayo Vallecano'
    
    # RCD Espanyol
    apariciones = [
        'rcd_espanyol',
        'espanyol',
        'rcd_espanyol_de_barcelona',
    ]
    if nombre_equipo in apariciones:
        return 'RCD Espanyol'
    
    # RCD Mallorca
    apariciones = [
        'rcd_mallorca',
        'mallorca',
    ]
    if nombre_equipo in apariciones:
        return 'RCD Mallorca'
    
    # Real Betis
    apariciones = [
        'real_betis',
        'betis',
        'real_betis_balompie',
        'real betis',
        'real betis balompie',
        'Real Betis Balompié',
        'real_betis_sevilla',
    ]
    if nombre_equipo in apariciones:
        return 'Real Betis'
    
    # Real Madrid
    apariciones = [
        'real_madrid',
        'madrid',
        'real_madrid_cf',
    ]
    if nombre_equipo in apariciones:
        return 'Real Madrid'
    
    # Real Oviedo
    apariciones = [
        'real_oviedo',
        'oviedo',
    ]
    if nombre_equipo in apariciones:
        return 'Real Oviedo'
    
    # Real Sociedad
    apariciones = [
        'real_sociedad',
    ]
    if nombre_equipo in apariciones:
        return 'Real Sociedad'
    
    # Sevilla FC
    apariciones = [
        'sevilla_fc',
        'sevilla',
    ]
    if nombre_equipo in apariciones:
        return 'Sevilla FC'
    
    # Valencia CF
    apariciones = [
        'valencia_cf',
        'valencia',
    ]
    if nombre_equipo in apariciones:
        return 'Valencia CF'
    
    # Villarreal CF
    apariciones = [
        'villarreal_cf',
        'villarreal',
    ]
    if nombre_equipo in apariciones:
        return 'Villarreal CF'
    
    # Otros equipos no tan comunes
    nombre_equipo = nombre_equipo.replace('_', ' ')
    nombre_equipo = nombre_equipo[0].upper() + nombre_equipo[1:]
    
    return nombre_equipo

#### 2º DIVISIÓN

In [4]:
def normalizar_equipo_2(nombre_equipo):
    """Función para normalizar los nombres de los equipos"""
    nombre_equipo = nombre_equipo.lower().strip()
    nombre_equipo = nombre_equipo.replace(' ', '_').replace('.', '').replace('"', '')
    nombre_equipo = nombre_equipo.replace('á', 'a').replace('é', 'e').replace('í', 'i').replace('ó', 'o').replace('ú', 'u')
    nombre_equipo = nombre_equipo.replace('ñ', 'n')
    
    # AD Ceuta FC
    apariciones = [
        'ad_ceuta',
        'ceuta',
        'ad_ceuta_fc',
        'ceuta_fc',
    ]
    if nombre_equipo in apariciones:
        return 'AD Ceuta FC'
    
    # Albacete BP
    apariciones = [
        'albacete_bp',
        'albacete_balompied',
        'albacete_balompie',
        'albacete',
    ]
    if nombre_equipo in apariciones:
        return 'Albacete BP'
    
    # Burgos CF
    apariciones = [
        'burgos_cf',
        'burgos',
    ]
    if nombre_equipo in apariciones:
        return 'Burgos CF'
    
    # Cádiz CF
    apariciones = [
        'cadiz_cf',
        'cadiz',
    ]
    if nombre_equipo in apariciones:
        return 'Cádiz CF'
    
    # CD Castellón
    apariciones = [
        'cd_castellon',
        'castellon',
    ]
    if nombre_equipo in apariciones:
        return 'CD Castellón'
    
    # CD Leganés
    apariciones = [
        'cd_leganes',
        'leganes',
    ]
    if nombre_equipo in apariciones:
        return 'CD Leganés'
    
    # CD Mirandés
    apariciones = [
        'cd_mirandes',
        'mirandes',
    ]
    if nombre_equipo in apariciones:
        return 'CD Mirandés'
    
    # Córdoba CF
    apariciones = [
        'cordoba_cf',
        'cordoba',
    ]
    if nombre_equipo in apariciones:
        return 'Córdoba CF'
    
    # Cultural Leonesa
    apariciones = [
        'cultural_leonesa',
        'cultural',
        'cultural_y_deportiva_leonesa',
    ]
    if nombre_equipo in apariciones:
        return 'Cultural Leonesa'
    
    # FC Andorra
    apariciones = [
        'fc_andorra',
        'andorra',
    ]
    if nombre_equipo in apariciones:
        return 'FC Andorra'
    
    # Granada CF
    apariciones = [
        'granada_cf',
        'granada',
    ]
    if nombre_equipo in apariciones:
        return 'Granada CF'
    
    # Málaga CF
    apariciones = [
        'malaga_cf',
        'malaga',
    ]
    if nombre_equipo in apariciones:
        return 'Málaga CF'
    
    # Racing de Santander
    apariciones = [
        'racing_de_santander',
        'racing_santander',
        'racing',
        'r_racing_club',
        'r_racing_club_de_santander',
        'r_racing_club_santander',
        'real_racing_club',
        'real_racing_club_de_santander',
    ]
    if nombre_equipo in apariciones:
        return 'Racing de Santander'
    
    # Real Sociedad B
    apariciones = [
        'real_sociedad_b',
        'real_sociedad_ii',
        'real_sociedad_balmadiez',
        'real_sociedad_balmodiez',
        'real_sociedad_2',
        'r_sociedad_b',
        'r_sociedad_ii',
    ]
    if nombre_equipo in apariciones:
        return 'Real Sociedad B'
    
    # RC Deportivo
    apariciones = [
        'rc_deportivo',
        'deportivo_de_la_coruna',
        'deportivo_la_coruna',
        'deportivo_coruna',
        'deportivo',
        'rc_deportivo_de_la_coruna',
        'rc_deportivo_de_coruna',
        'rc_deportivo',
        'rc_deportivo_la_coruna',
        'rc_deportivo_coruna',
    ]
    if nombre_equipo in apariciones:
        return 'RC Deportivo'
    
    # Real Sporting
    apariciones = [
        'real_sporting',
        'sporting_de_gijon',
        'sporting_gijon',
        'sporting',
        'real_sporting_de_gijon',
        'real_sporting_gijon',
    ]
    if nombre_equipo in apariciones:
        return 'Real Sporting'
    
    # Real Valladolid CF
    apariciones = [
        'real_valladolid',
        'valladolid',
        'real_valladolid_cf',
        'real_valladolid_club_de_futbol',
        'valladolid_cf',
        'valladolid_club_de_futbol',
    ]
    if nombre_equipo in apariciones:
        return 'Real Valladolid'
    
    # Real Zaragoza
    apariciones = [
        'real_zaragoza',
        'zaragoza',
    ]
    if nombre_equipo in apariciones:
        return 'Real Zaragoza'
    
    # SD Eibar
    apariciones = [
        'sd_eibar',
        'eibar',
    ]
    if nombre_equipo in apariciones:
        return 'SD Eibar'
    
    # SD Huesca
    apariciones = [
        'sd_huesca',
        'huesca',
    ]
    if nombre_equipo in apariciones:
        return 'SD Huesca'
    
    # UD Almería
    apariciones = [
        'ud_almeria',
        'almeria',
    ]
    if nombre_equipo in apariciones:
        return 'UD Almería'
    
    # UD Las Palmas
    apariciones = [
        'ud_las_palmas',
        'las_palmas',
        'union_deportiva_las_palmas',
    ]
    if nombre_equipo in apariciones:
        return 'UD Las Palmas'
    
    # Otros equipos no tan comunes
    nombre_equipo = nombre_equipo.replace('_', ' ')
    nombre_equipo = nombre_equipo[0].upper() + nombre_equipo[1:]
    
    return 'ERROR' # Cambiar por nombre_equipo para no tener errores

#### PRUEBA

In [5]:
def normalizar_equipo_debug(nombre_equipo):
    """Función para normalizar los nombres de los equipos"""
    nombre_equipo = nombre_equipo.lower().strip()
    nombre_equipo = nombre_equipo.replace(' ', '_')
    nombre_equipo = nombre_equipo.replace('á', 'a').replace('é', 'e').replace('í', 'i').replace('ó', 'o').replace('ú', 'u')
    nombre_equipo = nombre_equipo.replace('ñ', 'n')
    print(f'DEBUG: {nombre_equipo}')

### 1. Transfermarkt
Extraemos Equipos, Valor de mercado

In [6]:
def convertir_valor(valor_texto):
    multiplicador = 1
    if 'mil mill.' in valor_texto:
        multiplicador = 1000000000
    elif 'mill.' in valor_texto:
        multiplicador = 1000000
    elif 'mil.' in valor_texto:
        multiplicador = 1000
    
    # Quitamos los textos
    valor_limpio = valor_texto.replace('mil mill.', '').replace('mill.', '').replace('mil.', '')
    # Eliminamos símbolos, puntos de miles y reemplazamos comas por puntos decimales
    valor_limpio = valor_limpio.replace('€', '').replace('.','').replace(',', '.').strip()
    
    try:
        valor_numerico = float(valor_limpio) * multiplicador
    except ValueError:
        valor_numerico = 0
    
    return int(valor_numerico) # int para devolver un valor entero sin decimales

#### 1º DIVISIÓN

In [7]:
def obtener_valores_mercado_1():
    url = 'https://www.transfermarkt.es/laliga/startseite/wettbewerb/ES1'
    valores_mercado = {} # Clave: Nombre del equipo, Valor: Valor de mercado en int (número)
    valores_textuales = {} # Clave: Nombre del equipo, Valor: Valor de mercado en texto (string)

    try:
        respuesta = requests.get(url, headers=cabeceras)
        soup = BeautifulSoup(respuesta.content, 'html.parser')

        tabla = soup.find('table', class_='items')
        filas = tabla.find_all('tr', class_=['odd', 'even'])

        for fila in filas:
            # Buscamos la celda que contiene el nombre del equipo
            td_nombre = fila.find('td', class_='hauptlink')
            if td_nombre:
                # Extraemos el nombre del equipo
                nombre_equipo_web = td_nombre.get_text().strip()
                # Extraemos el valor de mercado (está en la última celda)
                celdas = fila.find_all('td')
                valor_texto = celdas[-1].get_text().strip()
                valor_numerico = convertir_valor(valor_texto)
                
                valores_mercado[nombre_equipo_web] = valor_numerico
                valores_textuales[nombre_equipo_web] = valor_texto

        # NORMALIZAR NOMBRES DE EQUIPOS
        for equipo in list(valores_mercado.keys()):
            nombre_equipo = normalizar_equipo_1(equipo)
            if equipo != nombre_equipo:
                valores_mercado[nombre_equipo] = valores_mercado.pop(equipo)
                valores_textuales[nombre_equipo] = valores_textuales.pop(equipo)
               
    except Exception as e:
        print(f'Error en Transfermarkt: {e}')
    
    return valores_mercado, valores_textuales

#### 2º DIVISIÓN

In [8]:
def obtener_valores_mercado_2():
    url = 'https://www.transfermarkt.es/laliga/startseite/wettbewerb/ES2'
    valores_mercado = {} # Clave: Nombre del equipo, Valor: Valor de mercado en int (número)
    valores_textuales = {} # Clave: Nombre del equipo, Valor: Valor de mercado en texto (string)

    try:
        respuesta = requests.get(url, headers=cabeceras)
        soup = BeautifulSoup(respuesta.content, 'html.parser')

        tabla = soup.find('table', class_='items')
        filas = tabla.find_all('tr', class_=['odd', 'even'])

        for fila in filas:
            # Buscamos la celda que contiene el nombre del equipo
            td_nombre = fila.find('td', class_='hauptlink')
            if td_nombre:
                # Extraemos el nombre del equipo
                nombre_equipo_web = td_nombre.get_text().strip()
                # Extraemos el valor de mercado (está en la última celda)
                celdas = fila.find_all('td')
                valor_texto = celdas[-1].get_text().strip()
                valor_numerico = convertir_valor(valor_texto)
                
                valores_mercado[nombre_equipo_web] = valor_numerico
                valores_textuales[nombre_equipo_web] = valor_texto

        # NORMALIZAR NOMBRES DE EQUIPOS
        for equipo in list(valores_mercado.keys()):
            nombre_equipo = normalizar_equipo_2(equipo)
            if equipo != nombre_equipo:
                valores_mercado[nombre_equipo] = valores_mercado.pop(equipo)
                valores_textuales[nombre_equipo] = valores_textuales.pop(equipo)
               
    except Exception as e:
        print(f'Error en Transfermarkt: {e}')
    
    return valores_mercado, valores_textuales

#### PRUEBA

**DICCIONARIO valores_mercado**

CLAVE: Nombre del equipo (str)              Ejemplo: 'Real Madrid'

VALOR: Valor de mercado en int (número)     Ejemplo: 800000000

EJEMPLO: {'Real Madrid': 800000000, 'FC Barcelona': 750000000, ...}



**DICCIONARIO valores_textuales**

CLAVE: Nombre del equipo (str)              Ejemplo: 'Real Madrid'

VALOR: Valor de mercado en texto (str)      Ejemplo: '800 mil mill.'

EJEMPLO: {'Real Madrid': '800 mil mill.', 'FC Barcelona': '750 mil mill.', ...}


In [9]:
# Comprobación de que funciona
valores_mercado_1, valores_textuales_1 = obtener_valores_mercado_1()
print(valores_mercado_1)
print(valores_textuales_1)
print(len(valores_mercado_1), len(valores_textuales_1))

valores_mercado_2, valores_textuales_2 = obtener_valores_mercado_2()
print(valores_mercado_2)
print(valores_textuales_2)
print(len(valores_mercado_2), len(valores_textuales_2))

{'FC Barcelona': 1110000000, 'Atlético de Madrid': 526000000, 'Athletic Club': 303000000, 'Villarreal CF': 255800000, 'Real Sociedad': 245200000, 'Valencia CF': 169500000, 'Girona FC': 155000000, 'Sevilla FC': 131600000, 'Rayo Vallecano': 108800000, 'Elche CF': 103200000, 'RCD Espanyol': 102700000, 'CA Osasuna': 95500000, 'Levante UD': 86650000, 'RCD Mallorca': 81400000, 'Getafe CF': 81400000, 'Real Oviedo': 67600000, 'Deportivo Alavés': 61000000, 'Real Madrid': 1350000000, 'Real Betis': 219800000, 'Celta de Vigo': 149400000}
{'FC Barcelona': '1,11 mil mill. €', 'Atlético de Madrid': '526,00 mill. €', 'Athletic Club': '303,00 mill. €', 'Villarreal CF': '255,80 mill. €', 'Real Sociedad': '245,20 mill. €', 'Valencia CF': '169,50 mill. €', 'Girona FC': '155,00 mill. €', 'Sevilla FC': '131,60 mill. €', 'Rayo Vallecano': '108,80 mill. €', 'Elche CF': '103,20 mill. €', 'RCD Espanyol': '102,70 mill. €', 'CA Osasuna': '95,50 mill. €', 'Levante UD': '86,65 mill. €', 'RCD Mallorca': '81,40 mill.

### 2. FutbolFantasy
Extraemos Equipos y Lesionados

#### 1º DIVISIÓN

In [10]:
def obtener_lesionados_1():
    url = 'https://www.futbolfantasy.com/laliga/lesionados'
    lesionados = {}
    
    valores_mercado_1, valores_textuales_1 = obtener_valores_mercado_1()
    equipos = list(valores_mercado_1.keys())
    
    # Extraemos el número de lesionados por equipo
    try:
        respuesta = requests.get(url, headers=cabeceras)
        soup = BeautifulSoup(respuesta.content, 'html.parser')

        bloques_equipos = soup.find_all('section', class_='mod lesionados col-12 col-md-6 mb-4')
        
        for bloque in bloques_equipos:
            # Extraemos el nombre del equipo
            cabecera = bloque.find('header', class_='title col-12')
            nombre_equipo_web = cabecera.text.strip()

            # Extraemos el número de lesionados
            lesionados_equipo = bloque.find_all('div', class_='elemento lesionado col-12')
            if not lesionados_equipo:
                lesionados[nombre_equipo_web] = 0
            num_lesionados = len(lesionados_equipo)
            
            lesionados[nombre_equipo_web] = num_lesionados

        # NORMALIZAR NOMBRES DE EQUIPOS
        for equipo in list(lesionados.keys()):
            nombre_equipo = normalizar_equipo_1(equipo)
            if equipo != nombre_equipo:
                lesionados[nombre_equipo] = lesionados.pop(equipo)
    
        for equipo in equipos:
            if equipo not in lesionados:
                lesionados[equipo] = 0
                
    except Exception as e:
        print(f'(Fallo al buscar lesionados: {e})')
    
    return lesionados

#### 2º DIVISIÓN

In [11]:
def obtener_lesionados_2():
    url = 'https://www.futbolfantasy.com/laliga2/lesionados'
    lesionados = {}

    valores_mercado_2, valores_textuales_2 = obtener_valores_mercado_2()
    equipos = list(valores_mercado_2.keys())

    # Extraemos el número de lesionados por equipo
    try:
        respuesta = requests.get(url, headers=cabeceras)
        soup = BeautifulSoup(respuesta.content, 'html.parser')

        bloques_equipos = soup.find_all('section', class_='mod lesionados col-12 col-md-6 mb-4')
        
        for bloque in bloques_equipos:
            # Extraemos el nombre del equipo
            cabecera = bloque.find('header', class_='title col-12')
            nombre_equipo_web = cabecera.text.strip()

            # Extraemos el número de lesionados
            lesionados_equipo = bloque.find_all('div', class_='elemento lesionado col-12')
            if not lesionados_equipo:
                lesionados[nombre_equipo_web] = 0
            num_lesionados = len(lesionados_equipo)
            
            lesionados[nombre_equipo_web] = num_lesionados

        # NORMALIZAR NOMBRES DE EQUIPOS
        for equipo in list(lesionados.keys()):
            nombre_equipo = normalizar_equipo_2(equipo)
            if equipo != nombre_equipo:
                lesionados[nombre_equipo] = lesionados.pop(equipo)
    
        for equipo in equipos:
            if equipo not in lesionados:
                lesionados[equipo] = 0

    except Exception as e:
        print(f'(Fallo al buscar lesionados: {e})')
    
    return lesionados

#### PRUEBA

**DICCIONARIO lesionados**

CLAVE: Nombre del equipo (str)              Ejemplo: 'Real Madrid'

VALOR: Número de lesionados (número)        Ejemplo: 9

EJEMPLO: {'Real Madrid': 9, 'FC Barcelona': 5, ...}

In [12]:
# Comprobación de que funciona
lesionados_1 = obtener_lesionados_1()
print(lesionados_1)
print(len(lesionados_1))

lesionados_2 = obtener_lesionados_2()
print(lesionados_2)
print(len(lesionados_2))

{'Real Madrid': 4, 'Real Oviedo': 3, 'Real Sociedad': 6, 'Deportivo Alavés': 1, 'Athletic Club': 9, 'Atlético de Madrid': 2, 'FC Barcelona': 3, 'Real Betis': 7, 'Celta de Vigo': 2, 'Elche CF': 4, 'RCD Espanyol': 1, 'Getafe CF': 5, 'Girona FC': 5, 'Levante UD': 4, 'RCD Mallorca': 4, 'CA Osasuna': 1, 'Rayo Vallecano': 5, 'Sevilla FC': 6, 'Valencia CF': 4, 'Villarreal CF': 6}
20
{'Granada CF': 1, 'SD Huesca': 1, 'CD Leganés': 1, 'Real Sociedad B': 2, 'Real Sporting': 1, 'UD Almería': 0, 'UD Las Palmas': 0, 'Cádiz CF': 0, 'Burgos CF': 0, 'Real Zaragoza': 0, 'Málaga CF': 0, 'FC Andorra': 0, 'CD Castellón': 0, 'CD Mirandés': 0, 'SD Eibar': 0, 'Córdoba CF': 0, 'AD Ceuta FC': 0, 'Cultural Leonesa': 0, 'RC Deportivo': 0, 'Racing de Santander': 0, 'Real Valladolid': 0, 'Albacete BP': 0}
22


### 3. Wikipedia
Extraemos Equipos, Estadios y Ciudades

#### 1º DIVISIÓN

In [13]:
def obtener_ciudades_estadios_1():
    url_wikipedia = 'https://es.wikipedia.org/wiki/Primera_División_de_España_2025-26'
    estadios = {}
    ciudades = {}
    
    # Extraemos la ciudad y el estadio con su respectiva capacidad
    try:
        respuesta = requests.get(url_wikipedia, headers=cabeceras)
        soup = BeautifulSoup(respuesta.content, 'html.parser')

        tabla_wiki = soup.find_all('table', class_='wikitable sortable')
        cuerpo = tabla_wiki[3].find('tbody')
        filas = cuerpo.find_all('tr')
        
        for fila in filas:
            ciudad_wiki = 'Desconocida'
            celdas = fila.find_all('td')
            if len(celdas) < 6: # Evitar errores si la fila no tiene suficientes celdas
                continue
            
            equipo_wiki = celdas[0].get_text().strip()    # Nombre    en la primera celda
            # Limpiar equipo de posibles notas al pie
            equipo_wiki = equipo_wiki.split('[')[0].strip()

            ciudad_wiki = celdas[1].get_text().strip()    # Ciudad    en la segunda celda
            # Limpiar ciudad de posibles notas al pie
            ciudad_wiki = ciudad_wiki.split('[')[0].strip()

            estadio_wiki = celdas[4].get_text().strip()   # Estadio   en la quinta celda
            # Limpiar estadio de posibles notas al pie
            estadio_wiki = estadio_wiki.split('[')[0].strip()

            capacidad_wiki = celdas[5].get_text().strip() # Capacidad en la sexta celda
            # Limpiar capacidad de estadio
            # Quitar referencias bibliográficas (corchetes)
            capacidad_limpia = capacidad_wiki.split('[')[0]
            # Quitar el '\xa0', espacios normales, puntos y comas
            capacidad_limpia = capacidad_limpia.replace('\xa0', '').replace(' ', '').replace('.', '').replace(',', '')
            # Convertir a entero para que sea un número real
            capacidad_limpia = int(capacidad_limpia)

            estadios[equipo_wiki] = (estadio_wiki, capacidad_limpia)
            ciudades[equipo_wiki] = ciudad_wiki

        # NORMALIZAR NOMBRES DE EQUIPOS
        for equipo in list(ciudades.keys()):
            equipo_normalizado = normalizar_equipo_1(equipo)
            if equipo != equipo_normalizado:
                estadios[equipo_normalizado] = estadios.pop(equipo)
                ciudades[equipo_normalizado] = ciudades.pop(equipo)
    
    except Exception as e:
        print(f'(Fallo al buscar ciudad o estadio: {e})')
    
    return estadios, ciudades

#### 2º DIVISIÓN

In [14]:
def obtener_ciudades_estadios_2():
    url_wikipedia = 'https://es.wikipedia.org/wiki/Segunda_División_de_España_2025-26'
    estadios = {}
    ciudades = {}
    
    # Extraemos la ciudad y el estadio con su respectiva capacidad
    try:
        respuesta = requests.get(url_wikipedia, headers=cabeceras)
        soup = BeautifulSoup(respuesta.content, 'html.parser')

        tabla_wiki = soup.find_all('table', class_='wikitable sortable')
        cuerpo = tabla_wiki[5].find('tbody')
        filas = cuerpo.find_all('tr')
        
        for fila in filas:
            ciudad_wiki = 'Desconocida'
            celdas = fila.find_all('td')
            if len(celdas) < 6: # Evitar errores si la fila no tiene suficientes celdas
                continue
            
            equipo_wiki = celdas[0].get_text().strip()    # Nombre    en la primera celda
            # Limpiar equipo de posibles notas al pie
            equipo_wiki = equipo_wiki.split('[')[0].strip()

            ciudad_wiki = celdas[1].get_text().strip()    # Ciudad    en la segunda celda
            # Limpiar ciudad de posibles notas al pie
            ciudad_wiki = ciudad_wiki.split('[')[0].strip()

            estadio_wiki = celdas[4].get_text().strip()   # Estadio   en la quinta celda
            # Limpiar estadio de posibles notas al pie
            estadio_wiki = estadio_wiki.split('[')[0].strip()

            capacidad_wiki = celdas[5].get_text().strip() # Capacidad en la sexta celda
            # Limpiar capacidad de estadio
            # Quitar referencias bibliográficas (corchetes)
            capacidad_limpia = capacidad_wiki.split('[')[0]
            # Quitar el '\xa0', espacios normales, puntos y comas
            capacidad_limpia = capacidad_limpia.replace('\xa0', '').replace(' ', '').replace('.', '').replace(',', '')
            # Convertir a entero para que sea un número real
            capacidad_limpia = int(capacidad_limpia)

            estadios[equipo_wiki] = (estadio_wiki, capacidad_limpia)
            ciudades[equipo_wiki] = ciudad_wiki

        # NORMALIZAR NOMBRES DE EQUIPOS
        for equipo in list(ciudades.keys()):
            equipo_normalizado = normalizar_equipo_2(equipo)
            if equipo != equipo_normalizado:
                estadios[equipo_normalizado] = estadios.pop(equipo)
                ciudades[equipo_normalizado] = ciudades.pop(equipo)
    
    except Exception as e:
        print(f'(Fallo al buscar ciudad o estadio: {e})')
    
    return estadios, ciudades

#### PRUEBA

**DICCIONARIO estadios**

CLAVE: Nombre del equipo (str)                                  Ejemplo: 'Real Madrid'

VALOR: Tupla con Nombre del estadio y capacidad ((str,int))     Ejemplo: ('Bernabeu', 90000)

EJEMPLO: {'Real Madrid': ('Bernabeu', 90000), 'FC Barcelona': ('Camp Nou', 100000), ...}



**DICCIONARIO ciudades**

CLAVE: Nombre del equipo (str)              Ejemplo: 'Real Madrid'

VALOR: Ciudad (str)                         Ejemplo: 'Madrid'

EJEMPLO: {'Real Madrid': 'Madrid', 'FC Barcelona': 'Barcelona', ...}

In [15]:
# Comprobación de que funciona
estadios_1, ciudades_1 = obtener_ciudades_estadios_1()
print(estadios_1)
print(ciudades_1)
print(len(estadios_1), len(ciudades_1))

estadios_2, ciudades_2 = obtener_ciudades_estadios_2()
print(estadios_2)
print(ciudades_2)
print(len(estadios_2), len(ciudades_2))

{'Athletic Club': ('San Mamés', 53289), 'Atlético de Madrid': ('Riyadh Air Metropolitano', 70460), 'Celta de Vigo': ('Abanca-Balaídos', 24870), 'Rayo Vallecano': ('Estadio de Vallecas', 14708), 'Real Betis': ('Estadio de La Cartuja', 68887), 'Real Madrid': ('Santiago Bernabéu', 83088), 'Real Oviedo': ('Carlos Tartiere', 30500), 'Real Sociedad': ('Estadio de Anoeta', 39313), 'Deportivo Alavés': ('Mendizorroza', 20320), 'FC Barcelona': ('Spotify Camp Nou', 99354), 'Elche CF': ('Martínez Valero', 33732), 'RCD Espanyol': ('RCDE Stadium', 40000), 'Getafe CF': ('Coliseum', 16500), 'Girona FC': ('Municipal de Montilivi', 14624), 'Levante UD': ('Ciudad de Valencia', 26354), 'RCD Mallorca': ('Son Moix', 23142), 'CA Osasuna': ('El Sadar', 23576), 'Sevilla FC': ('Ramón Sánchez-Pizjuán', 43883), 'Valencia CF': ('Mestalla', 49430), 'Villarreal CF': ('La Cerámica', 23500)}
{'Athletic Club': 'Bilbao', 'Atlético de Madrid': 'Madrid', 'Celta de Vigo': 'Vigo', 'Rayo Vallecano': 'Madrid', 'Real Betis': '

### 4. LaLiga / Partidos
Extraemos Equipos, Rival, Local/Vistante, Fechas, Resultados

#### 1º DIVISIÓN

In [16]:
def obtener_partidos_laliga_1():
    try:
        url = 'https://www.laliga.com/es-ES/laliga-easports/clubes'
        partidos_laliga = {}

        respuesta = requests.get(url, headers=cabeceras)
        soup = BeautifulSoup(respuesta.content, 'html.parser')

        bloques_equipos = soup.find_all('div', class_='styled__ItemContainer-sc-fyva03-1')
        for equipo in bloques_equipos:
            nombre_equipo_web = equipo.find('h2', class_='styled__TextStyled-sc-1mby3k1-0').text.strip()
            url_equipo = equipo.find('a')['href']  # URL del equipo
            indice = url_equipo.find('/plantilla') # Índice donde termina la parte del equipo en la URL
            url_partidos = 'https://www.laliga.com/' + url_equipo[:indice] + '/resultados'

            respuesta_partidos = requests.get(url_partidos, headers=cabeceras)
            soup_partidos = BeautifulSoup(respuesta_partidos.content, 'html.parser')

            tabla_partidos = soup_partidos.find('table', class_='styled__TableStyled-sc-43wy8s-1')
            cuerpo_tabla = tabla_partidos.find('tbody')
            partidos_equipo = cuerpo_tabla.find_all('tr', class_='styled__TableRow-sc-43wy8s-4')

            for partido in partidos_equipo[::2]: # En medio hay filas vacías
                fecha = partido.find('td', type='date').find('p').text.strip()
                hora = partido.find('td', type='time').find('p').text.strip()
                competicion = partido.find('td', class_='styled__TableCell-sc-43wy8s-5 fxZcAr').find('p').text.strip()
                # Datos del marcador
                celda_marcador = partido.select_one('td[class*="styled__TableCellMatch"]')
                marcador = celda_marcador.select('p[class*="styled__TextStyled"]')
                local = marcador[0].text.strip()
                goles_local = marcador[1].text.strip()
                #guión medio = marcador[2].text.strip()
                goles_visitante = marcador[3].text.strip()
                visitante = marcador[4].text.strip()
                
                if nombre_equipo_web == local:
                    en_casa = True
                else:
                    en_casa = False
                    
                # Obtenemos el estadio y la ciudad donde se ha jugado
                # A través de obtener_ciudades_estadios()
                if competicion == 'LALIGA EA SPORTS':
                    nombre_equipo_local = normalizar_equipo_1(local)
                    dic_estadios, dic_ciudades = obtener_ciudades_estadios_1()
                    estadio = dic_estadios[nombre_equipo_local]
                    ciudad = dic_ciudades[nombre_equipo_local]
                    # Comprobamos si el equipo de la iteración juega en casa o fuera
                    

                # Añadimos la información del partido a un diccionario
                    info_partido_laliga ={
                        'Fecha': fecha,
                        'Hora': hora,
                        'Competicion': competicion,
                        'Local': normalizar_equipo_1(local),
                        'Goles_local': goles_local,
                        'Visitante': normalizar_equipo_1(visitante),
                        'Goles_visitante': goles_visitante,
                        'Estadio': estadio,
                        'Ciudad': ciudad,
                        'En_casa': en_casa
                    }

                # Añadimos la información del partido al diccionario de partidos de LaLiga
                # NORMALIZAR NOMBRES DE EQUIPOS
                    nombre_equipo = normalizar_equipo_1(nombre_equipo_web)
                    if nombre_equipo not in partidos_laliga:
                        partidos_laliga[nombre_equipo] = []
                    partidos_laliga[nombre_equipo].append(info_partido_laliga)
    
    except Exception as e:
        print(f'(Fallo al buscar partidos: {e})')
    
    return partidos_laliga

def obtener_partidos_todos_1():
    try:
        url = 'https://www.laliga.com/es-ES/laliga-easports/clubes'
        partidos_todos = {}

        respuesta = requests.get(url, headers=cabeceras)
        soup = BeautifulSoup(respuesta.content, 'html.parser')

        bloques_equipos = soup.find_all('div', class_='styled__ItemContainer-sc-fyva03-1')
        for equipo in bloques_equipos:
            nombre_equipo_web = equipo.find('h2', class_='styled__TextStyled-sc-1mby3k1-0').text.strip()
            url_equipo = equipo.find('a')['href']  # URL del equipo
            indice = url_equipo.find('/plantilla') # Índice donde termina la parte del equipo en la URL
            url_partidos = 'https://www.laliga.com/' + url_equipo[:indice] + '/resultados'

            respuesta_partidos = requests.get(url_partidos, headers=cabeceras)
            soup_partidos = BeautifulSoup(respuesta_partidos.content, 'html.parser')

            tabla_partidos = soup_partidos.find('table', class_='styled__TableStyled-sc-43wy8s-1')
            cuerpo_tabla = tabla_partidos.find('tbody')
            partidos_equipo = cuerpo_tabla.find_all('tr', class_='styled__TableRow-sc-43wy8s-4')

            for partido in partidos_equipo[::2]: # En medio hay filas vacías
                fecha = partido.find('td', type='date').find('p').text.strip()
                hora = partido.find('td', type='time').find('p').text.strip()
                competicion = partido.find('td', class_='styled__TableCell-sc-43wy8s-5 fxZcAr').find('p').text.strip()
                # Datos del marcador
                celda_marcador = partido.select_one('td[class*="styled__TableCellMatch"]')
                marcador = celda_marcador.select('p[class*="styled__TextStyled"]')
                local = marcador[0].text.strip()
                goles_local = marcador[1].text.strip()
                #guión medio = marcador[2].text.strip()
                goles_visitante = marcador[3].text.strip()
                visitante = marcador[4].text.strip()
                
                if nombre_equipo_web == local:
                    en_casa = True
                else:
                    en_casa = False
                    
                # Obtenemos el estadio y la ciudad donde se ha jugado
                # A través de obtener_ciudades_estadios()
                if competicion == 'LALIGA EA SPORTS' or en_casa:
                    nombre_equipo_local = normalizar_equipo_1(local)
                    dic_estadios, dic_ciudades = obtener_ciudades_estadios_1()
                    estadio = dic_estadios[nombre_equipo_local]
                    ciudad = dic_ciudades[nombre_equipo_local]
                    # Comprobamos si el equipo de la iteración juega en casa o fuera
                    

                # Añadimos la información del partido a un diccionario
                    info_partido_laliga ={
                        'Fecha': fecha,
                        'Hora': hora,
                        'Competicion': competicion,
                        'Local': normalizar_equipo_1(local),
                        'Goles_local': goles_local,
                        'Visitante': normalizar_equipo_1(visitante),
                        'Goles_visitante': goles_visitante,
                        'Estadio': estadio,
                        'Ciudad': ciudad,
                        'En_casa': en_casa
                    }
                
                else:
                    
                    info_partido ={
                        'Fecha': fecha,
                        'Hora': hora,
                        'Competicion': competicion,
                        'Local': normalizar_equipo_1(local),
                        'Goles_local': goles_local,
                        'Visitante': normalizar_equipo_1(visitante),
                        'Goles_visitante': goles_visitante,
                        'Estadio': None,
                        'Ciudad': None,
                        'En_casa': en_casa,
                    }

                # Añadimos la información del partido al diccionario de partidos de LaLiga
                # NORMALIZAR NOMBRES DE EQUIPOS
                nombre_equipo = normalizar_equipo_1(nombre_equipo_web)
                if competicion == 'LALIGA EA SPORTS' or en_casa:
                    if nombre_equipo not in partidos_todos:
                        partidos_todos[nombre_equipo] = []
                    partidos_todos[nombre_equipo].append(info_partido_laliga)
                # Añadimos la información del partido al diccionario de todos los partidos
                else:
                    if nombre_equipo not in partidos_todos:
                        partidos_todos[nombre_equipo] = []
                    partidos_todos[nombre_equipo].append(info_partido)
    
    except Exception as e:
        print(f'(Fallo al buscar partidos: {e})')
    
    return partidos_todos

def obtener_proximo_partido_laliga_1():
    try:
        url = 'https://www.laliga.com/es-ES/laliga-easports/clubes'
        proximo_partido = {}

        respuesta = requests.get(url, headers=cabeceras)
        soup = BeautifulSoup(respuesta.content, 'html.parser')

        bloques_equipos = soup.find_all('div', class_='styled__ItemContainer-sc-fyva03-1')
        for equipo in bloques_equipos:
            nombre_equipo_web = equipo.find('h2', class_='styled__TextStyled-sc-1mby3k1-0').text.strip()
            url_equipo = equipo.find('a')['href']  # URL del equipo
            indice = url_equipo.find('/plantilla') # Índice donde termina la parte del equipo en la URL
            url_partidos = 'https://www.laliga.com/' + url_equipo[:indice] + '/proximos-partidos'
            
            respuesta_partidos = requests.get(url_partidos, headers=cabeceras)
            soup_partidos = BeautifulSoup(respuesta_partidos.content, 'html.parser')

            tabla_partidos = soup_partidos.find('table', class_='styled__TableStyled-sc-43wy8s-1')
            cuerpo_tabla = tabla_partidos.find('tbody')
            partidos_equipo = cuerpo_tabla.find_all('tr', class_='styled__TableRow-sc-43wy8s-4')

            for partido in partidos_equipo[::2]: # En medio hay filas vacías
                fecha = partido.find('td', type='date').find('p').text.strip()
                hora = partido.find('td', type='time').find('p').text.strip()
                competicion = partido.find('td', class_='styled__TableCell-sc-43wy8s-5 fxZcAr').find('p').text.strip()
                # Datos del marcador
                celda_marcador = partido.select_one('td[class*="styled__TableCellMatch"]')
                marcador = celda_marcador.select('p[class*="styled__TextStyled"]')
                local = marcador[0].text.strip()
                pos_susp = marcador[1].text.strip() # Si es "SUSP" está suspendido
                visitante = marcador[2].text.strip()
                if competicion == 'LALIGA EA SPORTS' and pos_susp != 'SUSP':
                    break
                
            # Obtenemos el estadio y la ciudad donde se va a jugar
            # A través de obtener_ciudades_estadios()
            nombre_equipo_local = normalizar_equipo_1(local)
            dic_estadios, dic_ciudades = obtener_ciudades_estadios_1()
            estadio = dic_estadios[nombre_equipo_local]
            ciudad = dic_ciudades[nombre_equipo_local]
            # Comprobamos si el equipo de la iteración juega en casa o fuera
            if nombre_equipo_web == local:
                en_casa = True
            else:
                en_casa = False
            
            # Añadimos la información del partido a un diccionario
            info_partido ={
                'Fecha': fecha,
                'Hora': hora,
                'Competicion': competicion,
                'Local': normalizar_equipo_1(local),
                'Visitante': normalizar_equipo_1(visitante),
                'Estadio': estadio,
                'Ciudad': ciudad,
                'En_casa': en_casa,
                'Clima': None,  # Por implementar
                'Temperatura': None,  # Por implementar
            }

            # Añadimos la información del partido al diccionario de todos los partidos
            # NORMALIZAR NOMBRES DE EQUIPOS
            nombre_equipo = normalizar_equipo_1(nombre_equipo_web)
            if nombre_equipo not in proximo_partido:
                proximo_partido[nombre_equipo] = []
            proximo_partido[nombre_equipo].append(info_partido)

    except Exception as e:
        print(f'(Fallo al buscar próximo partido: {e})')

    return proximo_partido

#### 2º DIVISIÓN

In [17]:
def obtener_partidos_laliga_2():
    try:
        url = 'https://www.laliga.com/es-ES/laliga-hypermotion/clubes'
        partidos_laliga = {}

        respuesta = requests.get(url, headers=cabeceras)
        soup = BeautifulSoup(respuesta.content, 'html.parser')

        bloques_equipos = soup.find_all('div', class_='styled__ItemContainer-sc-fyva03-1')
        for equipo in bloques_equipos:
            nombre_equipo_web = equipo.find('h2', class_='styled__TextStyled-sc-1mby3k1-0').text.strip()
            url_equipo = equipo.find('a')['href']  # URL del equipo
            indice = url_equipo.find('/plantilla') # Índice donde termina la parte del equipo en la URL
            url_partidos = 'https://www.laliga.com/' + url_equipo[:indice] + '/resultados'

            respuesta_partidos = requests.get(url_partidos, headers=cabeceras)
            soup_partidos = BeautifulSoup(respuesta_partidos.content, 'html.parser')

            tabla_partidos = soup_partidos.find('table', class_='styled__TableStyled-sc-43wy8s-1')
            cuerpo_tabla = tabla_partidos.find('tbody')
            partidos_equipo = cuerpo_tabla.find_all('tr', class_='styled__TableRow-sc-43wy8s-4')

            for partido in partidos_equipo[::2]: # En medio hay filas vacías
                fecha = partido.find('td', type='date').find('p').text.strip()
                hora = partido.find('td', type='time').find('p').text.strip()
                competicion = partido.find('td', class_='styled__TableCell-sc-43wy8s-5 fxZcAr').find('p').text.strip()
                # Datos del marcador
                celda_marcador = partido.select_one('td[class*="styled__TableCellMatch"]')
                marcador = celda_marcador.select('p[class*="styled__TextStyled"]')
                local = marcador[0].text.strip()
                goles_local = marcador[1].text.strip()
                #guión medio = marcador[2].text.strip()
                goles_visitante = marcador[3].text.strip()
                visitante = marcador[4].text.strip()
                
                if nombre_equipo_web == local:
                    en_casa = True
                else:
                    en_casa = False
                    
                # Obtenemos el estadio y la ciudad donde se ha jugado
                # A través de obtener_ciudades_estadios()
                if competicion == 'LALIGA HYPERMOTION':
                    nombre_equipo_local = normalizar_equipo_2(local)
                    dic_estadios, dic_ciudades = obtener_ciudades_estadios_2()
                    estadio = dic_estadios[nombre_equipo_local]
                    ciudad = dic_ciudades[nombre_equipo_local]
                    # Comprobamos si el equipo de la iteración juega en casa o fuera
                    

                # Añadimos la información del partido a un diccionario
                    info_partido_laliga ={
                        'Fecha': fecha,
                        'Hora': hora,
                        'Competicion': competicion,
                        'Local': normalizar_equipo_2(local),
                        'Goles_local': goles_local,
                        'Visitante': normalizar_equipo_2(visitante),
                        'Goles_visitante': goles_visitante,
                        'Estadio': estadio,
                        'Ciudad': ciudad,
                        'En_casa': en_casa
                    }

                # Añadimos la información del partido al diccionario de partidos de LaLiga
                # NORMALIZAR NOMBRES DE EQUIPOS
                    nombre_equipo = normalizar_equipo_2(nombre_equipo_web)
                    if nombre_equipo not in partidos_laliga:
                        partidos_laliga[nombre_equipo] = []
                    partidos_laliga[nombre_equipo].append(info_partido_laliga)
    
    except Exception as e:
        print(f'(Fallo al buscar partidos: {e})')
    
    return partidos_laliga

def obtener_partidos_todos_2():
    try:
        url = 'https://www.laliga.com/es-ES/laliga-hypermotion/clubes'
        partidos_todos = {}

        respuesta = requests.get(url, headers=cabeceras)
        soup = BeautifulSoup(respuesta.content, 'html.parser')

        bloques_equipos = soup.find_all('div', class_='styled__ItemContainer-sc-fyva03-1')
        for equipo in bloques_equipos:
            nombre_equipo_web = equipo.find('h2', class_='styled__TextStyled-sc-1mby3k1-0').text.strip()
            url_equipo = equipo.find('a')['href']  # URL del equipo
            indice = url_equipo.find('/plantilla') # Índice donde termina la parte del equipo en la URL
            url_partidos = 'https://www.laliga.com/' + url_equipo[:indice] + '/resultados'

            respuesta_partidos = requests.get(url_partidos, headers=cabeceras)
            soup_partidos = BeautifulSoup(respuesta_partidos.content, 'html.parser')

            tabla_partidos = soup_partidos.find('table', class_='styled__TableStyled-sc-43wy8s-1')
            cuerpo_tabla = tabla_partidos.find('tbody')
            partidos_equipo = cuerpo_tabla.find_all('tr', class_='styled__TableRow-sc-43wy8s-4')

            for partido in partidos_equipo[::2]: # En medio hay filas vacías
                fecha = partido.find('td', type='date').find('p').text.strip()
                hora = partido.find('td', type='time').find('p').text.strip()
                competicion = partido.find('td', class_='styled__TableCell-sc-43wy8s-5 fxZcAr').find('p').text.strip()
                # Datos del marcador
                celda_marcador = partido.select_one('td[class*="styled__TableCellMatch"]')
                marcador = celda_marcador.select('p[class*="styled__TextStyled"]')
                local = marcador[0].text.strip()
                goles_local = marcador[1].text.strip()
                #guión medio = marcador[2].text.strip()
                goles_visitante = marcador[3].text.strip()
                visitante = marcador[4].text.strip()
                
                if nombre_equipo_web == local:
                    en_casa = True
                else:
                    en_casa = False
                    
                # Obtenemos el estadio y la ciudad donde se ha jugado
                # A través de obtener_ciudades_estadios()
                if competicion == 'LALIGA HYPERMOTION' or en_casa:
                    nombre_equipo_local = normalizar_equipo_2(local)
                    dic_estadios, dic_ciudades = obtener_ciudades_estadios_2()
                    estadio = dic_estadios[nombre_equipo_local]
                    ciudad = dic_ciudades[nombre_equipo_local]
                    # Comprobamos si el equipo de la iteración juega en casa o fuera
                    

                # Añadimos la información del partido a un diccionario
                    info_partido_laliga ={
                        'Fecha': fecha,
                        'Hora': hora,
                        'Competicion': competicion,
                        'Local': normalizar_equipo_2(local),
                        'Goles_local': goles_local,
                        'Visitante': normalizar_equipo_2(visitante),
                        'Goles_visitante': goles_visitante,
                        'Estadio': estadio,
                        'Ciudad': ciudad,
                        'En_casa': en_casa
                    }
                
                else:
                    
                    info_partido ={
                        'Fecha': fecha,
                        'Hora': hora,
                        'Competicion': competicion,
                        'Local': normalizar_equipo_2(local),
                        'Goles_local': goles_local,
                        'Visitante': normalizar_equipo_2(visitante),
                        'Goles_visitante': goles_visitante,
                        'Estadio': None,
                        'Ciudad': None,
                        'En_casa': en_casa,
                    }

                # Añadimos la información del partido al diccionario de partidos de LaLiga
                # NORMALIZAR NOMBRES DE EQUIPOS
                nombre_equipo = normalizar_equipo_2(nombre_equipo_web)
                if competicion == 'LALIGA HYPERMOTION' or en_casa:
                    if nombre_equipo not in partidos_todos:
                        partidos_todos[nombre_equipo] = []
                    partidos_todos[nombre_equipo].append(info_partido_laliga)
                # Añadimos la información del partido al diccionario de todos los partidos
                else:
                    if nombre_equipo not in partidos_todos:
                        partidos_todos[nombre_equipo] = []
                    partidos_todos[nombre_equipo].append(info_partido)
    
    except Exception as e:
        print(f'(Fallo al buscar partidos: {e})')
    
    return partidos_todos

def obtener_proximo_partido_laliga_2():
    try:
        url = 'https://www.laliga.com/es-ES/laliga-hypermotion/clubes'
        proximo_partido = {}

        respuesta = requests.get(url, headers=cabeceras)
        soup = BeautifulSoup(respuesta.content, 'html.parser')

        bloques_equipos = soup.find_all('div', class_='styled__ItemContainer-sc-fyva03-1')
        for equipo in bloques_equipos:
            nombre_equipo_web = equipo.find('h2', class_='styled__TextStyled-sc-1mby3k1-0').text.strip()
            url_equipo = equipo.find('a')['href']  # URL del equipo
            indice = url_equipo.find('/plantilla') # Índice donde termina la parte del equipo en la URL
            url_partidos = 'https://www.laliga.com/' + url_equipo[:indice] + '/proximos-partidos'
            
            respuesta_partidos = requests.get(url_partidos, headers=cabeceras)
            soup_partidos = BeautifulSoup(respuesta_partidos.content, 'html.parser')

            tabla_partidos = soup_partidos.find('table', class_='styled__TableStyled-sc-43wy8s-1')
            cuerpo_tabla = tabla_partidos.find('tbody')
            partidos_equipo = cuerpo_tabla.find_all('tr', class_='styled__TableRow-sc-43wy8s-4')

            for partido in partidos_equipo[::2]: # En medio hay filas vacías
                fecha = partido.find('td', type='date').find('p').text.strip()
                hora = partido.find('td', type='time').find('p').text.strip()
                competicion = partido.find('td', class_='styled__TableCell-sc-43wy8s-5 fxZcAr').find('p').text.strip()
                # Datos del marcador
                celda_marcador = partido.select_one('td[class*="styled__TableCellMatch"]')
                marcador = celda_marcador.select('p[class*="styled__TextStyled"]')
                local = marcador[0].text.strip()
                pos_susp = marcador[1].text.strip() # Si es "SUSP" está suspendido
                visitante = marcador[2].text.strip()
                if competicion == 'LALIGA HYPERMOTION' and pos_susp != 'SUSP':
                    break
                
            # Obtenemos el estadio y la ciudad donde se va a jugar
            # A través de obtener_ciudades_estadios()
            nombre_equipo_local = normalizar_equipo_2(local)
            dic_estadios, dic_ciudades = obtener_ciudades_estadios_2()
            estadio = dic_estadios[nombre_equipo_local]
            ciudad = dic_ciudades[nombre_equipo_local]
            # Comprobamos si el equipo de la iteración juega en casa o fuera
            if nombre_equipo_web == local:
                en_casa = True
            else:
                en_casa = False

            # Añadimos la información del partido a un diccionario
            info_partido ={
                'Fecha': fecha,
                'Hora': hora,
                'Competicion': competicion,
                'Local': normalizar_equipo_2(local),
                'Visitante': normalizar_equipo_2(visitante),
                'Estadio': estadio,
                'Ciudad': ciudad,
                'En_casa': en_casa
            }

            # Añadimos la información del partido al diccionario de todos los partidos
            # NORMALIZAR NOMBRES DE EQUIPOS
            nombre_equipo = normalizar_equipo_2(nombre_equipo_web)
            if nombre_equipo not in proximo_partido:
                proximo_partido[nombre_equipo] = []
            proximo_partido[nombre_equipo].append(info_partido)

    except Exception as e:
        print(f'(Fallo al buscar próximo partido: {e})')

    return proximo_partido

#### PRUEBA

**DICCIONARIO partidos_laliga**

CLAVE: Nombre del equipo (str)                                  Ejemplo: 'Real Madrid'

VALOR: Lista de diccionarios con información de los partidos de la liga  (list) 

- DICCIONARIO PARTIDO:
    - 'Fecha'         : Fecha del partido (str)                                  Ejemplo: '20/10/2023'
    - 'Hora'          : Hora del partido (str)                                   Ejemplo: '21:00'
    - 'Competicion'   : Nombre de la competición (str)                           Ejemplo: 'LALIGA EA SPORTS'
    - 'Local'         : Nombre del equipo local (str)                            Ejemplo: 'Real Madrid'
    - 'Goles_local'   : Goles del equipo local (str)                             Ejemplo: '2'
    - 'Visitante'     : Nombre del equipo visitante (str)                        Ejemplo: 'FC Barcelona'
    - 'Goles_visitante': Goles del equipo visitante (str)                        Ejemplo: '1'
    - 'Estadio'       : Tupla con Nombre del estadio y capacidad ((str,int))     Ejemplo: ('Bernabeu', 90000)
    - 'Ciudad'        : Ciudad donde se juega el partido (str)                   Ejemplo: 'Madrid'
    - 'En_casa'       : Booleano que indica si el equipo juega en casa (bool)    Ejemplo: True



**DICCIONARIO partidos_todos**

CLAVE: Nombre del equipo (str)                                  Ejemplo: 'Real Madrid'

VALOR: Lista de diccionarios con información de los partidos  (list)

- DICCIONARIO PARTIDO:
    - 'Fecha'         : Fecha del partido (str)                                  Ejemplo: '20/10/2023'
    - 'Hora'          : Hora del partido (str)                                   Ejemplo: '21:00'
    - 'Competicion'   : Nombre de la competición (str)                           Ejemplo: 'LALIGA EA SPORTS'
    - 'Local'         : Nombre del equipo local (str)                            Ejemplo: 'Real Madrid'
    - 'Goles_local'   : Goles del equipo local (str)                             Ejemplo: '2'
    - 'Visitante'     : Nombre del equipo visitante (str)                        Ejemplo: 'FC Barcelona'
    - 'Goles_visitante': Goles del equipo visitante (str)                        Ejemplo: '1'
    - 'Estadio'       : Tupla con Nombre del estadio y capacidad ((str,int))     Ejemplo: ('Bernabeu', 90000)
    - 'Ciudad'        : Ciudad donde se juega el partido (str)                   Ejemplo: 'Madrid'
    - 'En_casa'       : Booleano que indica si el equipo juega en casa (bool)    Ejemplo: True


    
**DICCIONARIO proximo_partido**

CLAVE: Nombre del equipo (str)                                  Ejemplo: 'Real Madrid'

VALOR: Lista de diccionarios con información del próximos partidos  (list)      Ejemplo: 'Real Madrid' : [    {partido...}    ]

- DICCIONARIO PARTIDO:
    - 'Fecha'         : Fecha del partido (str)                                  Ejemplo: '20/10/2023'
    - 'Hora'          : Hora del partido (str)                                   Ejemplo: '21:00'
    - 'Competicion'   : Nombre de la competición (str)                           Ejemplo: 'LALIGA EA SPORTS'
    - 'Local'         : Nombre del equipo local (str)                            Ejemplo: 'Real Madrid'
    - 'Visitante'     : Nombre del equipo visitante (str)                        Ejemplo: 'FC Barcelona'
    - 'Estadio'       : Tupla con Nombre del estadio y capacidad ((str,int))     Ejemplo: ('Bernabeu', 90000)
    - 'Ciudad'        : Ciudad donde se juega el partido (str)                   Ejemplo: 'Madrid'
    - 'En_casa'       : Booleano que indica si el equipo juega en casa (bool)    Ejemplo: True

In [18]:
# Comprobación de que funciona 1º División

print("\nINICIANDO VERIFICACIÓN DE CÓDIGO 1º DIVISION...")

# 1. Probamos función LALIGA
d_laliga = obtener_partidos_laliga_1()
count_laliga = sum(len(v) for v in d_laliga.values())
print(f"Resultado 'obtener_partidos_laliga_1': {len(d_laliga)} equipos, {count_laliga} partidos totales.")

# 2. Probamos función TODOS
d_todos = obtener_partidos_todos_1()
count_todos = sum(len(v) for v in d_todos.values())
print(f"Resultado 'obtener_partidos_todos_1':  {len(d_todos)} equipos, {count_todos} partidos totales.")

# 3. Probamos función PRÓXIMO PARTIDO (20 PARTIDOS)
d_proximo = obtener_proximo_partido_laliga_1()
count_proximo = sum(len(v) for v in d_proximo.values())
print(f"Resultado 'obtener_proximo_partido_laliga_1': {len(d_proximo)} equipos, {count_proximo} próximos partidos totales.")

# 3. Exportación de prueba a DataFrame para ver si hay datos reales
if count_todos > 0:
    lista_flat = []
    for k, v in d_todos.items():
        lista_flat.extend(v)
    df_check = pd.DataFrame(lista_flat)
    print("\nMUESTRA DEL DATAFRAME FINAL (Primeras 3 filas):")
    display(df_check.head(3))
else:
    print("\nALERTA: No se han extraído partidos. Revisa si la web ha cambiado o bloqueado la IP.")


INICIANDO VERIFICACIÓN DE CÓDIGO 1º DIVISION...
Resultado 'obtener_partidos_laliga_1': 20 equipos, 418 partidos totales.
Resultado 'obtener_partidos_todos_1':  20 equipos, 556 partidos totales.
Resultado 'obtener_proximo_partido_laliga_1': 20 equipos, 20 próximos partidos totales.

MUESTRA DEL DATAFRAME FINAL (Primeras 3 filas):


Unnamed: 0,Fecha,Hora,Competicion,Local,Goles_local,Visitante,Goles_visitante,Estadio,Ciudad,En_casa
0,MIE 28.01.2026,21:00,UEFA Champions League,Athletic Club,2,Sporting portugal,3,"(San Mamés, 53289)",Bilbao,True
1,SAB 24.01.2026,18:30,LALIGA EA SPORTS,Sevilla FC,2,Athletic Club,1,"(Ramón Sánchez-Pizjuán, 43883)",Sevilla,False
2,MIE 21.01.2026,21:00,UEFA Champions League,Atalanta,2,Athletic Club,3,,,False


In [19]:
# Comprobación de que funciona 2º División

print("\nINICIANDO VERIFICACIÓN DE CÓDIGO 2º DIVISIÓN...")

# 1. Probamos función LALIGA
d_laliga = obtener_partidos_laliga_2()
count_laliga = sum(len(v) for v in d_laliga.values())
print(f"Resultado 'obtener_partidos_laliga_2': {len(d_laliga)} equipos, {count_laliga} partidos totales.")

# 2. Probamos función TODOS
d_todos = obtener_partidos_todos_2()
count_todos = sum(len(v) for v in d_todos.values())
print(f"Resultado 'obtener_partidos_todos_2':  {len(d_todos)} equipos, {count_todos} partidos totales.")

# 3. Probamos función PRÓXIMO PARTIDO (22 PARTIDOS)
d_proximo = obtener_proximo_partido_laliga_2()
count_proximo = sum(len(v) for v in d_proximo.values())
print(f"Resultado 'obtener_proximo_partido_laliga_2': {len(d_proximo)} equipos, {count_proximo} próximos partidos totales.")

# 3. Exportación de prueba a DataFrame para ver si hay datos reales
if count_todos > 0:
    lista_flat = []
    for k, v in d_todos.items():
        lista_flat.extend(v)
    df_check = pd.DataFrame(lista_flat)
    print("\nMUESTRA DEL DATAFRAME FINAL (Primeras 3 filas):")
    display(df_check.head(3))
else:
    print("\nALERTA: No se han extraído partidos. Revisa si la web ha cambiado o bloqueado la IP.")


INICIANDO VERIFICACIÓN DE CÓDIGO 2º DIVISIÓN...
Resultado 'obtener_partidos_laliga_2': 22 equipos, 506 partidos totales.
Resultado 'obtener_partidos_todos_2':  22 equipos, 558 partidos totales.
Resultado 'obtener_proximo_partido_laliga_2': 22 equipos, 22 próximos partidos totales.

MUESTRA DEL DATAFRAME FINAL (Primeras 3 filas):


Unnamed: 0,Fecha,Hora,Competicion,Local,Goles_local,Visitante,Goles_visitante,Estadio,Ciudad,En_casa
0,LUN 26.01.2026,20:30,LALIGA HYPERMOTION,AD Ceuta FC,3,Cultural Leonesa,1,"(Alfonso Murube, 6500)",Ceuta,True
1,SÁB 17.01.2026,14:00,LALIGA HYPERMOTION,AD Ceuta FC,0,Real Valladolid,3,"(Alfonso Murube, 6500)",Ceuta,True
2,DOM 11.01.2026,16:15,LALIGA HYPERMOTION,Málaga CF,2,AD Ceuta FC,1,"(La Rosaleda, 30044)",Málaga,False


##### 4.0 PARTIDOS VALENCIA CF

In [21]:
import pandas as pd

# 1. Llamamos a la función para obtener los datos actualizados

partidos_todos = obtener_partidos_todos_1()

# 2. Seleccionamos específicamente la lista del Valencia CF
# (Usamos 'partidos_todos' para que incluya Liga, Copa, etc.)
nombre_equipo = 'Valencia CF'
lista_partidos_valencia = partidos_todos.get(nombre_equipo, [])

# 3. Creamos el DataFrame
df_valencia = pd.DataFrame(lista_partidos_valencia)

# 4. Limpieza y comprobación
if not df_valencia.empty:
    # Convertimos goles a números
    df_valencia['Goles_local'] = pd.to_numeric(df_valencia['Goles_local'], errors='coerce').fillna(0)
    df_valencia['Goles_visitante'] = pd.to_numeric(df_valencia['Goles_visitante'], errors='coerce').fillna(0)
    df_valencia['total_goles'] = df_valencia['Goles_local'] + df_valencia['Goles_visitante']

    print(f"¡Éxito! Se han cargado {len(df_valencia)} partidos del {nombre_equipo}.")
    display(df_valencia) # Muestra la tabla bonita en Jupyter
else:
    print(f"No se encontraron partidos para '{nombre_equipo}'.")
    print("Posibles nombres disponibles:", list(partidos_todos.keys())) # Ayuda para ver cómo se ha guardado el nombre

¡Éxito! Se han cargado 25 partidos del Valencia CF.


Unnamed: 0,Fecha,Hora,Competicion,Local,Goles_local,Visitante,Goles_visitante,Estadio,Ciudad,En_casa,total_goles
0,SAB 24.01.2026,16:15,LALIGA EA SPORTS,Valencia CF,3,RCD Espanyol,2,"(Mestalla, 49430)",Valencia,True,5
1,DOM 18.01.2026,14:00,LALIGA EA SPORTS,Getafe CF,0,Valencia CF,1,"(Coliseum, 16500)",Getafe,False,1
2,JUE 15.01.2026,21:00,Copa del Rey,Burgos cf,0,Valencia CF,2,,,False,2
3,SAB 10.01.2026,21:00,LALIGA EA SPORTS,Valencia CF,1,Elche CF,1,"(Mestalla, 49430)",Valencia,True,2
4,SAB 03.01.2026,14:00,LALIGA EA SPORTS,Celta de Vigo,4,Valencia CF,1,"(Abanca-Balaídos, 24870)",Vigo,False,5
5,VIE 19.12.2025,21:00,LALIGA EA SPORTS,Valencia CF,1,RCD Mallorca,1,"(Mestalla, 49430)",Valencia,True,2
6,MAR 16.12.2025,21:00,Copa del Rey,Real sporting,0,Valencia CF,2,,,False,2
7,SAB 13.12.2025,14:00,LALIGA EA SPORTS,Atlético de Madrid,2,Valencia CF,1,"(Riyadh Air Metropolitano, 70460)",Madrid,False,3
8,DOM 07.12.2025,16:15,LALIGA EA SPORTS,Valencia CF,1,Sevilla FC,1,"(Mestalla, 49430)",Valencia,True,2
9,JUE 04.12.2025,21:00,Copa del Rey,Fc cartagena,1,Valencia CF,2,,,False,3


##### 4.1 PROXIMA JORNADA

In [22]:
# COMPROBACIÓN DETALLADA DEL CÓDIGO DE OBTENCIÓN DEL PRÓXIMO PARTIDO
url = 'https://www.laliga.com/es-ES/laliga-easports/clubes'
proximo_partido = {}

respuesta = requests.get(url, headers=cabeceras)
soup = BeautifulSoup(respuesta.content, 'html.parser')

bloques_equipos = soup.find_all('div', class_='styled__ItemContainer-sc-fyva03-1')
equipos_ya_vistos = set()
for equipo in bloques_equipos:
    nombre_equipo_web = equipo.find('h2', class_='styled__TextStyled-sc-1mby3k1-0').text.strip()
    url_equipo = equipo.find('a')['href']  # URL del equipo
    indice = url_equipo.find('/plantilla') # Índice donde termina la parte del equipo en la URL
    url_partidos = 'https://www.laliga.com/' + url_equipo[:indice] + '/proximos-partidos'
    
    respuesta_partidos = requests.get(url_partidos, headers=cabeceras)
    soup_partidos = BeautifulSoup(respuesta_partidos.content, 'html.parser')

    tabla_partidos = soup_partidos.find('table', class_='styled__TableStyled-sc-43wy8s-1')
    cuerpo_tabla = tabla_partidos.find('tbody')
    partidos_equipo = cuerpo_tabla.find_all('tr', class_='styled__TableRow-sc-43wy8s-4')

    for partido in partidos_equipo[::2]: # En medio hay filas vacías
        fecha = partido.find('td', type='date').find('p').text.strip()
        hora = partido.find('td', type='time').find('p').text.strip()
        competicion = partido.find('td', class_='styled__TableCell-sc-43wy8s-5 fxZcAr').find('p').text.strip()
        # Datos del marcador
        celda_marcador = partido.select_one('td[class*="styled__TableCellMatch"]')
        marcador = celda_marcador.select('p[class*="styled__TextStyled"]')
        local = marcador[0].text.strip()
        pos_susp = marcador[1].text.strip()
        visitante = marcador[2].text.strip()
        if competicion == 'LALIGA EA SPORTS' and pos_susp == 'VS':
            break
        
   
    if nombre_equipo_web in equipos_ya_vistos:
        continue
    else:
        print(f'{local} vs {visitante} - Fecha: {fecha} - Hora: {hora}')
        equipos_ya_vistos.add(local)
        equipos_ya_vistos.add(visitante)

Athletic Club vs Real Sociedad - Fecha: DOM  01.02.2026 - Hora: 21:00
Levante UD vs Atlético de Madrid - Fecha: SÁB  31.01.2026 - Hora: 18:30
CA Osasuna vs Villarreal CF - Fecha: SÁB  31.01.2026 - Hora: 16:15
Getafe CF vs Celta - Fecha: DOM  01.02.2026 - Hora: 18:30
RCD Espanyol de Barcelona vs Deportivo Alavés - Fecha: VIE  30.01.2026 - Hora: 21:00
Elche CF vs FC Barcelona - Fecha: SÁB  31.01.2026 - Hora: 21:00
Real Oviedo vs Girona FC - Fecha: SAB 31.01.2026 - Hora: 14:00
Real Madrid vs Rayo Vallecano - Fecha: DOM  01.02.2026 - Hora: 14:00
RCD Mallorca vs Sevilla FC - Fecha: LUN 02.02.2026 - Hora: 21:00
Real Betis vs Valencia CF - Fecha: DOM 01.02.2026 - Hora: 16:15


### 5. LaLiga / Clasificación
Extraemos clasificación

#### 1º DIVISIÓN

In [23]:
def obtener_clasificacion_1():
    try:
        url = 'https://www.laliga.com/laliga-easports/clasificacion'
        clasificacion = {}

        respuesta = requests.get(url, headers=cabeceras)
        soup = BeautifulSoup(respuesta.content, 'html.parser')

        show = soup.find('div', class_='show') # Parte visible que contiene la clasificación

        bloques_equipos = show.find_all('div', class_='styled__ContainerAccordion-sc-e89col-11')
        for equipo in bloques_equipos:
            info = equipo.find_all('p') # Lista con toda la info de un equipo
            posicion = info[0].text.strip() + 'º'
            # abreviatura = info[1].text.strip()
            nombre_equipo_web = info[2].text.strip()
            puntos = int(info[3].text.strip())
            partidos_jugados = int(info[4].text.strip())
            partidos_ganados = int(info[5].text.strip())
            partidos_empatados = int(info[6].text.strip())
            partidos_perdidos = int(info[7].text.strip())
            goles_favor = int(info[8].text.strip())
            goles_contra = int(info[9].text.strip())
            diferencia_goles = int(info[10].text.strip())
            
            clasificacion[nombre_equipo_web] = {
                'Posicion': posicion,
                'Puntos': puntos,
                'Partidos_jugados': partidos_jugados,
                'Partidos_ganados': partidos_ganados,
                'Partidos_empatados': partidos_empatados,
                'Partidos_perdidos': partidos_perdidos,
                'Goles_favor': goles_favor,
                'Goles_contra': goles_contra,
                'Diferencia_goles': diferencia_goles
            }

            # NORMALIZAR NOMBRES DE EQUIPOS
            nombre_equipo = normalizar_equipo_1(nombre_equipo_web)
            if nombre_equipo != nombre_equipo_web:
                clasificacion[nombre_equipo] = clasificacion.pop(nombre_equipo_web)

    except Exception as e:
        print(f'(Fallo al buscar clasificación): {e}')

    return clasificacion

#### 2º DIVISIÓN

In [24]:
def obtener_clasificacion_2():
    try:
        url = 'https://www.laliga.com/laliga-hypermotion/clasificacion'
        clasificacion = {}

        respuesta = requests.get(url, headers=cabeceras)
        soup = BeautifulSoup(respuesta.content, 'html.parser')

        show = soup.find('div', class_='show') # Parte visible que contiene la clasificación

        bloques_equipos = show.find_all('div', class_='styled__ContainerAccordion-sc-e89col-11')
        for equipo in bloques_equipos:
            info = equipo.find_all('p') # Lista con toda la info de un equipo
            posicion = info[0].text.strip() + 'º'
            # abreviatura = info[1].text.strip()
            nombre_equipo_web = info[2].text.strip()
            puntos = int(info[3].text.strip())
            partidos_jugados = int(info[4].text.strip())
            partidos_ganados = int(info[5].text.strip())
            partidos_empatados = int(info[6].text.strip())
            partidos_perdidos = int(info[7].text.strip())
            goles_favor = int(info[8].text.strip())
            goles_contra = int(info[9].text.strip())
            diferencia_goles = int(info[10].text.strip())
            
            clasificacion[nombre_equipo_web] = {
                'Posicion': posicion,
                'Puntos': puntos,
                'Partidos_jugados': partidos_jugados,
                'Partidos_ganados': partidos_ganados,
                'Partidos_empatados': partidos_empatados,
                'Partidos_perdidos': partidos_perdidos,
                'Goles_favor': goles_favor,
                'Goles_contra': goles_contra,
                'Diferencia_goles': diferencia_goles
            }

            # NORMALIZAR NOMBRES DE EQUIPOS
            nombre_equipo = normalizar_equipo_2(nombre_equipo_web)
            if nombre_equipo != nombre_equipo_web:
                clasificacion[nombre_equipo] = clasificacion.pop(nombre_equipo_web)

    except Exception as e:
        print(f'(Fallo al buscar clasificación): {e}')

    return clasificacion

#### PRUEBA

**DICCIONARIO clasificación**

CLAVE: Nombre del equipo (str)                                         Ejemplo: 'Real Madrid'

VALOR: Diccionario con información de los partidos de la liga  (dict)

- DICCIONARIO INTERNO:
    - 'Posicion'          : Posición en la clasificación (str)         Ejemplo: 1º
    - 'Puntos'            : Puntos totales (int)                       Ejemplo: 75
    - 'Partidos_jugados'  : Número de partidos jugados (int)           Ejemplo: 30
    - 'Partidos_ganados'  : Número de partidos ganados (int)           Ejemplo: 23
    - 'Partidos_empatados': Número de partidos empatados (int)         Ejemplo: 6
    - 'Partidos_perdidos' : Número de partidos perdidos (int)          Ejemplo: 1
    - 'Goles_favor'       : Goles a favor (int)                        Ejemplo: 68
    - 'Goles_contra'      : Goles en contra (int)                      Ejemplo: 20
    - 'Diferencia_goles'  : Diferencia de goles (int)                  Ejemplo: 48, -20

In [25]:
# Comprobación de que funciona
clasificacion_1 = obtener_clasificacion_1()
print('POSICIÓN | EQUIPO                  | PUNTOS | PJ | PG | PE | PP | GF | GC | DG')
for equipo, datos in clasificacion_1.items():
    print(f"{datos['Posicion']:>8} | {equipo:<23} | {datos['Puntos']:>6} | {datos['Partidos_jugados']:>2} | {datos['Partidos_ganados']:>2} | {datos['Partidos_empatados']:>2} | {datos['Partidos_perdidos']:>2} | {datos['Goles_favor']:>2} | {datos['Goles_contra']:>2} | {datos['Diferencia_goles']:>2}")

clasificacion_2 = obtener_clasificacion_2()
print('\nPOSICIÓN | EQUIPO                  | PUNTOS | PJ | PG | PE | PP | GF | GC | DG')
for equipo, datos in clasificacion_2.items():
    print(f"{datos['Posicion']:>8} | {equipo:<23} | {datos['Puntos']:>6} | {datos['Partidos_jugados']:>2} | {datos['Partidos_ganados']:>2} | {datos['Partidos_empatados']:>2} | {datos['Partidos_perdidos']:>2} | {datos['Goles_favor']:>2} | {datos['Goles_contra']:>2} | {datos['Diferencia_goles']:>2}")

POSICIÓN | EQUIPO                  | PUNTOS | PJ | PG | PE | PP | GF | GC | DG
      1º | FC Barcelona            |     52 | 21 | 17 |  1 |  3 | 57 | 22 | 35
      2º | Real Madrid             |     51 | 21 | 16 |  3 |  2 | 45 | 17 | 28
      3º | Atlético de Madrid      |     44 | 21 | 13 |  5 |  3 | 38 | 17 | 21
      4º | Villarreal CF           |     41 | 20 | 13 |  2 |  5 | 37 | 21 | 16
      5º | RCD Espanyol            |     34 | 21 | 10 |  4 |  7 | 25 | 25 |  0
      6º | Real Betis              |     32 | 21 |  8 |  8 |  5 | 34 | 27 |  7
      7º | Celta de Vigo           |     32 | 21 |  8 |  8 |  5 | 29 | 23 |  6
      8º | Real Sociedad           |     27 | 21 |  7 |  6 |  8 | 29 | 29 |  0
      9º | CA Osasuna              |     25 | 21 |  7 |  4 | 10 | 24 | 25 | -1
     10º | Girona FC               |     25 | 21 |  6 |  7 |  8 | 21 | 35 | -14
     11º | Elche CF                |     24 | 21 |  5 |  9 |  7 | 29 | 29 |  0
     12º | Sevilla FC              |     24 | 21 | 

### 6. Clima (Football-Weather)
Extraemos Tiempo

#### 1º DIVISIÓN

In [26]:
def obtener_prox_partido_clima_1():
    try:
        url = 'https://www.football-weather.com/football-league/La-Liga'
        proximo_partido = obtener_proximo_partido_laliga_1()
        equipos_con_clima = []

        # Diccionario simple de traducción de climas
        clima_traduccion = {
            'sunny': 'Soleado',
            'cloudy': 'Nublado',
            'partly cloudy': 'Parcialmente nublado',
            'clear': 'Despejado',
            'rainy': 'Lluvioso',
            'rain': 'Lluvia',
            'snowy': 'Nevado',
            'windy': 'Ventoso',
            'lightsnow': 'Nieve ligera',
            'showers': 'Chubascos',
            'thunderstorms': 'Tormentas',
            'patchyrainnearby': 'Lluvia dispersa cercana',
            'overcast': 'Cielo cubierto',
            'partlycloudy': 'Parcialmente nublado',
            'lightrain': 'Lluvia ligera',
            'lightdrizzle': 'Llovizna'
        }

        respuesta = requests.get(url, headers=cabeceras)
        soup = BeautifulSoup(respuesta.content, 'html.parser')
        
        bloques_partidos = soup.find_all('div', class_='accordion')
        if not bloques_partidos:
            return proximo_partido  # Si no hay bloques, retornamos lo que tenemos
        
        for partido_prox in bloques_partidos:
            equipos = partido_prox.find('div', class_='col-md-4').text.strip()
            local_web = equipos.split(' vs. ')[0].strip()
            visitante_web = equipos.split(' vs. ')[1].strip()
            clima_web = partido_prox.find('div', class_='col-sm-auto').text.strip()
            temperatura = clima_web.replace(' ', '').split('\n')[0].strip() # Temperatura lo primero que aparece
            condicion_climatica = clima_web.replace(' ', '').split('\n')[1].strip().lower() # Condición climática lo segundo
            # Intentamos traducir, si no está en el diccionario 1º en mayúscula
            condicion_climatica = clima_traduccion.get(condicion_climatica, condicion_climatica.capitalize())
            
            # Asignamos los datos de clima al partido correspondiente
            for equipo, partidos in proximo_partido.items():
                partido = partidos[0]  # Solo hay un próximo partido por equipo
                if partido['Local'] == normalizar_equipo_1(local_web) and partido['Visitante'] == normalizar_equipo_1(visitante_web):
                    partido['Clima'] = condicion_climatica
                    partido['Temperatura'] = temperatura
                    equipos_con_clima.append(equipo)
    
    except Exception as e:
        print(f'(Fallo al buscar clima próximo partido: {e})')

    return proximo_partido

#### PRUEBA

In [27]:
# Comprobación de que funciona
clima_partidos_1 = obtener_prox_partido_clima_1()
print("Clima próximos partidos 1ª División:")
if isinstance(clima_partidos_1, str):
    print(clima_partidos_1)
else:
    for equipo, partidos in clima_partidos_1.items():
        for partido in partidos:
            if partido['Clima'] is not None:
                print(f"{partido['Local']:<20} vs {partido['Visitante']:<20} - Clima: {partido['Clima']:<35}, Temperatura: {partido['Temperatura']:<5}")
            else:
                print(f"{partido['Local']:<20} vs {partido['Visitante']:<20} - Clima: No disponible")

Clima próximos partidos 1ª División:
Athletic Club        vs Real Sociedad        - Clima: Cielo cubierto                     , Temperatura: 9°C  
Levante UD           vs Atlético de Madrid   - Clima: Soleado                            , Temperatura: 13°C 
CA Osasuna           vs Villarreal CF        - Clima: Lluvia dispersa cercana            , Temperatura: 7°C  
Getafe CF            vs Celta de Vigo        - Clima: Lluvia dispersa cercana            , Temperatura: 7°C  
RCD Espanyol         vs Deportivo Alavés     - Clima: Nublado                            , Temperatura: 11°C 
Elche CF             vs FC Barcelona         - Clima: Despejado                          , Temperatura: 11°C 
Elche CF             vs FC Barcelona         - Clima: Despejado                          , Temperatura: 11°C 
Getafe CF            vs Celta de Vigo        - Clima: Lluvia dispersa cercana            , Temperatura: 7°C  
Real Oviedo          vs Girona FC            - Clima: Soleado                      

In [28]:
# Comprobación detallada del código de obtención del clima del próximo partido
# Comprobamos con la Championship ya que ponen el clima con más antelación

url = 'https://www.football-weather.com/football-league/Championship'
equipos_con_clima = []

respuesta = requests.get(url, headers=cabeceras)
soup = BeautifulSoup(respuesta.content, 'html.parser')

bloques_partidos = soup.find_all('div', class_='accordion')
if not bloques_partidos:
     print(f'No se encontraron datos climatológicos de los siguientes partidos de la liga.')

# Diccionario simple de traducción de climas sin usar googletrans
clima_traduccion = {
    'sunny': 'Soleado',
    'cloudy': 'Nublado',
    'partly cloudy': 'Parcialmente nublado',
    'clear': 'Despejado',
    'rainy': 'Lluvioso',
    'rain': 'Lluvia',
    'snowy': 'Nevado',
    'windy': 'Ventoso'
}

for partido in bloques_partidos:
    equipos = partido.find('div', class_='col-md-4').text.strip()
    local = equipos.split(' vs. ')[0].strip()
    visitante = equipos.split(' vs. ')[1].strip()
    clima_web = partido.find('div', class_='col-sm-auto').text.strip()
    
    # Traducción simple sin API externa
    clima_temp = clima_web.strip().replace(' ', '').split('\n')[0]
    clima_desc = clima_web.strip().replace(' ', '').split('\n')[1].lower()
    clima = clima_traduccion.get(clima_desc, clima_desc.capitalize())  # Si no encuentra, usa el original

    print(f'Partido: {local} vs {visitante} - Clima: {clima} - Temperatura: {clima_temp}')

Partido: Bristol City vs Derby - Clima: Moderateorheavyraininareawiththunder - Temperatura: 7°C
Partido: Leicester vs Charlton - Clima: Patchyrainnearby - Temperatura: 7°C
Partido: Sheffield Wednesday vs Wrexham - Clima: Moderatesnow - Temperatura: -6°C
Partido: Stoke City vs Southampton - Clima: Mist - Temperatura: 5°C
Partido: Watford vs Swansea - Clima: Patchyrainnearby - Temperatura: 8°C
Partido: Ipswich vs Preston - Clima: Nublado - Temperatura: 8°C
Partido: Millwall vs Sheffield Utd - Clima: Patchyrainnearby - Temperatura: 9°C
Partido: Blackburn vs Hull City - Clima: Mist - Temperatura: 5°C
Partido: Middlesbrough vs Norwich - Clima: Patchyrainnearby - Temperatura: 6°C
Partido: QPR vs Coventry - Clima: Patchyrainnearby - Temperatura: 8°C
Partido: Oxford United vs Birmingham - Clima: Lightrainshower - Temperatura: 7°C
Partido: Portsmouth vs West Brom - Clima: Patchyrainnearby - Temperatura: 8°C


### DATAFRAMES, GRÁFICAS Y PREDICCIONES

In [29]:
import pandas as pd
import plotly.express as px
import numpy as np

#### CREACIÓN df_equipos, df_partidos_laliga, df_partidos_todos

##### 1º DIVISIÓN (aprox. 12min)

In [30]:
# PASO 0: CARGAR DATOS (Llamadas a funciones con protección)
print("Cargando datos desde las funciones de scraping...")

# Intentamos cargar, si falla devolvemos diccionarios vacíos para no romper el código
try: valores_mercado, valores_textuales = obtener_valores_mercado_1()
except: valores_mercado = {}

try: lesionados = obtener_lesionados_1()
except: lesionados = {}

try: estadios, ciudades = obtener_ciudades_estadios_1()
except: estadios, ciudades = ({}, {})

try: partidos_laliga = obtener_partidos_laliga_1()
except: partidos_laliga = {}

try: partidos_todos = obtener_partidos_todos_1()
except: partidos_todos = {}

print("Datos procesados. Generando DataFrames...")

# PASO 1: CREACIÓN DEL DATAFRAME DE EQUIPOS 
data_equipos = []

# Lista de equipos backup por si el scraping de valores falló
equipos_backup = ['Real Madrid', 'FC Barcelona', 'Atlético de Madrid', 'Sevilla FC', 'Real Betis', 
                  'Real Sociedad', 'Villarreal CF', 'Valencia CF', 'Athletic Club', 'CA Osasuna']

fuente_datos = valores_mercado.keys() if valores_mercado else equipos_backup

for equipo in fuente_datos:
    valor = valores_mercado.get(equipo, np.random.randint(50, 800) * 1000000) # Valor random si falta
    num_lesionados = lesionados.get(equipo, np.random.randint(0, 8))
    
    info_estadio = estadios.get(equipo, ('Estadio Genérico', 50000))
    nombre_estadio = info_estadio[0]
    capacidad = info_estadio[1]
    
    ciudad = ciudades.get(equipo, 'Ciudad Desconocida')
    
    data_equipos.append({
        'Equipo': equipo,
        'Valor_Mercado': valor,
        'Lesionados': num_lesionados,
        'Estadio': nombre_estadio,
        'Capacidad': capacidad,
        'Ciudad': ciudad
    })

df_equipos_1 = pd.DataFrame(data_equipos)


# PASO 2: CREACIÓN DEL DATAFRAME DE PARTIDOS DE LALIGA (CON CORRECCIÓN DE ERROR)
data_partidos_laliga = []

if partidos_laliga:
    # SI EL SCRAPING FUNCIONÓ
    for equipo, lista_partidos in partidos_laliga.items():
        for p in lista_partidos:
            data_partidos_laliga.append(p)
    df_partidos_laliga_1 = pd.DataFrame(data_partidos_laliga)
else:
    # SI EL SCRAPING FALLÓ: GENERAMOS DATOS DE EJEMPLO
    print("AVISO: El scraping de partidos falló o está vacío. Generando datos simulados para los gráficos.")
    equipos_sim = df_equipos_1['Equipo'].tolist() if not df_equipos_1.empty else equipos_backup
    
    for i in range(100): # Simulamos 100 partidos
        local = np.random.choice(equipos_sim)
        visitante = np.random.choice(equipos_sim)
        if local != visitante:
            data_partidos_laliga.append({
                'Local': local,
                'Visitante': visitante,
                'Goles_local': np.random.randint(0, 5),
                'Goles_visitante': np.random.randint(0, 4),
                'Fecha': '2023-01-01' # Fecha dummy
            })
    df_partidos_laliga_1 = pd.DataFrame(data_partidos_laliga)

# PASO 3: CREACIÓN DEL DATAFRAME DE TODOS LOS PARTIDOS (CON CORRECCIÓN DE ERROR)
data_partidos_todos = []

if partidos_todos:
    # SI EL SCRAPING FUNCIONÓ
    for equipo, lista_partidos in partidos_todos.items():
        for p in lista_partidos:
            data_partidos_todos.append(p)
    df_partidos_todos_1 = pd.DataFrame(data_partidos_todos)
else:
    # SI EL SCRAPING FALLÓ: GENERAMOS DATOS DE EJEMPLO
    print("AVISO: El scraping de partidos falló o está vacío. Generando datos simulados para los gráficos.")
    equipos_sim = df_equipos_1['Equipo'].tolist() if not df_equipos_1.empty else equipos_backup
    
    for _ in range(100): # Simulamos 100 partidos
        local = np.random.choice(equipos_sim)
        visitante = np.random.choice(equipos_sim)
        if local != visitante:
            data_partidos_todos.append({
                'Local': local,
                'Visitante': visitante,
                'Goles_local': np.random.randint(0, 5),
                'Goles_visitante': np.random.randint(0, 4),
                'Fecha': '2023-01-01' # Fecha dummy
            })
    df_partidos_todos_1 = pd.DataFrame(data_partidos_todos)

# LIMPIEZA Y PREPARACIÓN FINAL 
# Ahora seguro que existen las columnas, o porque vinieron del scraping o porque las simulamos
if not df_partidos_todos_1.empty and not df_partidos_laliga_1.empty:
    # Aseguramos que sean números
    df_partidos_laliga_1['Goles_local'] = pd.to_numeric(df_partidos_laliga_1['Goles_local'], errors='coerce').fillna(0)
    df_partidos_laliga_1['Goles_visitante'] = pd.to_numeric(df_partidos_laliga_1['Goles_visitante'], errors='coerce').fillna(0)

    df_partidos_todos_1['Goles_local'] = pd.to_numeric(df_partidos_todos_1['Goles_local'], errors='coerce').fillna(0)
    df_partidos_todos_1['Goles_visitante'] = pd.to_numeric(df_partidos_todos_1['Goles_visitante'], errors='coerce').fillna(0)
    
    # Creamos la columna calculada
    df_partidos_laliga_1['Total_goles_partido'] = df_partidos_laliga_1['Goles_local'] + df_partidos_laliga_1['Goles_visitante']
    df_partidos_todos_1['Total_goles_partido'] = df_partidos_todos_1['Goles_local'] + df_partidos_todos_1['Goles_visitante']
else:
    # Caso extremo: ni scraping ni simulación funcionaron
    df_partidos_laliga_1 = pd.DataFrame(columns=['Local', 'Visitante', 'Goles_local', 'Goles_visitante', 'Total_goles_partido'])
    df_partidos_todos_1 = pd.DataFrame(columns=['Local', 'Visitante', 'Goles_local', 'Goles_visitante', 'Total_goles_partido'])
print("-" * 30)
print(f"Dataframe Equipos (1º División): {df_equipos_1.shape} filas")
print(f"Dataframe Partidos de LaLiga (1º División): {df_partidos_laliga_1.shape} filas")
print(f"Dataframe Todos los Partidos (Equipos de 1º División): {df_partidos_todos_1.shape} filas")
print("-" * 30)

df_equipos_1.to_csv('df_equipos_1.csv', index=False)
df_partidos_laliga_1.to_csv('df_partidos_laliga_1.csv', index=False)
df_partidos_todos_1.to_csv('df_partidos_todos_1.csv', index=False)

df_equipos_1.head(5)

Cargando datos desde las funciones de scraping...
Datos procesados. Generando DataFrames...
------------------------------
Dataframe Equipos (1º División): (20, 6) filas
Dataframe Partidos de LaLiga (1º División): (418, 11) filas
Dataframe Todos los Partidos (Equipos de 1º División): (556, 11) filas
------------------------------


Unnamed: 0,Equipo,Valor_Mercado,Lesionados,Estadio,Capacidad,Ciudad
0,FC Barcelona,1110000000,3,Spotify Camp Nou,99354,Barcelona
1,Atlético de Madrid,526000000,2,Riyadh Air Metropolitano,70460,Madrid
2,Athletic Club,303000000,9,San Mamés,53289,Bilbao
3,Villarreal CF,255800000,7,La Cerámica,23500,Villarreal
4,Real Sociedad,245200000,6,Estadio de Anoeta,39313,San Sebastián


In [31]:
# Una vez creados los df, los podemos cargar directamente de los csv para que no tarde tanto
df_equipos_1 = pd.read_csv('df_equipos_1.csv')
df_partidos_laliga_1 = pd.read_csv('df_partidos_laliga_1.csv')
df_partidos_todos_1 = pd.read_csv('df_partidos_todos_1.csv')

##### 2º DIVISIÓN (aprox. 20min)

In [32]:
# PASO 0: CARGAR DATOS (Llamadas a funciones con protección)
print("Cargando datos desde las funciones de scraping...")

# Intentamos cargar, si falla devolvemos diccionarios vacíos para no romper el código
try: valores_mercado, valores_textuales = obtener_valores_mercado_2()
except: valores_mercado = {}

try: lesionados = obtener_lesionados_2()
except: lesionados = {}

try: estadios, ciudades = obtener_ciudades_estadios_2()
except: estadios, ciudades = ({}, {})

try: partidos_laliga = obtener_partidos_laliga_2()
except: partidos_laliga = {}

try: partidos_todos = obtener_partidos_todos_2()
except: partidos_todos = {}

print("Datos procesados. Generando DataFrames...")

# PASO 1: CREACIÓN DEL DATAFRAME DE EQUIPOS
data_equipos = []

# Lista de equipos backup por si el scraping de valores falló
equipos_backup = ['AD Ceuta FC', 'Albacete Balompié', 'Almería CF', 'Real Zaragoza', 'Granada CF']

fuente_datos = valores_mercado.keys() if valores_mercado else equipos_backup

for equipo in fuente_datos:
    valor = valores_mercado.get(equipo, np.random.randint(50, 800) * 1000000) # Valor random si falta
    num_lesionados = lesionados.get(equipo, np.random.randint(0, 8))
    
    info_estadio = estadios.get(equipo, ('Estadio Genérico', 50000))
    nombre_estadio = info_estadio[0]
    capacidad = info_estadio[1]
    
    ciudad = ciudades.get(equipo, 'Ciudad Desconocida')
    
    data_equipos.append({
        'Equipo': equipo,
        'Valor_Mercado': valor,
        'Lesionados': num_lesionados,
        'Estadio': nombre_estadio,
        'Capacidad': capacidad,
        'Ciudad': ciudad
    })

df_equipos_2 = pd.DataFrame(data_equipos)


# PASO 2: CREACIÓN DEL DATAFRAME DE PARTIDOS DE LALIGA (CON CORRECCIÓN DE ERROR)
data_partidos_laliga = []

if partidos_laliga:
    # SI EL SCRAPING FUNCIONÓ
    for equipo, lista_partidos in partidos_laliga.items():
        for p in lista_partidos:
            data_partidos_laliga.append(p)
    df_partidos_laliga_2 = pd.DataFrame(data_partidos_laliga)
else:
    # SI EL SCRAPING FALLÓ: GENERAMOS DATOS DE EJEMPLO
    print("AVISO: El scraping de partidos falló o está vacío. Generando datos simulados para los gráficos.")
    equipos_sim = df_equipos_2['Equipo'].tolist() if not df_equipos_2.empty else equipos_backup
    
    for _ in range(100): # Simulamos 100 partidos
        local = np.random.choice(equipos_sim)
        visitante = np.random.choice(equipos_sim)
        if local != visitante:
            data_partidos_laliga.append({
                'Local': local,
                'Visitante': visitante,
                'Goles_local': np.random.randint(0, 5),
                'Goles_visitante': np.random.randint(0, 4),
                'Fecha': '2023-01-01' # Fecha dummy
            })
    df_partidos_laliga_2 = pd.DataFrame(data_partidos_laliga)

# PASO 3: CREACIÓN DEL DATAFRAME DE TODOS LOS PARTIDOS (CON CORRECCIÓN DE ERROR)
data_partidos_todos = []

if partidos_todos:
    # SI EL SCRAPING FUNCIONÓ
    for equipo, lista_partidos in partidos_todos.items():
        for p in lista_partidos:
            data_partidos_todos.append(p)
    df_partidos_todos_2 = pd.DataFrame(data_partidos_todos)
else:
    # SI EL SCRAPING FALLÓ: GENERAMOS DATOS DE EJEMPLO
    print("AVISO: El scraping de partidos falló o está vacío. Generando datos simulados para los gráficos.")
    equipos_sim = df_equipos_2['Equipo'].tolist() if not df_equipos_2.empty else equipos_backup
    
    for _ in range(100): # Simulamos 100 partidos
        local = np.random.choice(equipos_sim)
        visitante = np.random.choice(equipos_sim)
        if local != visitante:
            data_partidos_todos.append({
                'Local': local,
                'Visitante': visitante,
                'Goles_local': np.random.randint(0, 5),
                'Goles_visitante': np.random.randint(0, 4),
                'Fecha': '2023-01-01' # Fecha dummy
            })
    df_partidos_todos_2 = pd.DataFrame(data_partidos_todos)

# LIMPIEZA Y PREPARACIÓN FINAL
# Ahora seguro que existen las columnas, o porque vinieron del scraping o porque las simulamos
if not df_partidos_todos_2.empty and not df_partidos_laliga_2.empty:
    # Aseguramos que sean números
    df_partidos_laliga_2['Goles_local'] = pd.to_numeric(df_partidos_laliga_2['Goles_local'], errors='coerce').fillna(0)
    df_partidos_laliga_2['Goles_visitante'] = pd.to_numeric(df_partidos_laliga_2['Goles_visitante'], errors='coerce').fillna(0)

    df_partidos_todos_2['Goles_local'] = pd.to_numeric(df_partidos_todos_2['Goles_local'], errors='coerce').fillna(0)
    df_partidos_todos_2['Goles_visitante'] = pd.to_numeric(df_partidos_todos_2['Goles_visitante'], errors='coerce').fillna(0)

    
    # Creamos la columna calculada
    df_partidos_laliga_2['Total_goles_partido'] = df_partidos_laliga_2['Goles_local'] + df_partidos_laliga_2['Goles_visitante']
    df_partidos_todos_2['Total_goles_partido'] = df_partidos_todos_2['Goles_local'] + df_partidos_todos_2['Goles_visitante']
else:
    # Caso extremo: ni scraping ni simulación funcionaron
    df_partidos_laliga_2 = pd.DataFrame(columns=['Local', 'Visitante', 'Goles_local', 'Goles_visitante', 'Total_goles_partido'])
    df_partidos_todos_2 = pd.DataFrame(columns=['Local', 'Visitante', 'Goles_local', 'Goles_visitante', 'Total_goles_partido'])
print("-" * 30)
print(f"Dataframe Equipos (2º División): {df_equipos_2.shape} filas")
print(f"Dataframe Partidos de LaLiga (2º División): {df_partidos_laliga_2.shape} filas")
print(f"Dataframe Todos los Partidos (Equipos 2º División): {df_partidos_todos_2.shape} filas")
print("-" * 30)

df_equipos_2.to_csv('df_equipos_2.csv', index=False)
df_partidos_laliga_2.to_csv('df_partidos_laliga_2.csv', index=False)
df_partidos_todos_2.to_csv('df_partidos_todos_2.csv', index=False)

df_equipos_2.head(5)

Cargando datos desde las funciones de scraping...
Datos procesados. Generando DataFrames...
------------------------------
Dataframe Equipos (2º División): (22, 6) filas
Dataframe Partidos de LaLiga (2º División): (506, 11) filas
Dataframe Todos los Partidos (Equipos 2º División): (558, 11) filas
------------------------------


Unnamed: 0,Equipo,Valor_Mercado,Lesionados,Estadio,Capacidad,Ciudad
0,UD Almería,45550000,0,UD Almería Stadium,18331,Almería
1,UD Las Palmas,44400000,0,Estadio de Gran Canaria,32400,Las Palmas de Gran Canaria
2,Cádiz CF,24800000,0,Nuevo Mirandilla,20724,Cádiz
3,CD Leganés,23900000,1,Ontime Butarque,13089,Leganés
4,Granada CF,21900000,1,Nuevo Los Cármenes,19336,Granada


In [33]:
# Una vez creados los df, los podemos cargar directamente de los csv para que no tarde tanto
df_equipos_2 = pd.read_csv('df_equipos_2.csv')
df_partidos_laliga_2 = pd.read_csv('df_partidos_laliga_2.csv')
df_partidos_todos_2 = pd.read_csv('df_partidos_todos_2.csv')

#### CREACIÓN df_proximos_partidos

##### 1º DIVISIÓN

In [34]:
print("Cargando datos desde las funciones de scraping...")

try: proximos_partidos = obtener_prox_partido_clima_1()
except: proximos_partidos = {}

data_proximos_partidos = []

if proximos_partidos:
    # SI EL SCRAPING FUNCIONÓ
    for equipo, lista_partidos in proximos_partidos.items():
        for p in lista_partidos:
            data_proximos_partidos.append(p)
    df_proximos_partidos_1 = pd.DataFrame(data_proximos_partidos)
else:
    # SI EL SCRAPING FALLÓ: GENERAMOS DATOS DE EJEMPLO
    print("AVISO: El scraping de partidos falló o está vacío.")


print("-" * 30)
print(f"Dataframe Proximos Partidos: {df_proximos_partidos_1.shape} filas")

df_proximos_partidos_1.to_csv('df_proximos_partidos_1.csv', index=False)

df_proximos_partidos_1.head(5)

Cargando datos desde las funciones de scraping...
------------------------------
Dataframe Proximos Partidos: (20, 10) filas


Unnamed: 0,Fecha,Hora,Competicion,Local,Visitante,Estadio,Ciudad,En_casa,Clima,Temperatura
0,DOM 01.02.2026,21:00,LALIGA EA SPORTS,Athletic Club,Real Sociedad,"(San Mamés, 53289)",Bilbao,True,Cielo cubierto,9°C
1,SAB 31.01.2026,18:30,LALIGA EA SPORTS,Levante UD,Atlético de Madrid,"(Ciudad de Valencia, 26354)",Valencia,False,Soleado,13°C
2,SÁB 31.01.2026,16:15,LALIGA EA SPORTS,CA Osasuna,Villarreal CF,"(El Sadar, 23576)",Pamplona,True,Lluvia dispersa cercana,7°C
3,DOM 01.02.2026,18:30,LALIGA EA SPORTS,Getafe CF,Celta de Vigo,"(Coliseum, 16500)",Getafe,False,Lluvia dispersa cercana,7°C
4,VIE 30.01.2026,21:00,LALIGA EA SPORTS,RCD Espanyol,Deportivo Alavés,"(RCDE Stadium, 40000)",Cornellá de Llobregat,False,Nublado,11°C


In [35]:
# Una vez creados los df, los podemos cargar directamente de los csv para que no tarde tanto
df_proximos_partidos_1 = pd.read_csv('df_proximos_partidos_1.csv')

##### 2º DIVISIÓN

In [36]:
print("Cargando datos desde las funciones de scraping...")

try: proximos_partidos = obtener_proximo_partido_laliga_2()
except: proximos_partidos = {}

data_proximos_partidos = []

if proximos_partidos:
    # SI EL SCRAPING FUNCIONÓ
    for equipo, lista_partidos in proximos_partidos.items():
        for p in lista_partidos:
            data_proximos_partidos.append(p)
    df_proximos_partidos_2 = pd.DataFrame(data_proximos_partidos)
else:
    # SI EL SCRAPING FALLÓ: GENERAMOS DATOS DE EJEMPLO
    print("AVISO: El scraping de partidos falló o está vacío.")


print("-" * 30)
print(f"Dataframe Proximos Partidos: {df_proximos_partidos_2.shape} filas")

df_proximos_partidos_2.to_csv('df_proximos_partidos_2.csv', index=False)

df_proximos_partidos_2.head(5)

Cargando datos desde las funciones de scraping...
------------------------------
Dataframe Proximos Partidos: (22, 8) filas


Unnamed: 0,Fecha,Hora,Competicion,Local,Visitante,Estadio,Ciudad,En_casa
0,DOM 01.02.2026,14:00,LALIGA HYPERMOTION,UD Almería,AD Ceuta FC,"(UD Almería Stadium, 18331)",Almería,False
1,SAB 31.01.2026,16:15,LALIGA HYPERMOTION,Albacete BP,Real Zaragoza,"(Carlos Belmonte, 18000)",Albacete,True
2,SAB 31.01.2026,16:15,LALIGA HYPERMOTION,Burgos CF,CD Leganés,"(El Plantío, 12194)",Burgos,True
3,DOM 01.02.2026,18:30,LALIGA HYPERMOTION,SD Huesca,Cádiz CF,"(El Alcoraz, 9128)",Huesca,False
4,DOM 01.02.2026,18:30,LALIGA HYPERMOTION,CD Castellón,FC Andorra,"(Skyfi Castalia, 15500)",Castellón de la Plana,True


In [37]:
# Una vez creados los df, los podemos cargar directamente de los csv para que no tarde tanto
df_proximos_partidos_2 = pd.read_csv('df_proximos_partidos_2.csv')

#### CREACIÓN df_clasificacion y df_completo

##### 1º DIVISIÓN

In [38]:
# 1. Llamamos a la función de clasificación
diccionario_clasif = obtener_clasificacion_1()

# 2. Convertimos el diccionario a DataFrame
# orient='index' es clave porque las claves son los nombres de los equipos
df_clasificacion_1 = pd.DataFrame.from_dict(diccionario_clasif, orient='index')

# 3. Limpieza básica
df_clasificacion_1 = df_clasificacion_1.reset_index() # Sacamos el equipo del índice
df_clasificacion_1 = df_clasificacion_1.rename(columns={'index': 'Equipo'})

# 4. Unimos la clasificación con los datos económicos/estadios (df_equipos_laliga)
# Esto crea una tabla con todo junto
df_completo_1 = pd.merge(df_clasificacion_1, df_equipos_1, on='Equipo', how='inner')

# Calculamos métricas extra para los gráficos
# Coste por punto: Cuánto valor de mercado cuesta cada punto conseguido
df_completo_1['Valor_Por_Punto'] = df_completo_1['Valor_Mercado'] / df_completo_1['Puntos']
# Eficiencia de gol: Goles marcados por partido
df_completo_1['Goles_Por_Partido'] = df_completo_1['Goles_favor'] / df_completo_1['Partidos_jugados']

print("DataFrame de Clasificación y DataFrame Completo creados.")

df_clasificacion_1.to_csv('df_clasificacion_1.csv', index=False)
df_completo_1.to_csv('df_completo_1.csv', index=False)

display(df_completo_1.head(3))

DataFrame de Clasificación y DataFrame Completo creados.


Unnamed: 0,Equipo,Posicion,Puntos,Partidos_jugados,Partidos_ganados,Partidos_empatados,Partidos_perdidos,Goles_favor,Goles_contra,Diferencia_goles,Valor_Mercado,Lesionados,Estadio,Capacidad,Ciudad,Valor_Por_Punto,Goles_Por_Partido
0,FC Barcelona,1º,52,21,17,1,3,57,22,35,1110000000,3,Spotify Camp Nou,99354,Barcelona,21346150.0,2.714286
1,Real Madrid,2º,51,21,16,3,2,45,17,28,1350000000,4,Santiago Bernabéu,83088,Madrid,26470590.0,2.142857
2,Atlético de Madrid,3º,44,21,13,5,3,38,17,21,526000000,2,Riyadh Air Metropolitano,70460,Madrid,11954550.0,1.809524


In [39]:
# Una vez creados los df, los podemos cargar directamente de los csv para que no tarde tanto
df_clasificacion_1 = pd.read_csv('df_clasificacion_1.csv')
df_completo_1 = pd.read_csv('df_completo_1.csv')

##### 2º DIVISIÓN

In [40]:
# 1. Llamamos a la función de clasificación
diccionario_clasif = obtener_clasificacion_2()

# 2. Convertimos el diccionario a DataFrame
# orient='index' es clave porque las claves son los nombres de los equipos
df_clasificacion_2 = pd.DataFrame.from_dict(diccionario_clasif, orient='index')

# 3. Limpieza básica
df_clasificacion_2 = df_clasificacion_2.reset_index() # Sacamos el equipo del índice
df_clasificacion_2 = df_clasificacion_2.rename(columns={'index': 'Equipo'})

# 4.Unimos la clasificación con los datos económicos/estadios (df_equipos_laliga)
# Esto crea una tabla con todo junto
df_completo_2 = pd.merge(df_clasificacion_2, df_equipos_2, on='Equipo', how='inner')

# Calculamos métricas extra para los gráficos
# Coste por punto: Cuánto valor de mercado cuesta cada punto conseguido
df_completo_2['Valor_Por_Punto'] = df_completo_2['Valor_Mercado'] / df_completo_2['Puntos']
# Eficiencia de gol: Goles marcados por partido
df_completo_2['Goles_Por_Partido'] = df_completo_2['Goles_favor'] / df_completo_2['Partidos_jugados']

print("✅ DataFrame de Clasificación y DataFrame Completo creados.")

df_clasificacion_2.to_csv('df_clasificacion_2.csv', index=False)
df_completo_2.to_csv('df_completo_2.csv', index=False)

display(df_completo_2.head(3))

✅ DataFrame de Clasificación y DataFrame Completo creados.


Unnamed: 0,Equipo,Posicion,Puntos,Partidos_jugados,Partidos_ganados,Partidos_empatados,Partidos_perdidos,Goles_favor,Goles_contra,Diferencia_goles,Valor_Mercado,Lesionados,Estadio,Capacidad,Ciudad,Valor_Por_Punto,Goles_Por_Partido
0,Racing de Santander,1º,44,23,13,5,5,50,32,18,47730000,0,El Sardinero,21514,Santander,1084773.0,2.173913
1,CD Castellón,2º,39,23,11,6,6,36,25,11,17200000,0,Skyfi Castalia,15500,Castellón de la Plana,441025.6,1.565217
2,Málaga CF,3º,38,23,11,5,7,35,26,9,17600000,0,La Rosaleda,30044,Málaga,463157.9,1.521739


In [41]:
# Una vez creados los df, los podemos cargar directamente de los csv para que no tarde tanto
df_clasificacion_2 = pd.read_csv('df_clasificacion_2.csv')
df_completo_2 = pd.read_csv('df_completo_2.csv')

#### Bloque A: Económico y Estructural (Barras y Jerarquías)

1. Gráfico de Barras Básico (Valor de Mercado) Para ver quién es el más rico.

In [42]:
fig1 = px.bar(df_equipos_1.sort_values('Valor_Mercado', ascending=False), 
             x='Equipo', 
             y='Valor_Mercado',
             color='Valor_Mercado', # Colorear según el valor
             title='Ranking de Valor de Mercado por Equipo',
             labels={'Valor_Mercado': 'Valor (€)'},
             template='plotly_white')
fig1.show()

2. Treemap (Jerarquía Ciudad -> Equipo -> Valor) Para ver el dominio económico por ciudades.

In [43]:
fig2 = px.treemap(df_equipos_1, 
                 path=['Ciudad', 'Equipo'], # Jerarquía
                 values='Valor_Mercado',
                 color='Valor_Mercado',
                 title='Mapa de Valor de Mercado por Ciudad y Equipo')
fig2.show()

3. Gráfico de Barras Horizontal (Capacidad de Estadios) Mejor horizontal para leer bien los nombres de los estadios.

In [44]:
fig3 = px.bar(df_equipos_1.sort_values('Capacidad'), 
             x='Capacidad', 
             y='Estadio',
             color='Equipo',
             orientation='h', # Barras horizontales
             text='Capacidad', # Poner el número en la barra
             title='Capacidad de los Estadios de LaLiga')
fig3.show()

4. Gráfico Circular (Donut Chart) de Lesionados Porcentaje de lesionados que aporta cada equipo al total

In [45]:
fig4 = px.pie(df_equipos_1, 
             values='Lesionados', 
             names='Equipo', 
             hole=0.4, # Hace que sea un donut
             title='Distribución de Lesionados por Equipo')
fig4.update_traces(textposition='inside', textinfo='percent+label')
fig4.show()

5. Funnel Chart (Embudo) del Top 5 Valor Visualización alternativa para rankings

In [46]:
top_5_ricos = df_equipos_1.sort_values('Valor_Mercado', ascending=False).head(5)
fig5 = px.funnel(top_5_ricos, 
                x='Valor_Mercado', 
                y='Equipo',
                title='Top 5 Equipos con mayor Valor de Mercado')
fig5.show()

#### Bloque B: Correlaciones (Scatter y Bubble)

6. Scatter Plot (Valor vs Capacidad) ¿Los equipos con estadios más grandes valen más dinero?

In [47]:
fig6 = px.scatter(df_equipos_1, 
                 x='Capacidad', 
                 y='Valor_Mercado',
                 color='Ciudad', # Agrupar por ciudad
                 size='Valor_Mercado', # Tamaño de la burbuja
                 hover_name='Equipo', # Texto al pasar el ratón
                 title='Relación: Capacidad del Estadio vs Valor de Mercado')
fig6.show()

7. Bubble Chart (Valor vs Lesionados) ¿El dinero protege de las lesiones?

In [48]:
fig7 = px.scatter(df_equipos_1, 
                 x='Valor_Mercado', 
                 y='Lesionados',
                 size='Capacidad', # El tamaño es el estadio
                 color='Equipo',
                 title='Análisis: Valor de Mercado vs Número de Lesionados')
fig7.show()

#### Bloque C: Estadísticas y Distribuciones

8. Histograma (Distribución de Capacidad) ¿Cuál es el tamaño "estándar" de un estadio en España?

In [49]:
fig8 = px.histogram(df_equipos_1, 
                   x='Capacidad', 
                   nbins=10, 
                   title='Distribución del Tamaño de los Estadios',
                   marginal='box') # Añade un boxplot arriba
fig8.show()

9. Box Plot (Goles Locales vs Visitantes) Usamos el DF de partidos. ¿Se marcan más goles en casa?

In [50]:
# Reestructuramos un poco para poder comparar en un solo boxplot
df_goles = df_partidos_laliga_1[['Goles_local', 'Goles_visitante']].melt(var_name='Condicion', value_name='Goles')

fig9 = px.box(df_goles, 
             x='Condicion', 
             y='Goles', 
             color='Condicion',
             points='all', # Muestra todos los puntos además de la caja
             title='Distribución de Goles: Local vs Visitante')
fig9.show()

10. Violin Plot (Valor de Mercado) Similar al Box Plot pero muestra la densidad de los datos

In [51]:
fig10 = px.violin(df_equipos_1, 
                y='Valor_Mercado', 
                box=True, # Dibuja la caja dentro del violín
                points='all',
                title='Densidad de los Valores de Mercado en LaLiga')
fig10.show()

11. ECDF (Distribución Acumulada) ¿Qué porcentaje de estadios tiene menos de X capacidad?

In [52]:
fig11 = px.ecdf(df_equipos_1, 
              x="Capacidad", 
              title="Probabilidad Acumulada: Capacidad de Estadios")
fig11.show()

#### Bloque D: Análisis de Partidos (Usando df_partidos)

12. Gráfico de Líneas (Goles por Partido) Evolución de goles en los partidos registrados (ordenados por fecha si la tienes, o por índice).

In [53]:
# Usamos el índice como 'tiempo' si no hay fecha parseada
fig12 = px.line(df_partidos_laliga_1.reset_index(), 
              x='index', 
              y='Total_goles_partido', 
              title='Evolución de Goles Totales por Partido (Secuencia)',
              labels={'index': 'Número de Partido', 'Total_goles_partido': 'Goles'})
fig12.show()

13. Matriz de Dispersión (SPLOM) Compara todas las variables numéricas de los equipos entre sí.

In [54]:
fig13 = px.scatter_matrix(df_equipos_1,
    dimensions=["Valor_Mercado", "Capacidad", "Lesionados"],
    color="Ciudad",
    title="Matriz de Dispersión: Relación entre variables")
fig13.show()

14. Heatmap de Densidad (Goles Local vs Visitante) ¿Cuál es el resultado más común? (Donde haya más color)

In [55]:
fig14 = px.density_heatmap(df_partidos_laliga_1, 
                         x="Goles_local", 
                         y="Goles_visitante", 
                         text_auto=True,
                         title="Mapa de Calor: Frecuencia de Resultados")
fig14.show()

15. Gráfico de Barras Apiladas (Goles a favor en casa) Goles marcados por cada equipo cuando juega de local

In [56]:
# Agrupamos goles por equipo local
goles_por_equipo = df_partidos_laliga_1.groupby('Local')['Goles_local'].sum().reset_index()

fig15 = px.bar(goles_por_equipo.sort_values('Goles_local'), 
             x='Local', 
             y='Goles_local',
             title='Total de Goles Marcados como Local',
             color='Goles_local',
             color_continuous_scale='Viridis')
fig15.show()

#### Bloque E: Gráficos Avanzados y Especiales

16. Sunburst Chart (Jerarquía Completa) Ciudad -> Equipo -> Capacidad del estadio

In [57]:
fig16 = px.sunburst(df_equipos_1, 
                  path=['Ciudad', 'Equipo'], 
                  values='Capacidad',
                  title='Sunburst: Capacidad por Ciudad y Equipo')
fig16.show()

17. Radar Chart (Line Polar) Comparativa normalizada (0 a 1) de 3 variables para los Top 3 equipos.

In [58]:
# Normalizamos datos para que el radar se vea bien
df_norm = df_equipos_1.copy()
cols = ['Valor_Mercado', 'Capacidad', 'Lesionados']
for col in cols:
    df_norm[col] = df_norm[col] / df_norm[col].max()

# Filtramos solo 3 equipos para que no sea un lío
df_radar = df_norm[df_norm['Equipo'].isin(['Real Madrid', 'FC Barcelona', 'Atlético de Madrid'])]
df_radar = df_radar.melt(id_vars='Equipo', value_vars=cols)

fig17 = px.line_polar(df_radar, r='value', theta='variable', line_close=True,
                    color='Equipo',
                    title='Comparativa Relativa (Top 3 Equipos)')
fig17.show()

18. Gráfico de Puntos con Etiquetas (Dot Plot) Alternativa limpia a las barras para comparar valores.

In [59]:
fig18 = px.scatter(df_equipos_1.sort_values('Valor_Mercado'), 
                 x="Valor_Mercado", 
                 y="Equipo", 
                 color="Lesionados",
                 size="Lesionados",
                 title="Dot Plot: Valor de Mercado (Color/Tamaño = Lesionados)")
fig18.update_traces(marker=dict(line=dict(width=1, color='DarkSlateGrey')))
fig18.show()

19. Strip Plot (Distribución 1D) Para ver la distribución de valores de mercado por Ciudad.

In [60]:
fig19 = px.strip(df_equipos_1, 
               x="Valor_Mercado", 
               y="Ciudad", 
               orientation="h", 
               color="Equipo",
               title="Distribución de Valor de Mercado por Ciudad")
fig19.show()

20. Gráfico 3D (Scatter 3D) ¡La joya de la corona! Relaciona 3 variables en un cubo rotativo.

In [61]:
fig20 = px.scatter_3d(df_equipos_1, 
                    x='Valor_Mercado', 
                    y='Capacidad', 
                    z='Lesionados',
                    color='Equipo',
                    size='Valor_Mercado',
                    hover_name='Equipo',
                    title='Análisis 3D: Dinero, Estadio y Lesiones')
fig20.show()

#### Bloque F: Análisis de clasificación y rendimiento

21. La Clasificación de LaLiga (puntos)

In [62]:
fig21 = px.bar(df_completo_1.sort_values('Puntos', ascending=True), 
               x='Puntos', y='Equipo', orientation='h',
               text='Puntos', color='Puntos',
               color_continuous_scale='Viridis',
               title='21. Clasificación Actual (Puntos)')
fig21.show()

22. Eficiencia Económica: Puntos vs Valor de Mercado. ¿El dinero compra puntos? (Línea de tendencia incluida)

In [63]:
fig22 = px.scatter(df_completo_1, x='Valor_Mercado', y='Puntos',
                   color='Equipo', size='Partidos_ganados',
                   trendline='ols', # Línea de tendencia estadística
                   hover_data=['Posicion'],
                   title='22. Relación: Dinero (Valor Mercado) vs Éxito (Puntos)')
fig22.show()

23. Desglose de Resultados (Ganados, Empatados, Perdidos)

In [64]:
# Requerimos 'melt' para apilar las barras
df_resultados = df_completo_1.melt(id_vars='Equipo', 
                                 value_vars=['Partidos_ganados', 'Partidos_empatados', 'Partidos_perdidos'],
                                 var_name='Resultado', value_name='Cantidad')

# Mapeo de colores representativos
color_map = {
    'Partidos_ganados': '#2ecc71',      # Verde
    'Partidos_empatados': '#3498db',    # Azul
    'Partidos_perdidos': '#e74c3c'      # Rojo
}

fig23 = px.bar(df_resultados, x='Equipo', y='Cantidad', color='Resultado',
               color_discrete_map=color_map,
               title='23. Perfil de Resultados por Equipo',
               category_orders={'Equipo': df_completo_1.sort_values('Puntos', ascending=False)['Equipo']})
fig23.show()

24. Potencia Ofensiva vs Defensiva (Scatter)

In [65]:
# Cuadrante superior derecho = Marcan mucho y encajan poco
fig24 = px.scatter(df_completo_1, x='Goles_favor', y='Goles_contra',
                   color='Puntos', text='Equipo',
                   title='24. Ofensiva vs Defensiva (Goles a Favor vs Contra)')
fig24.update_traces(textposition='top center')
fig24.add_shape(type="line", x0=0, y0=0, x1=df_completo_1['Goles_favor'].max(), y1=df_completo_1['Goles_favor'].max(),
                line=dict(color="Gray", dash="dashdot")) # Línea de equilibrio
fig24.show()

25. Diferencia de Goles (Barras Divergentes)

In [66]:
fig25 = px.bar(df_completo_1.sort_values('Diferencia_goles'), 
               x='Diferencia_goles', y='Equipo', orientation='h',
               color='Diferencia_goles',
               color_continuous_scale='RdBu', # Rojo negativo, Azul positivo
               title='25. Balance de Goles (Diferencia Goles)')
fig25.show()

26. Impacto de las Lesiones en la Clasificación

In [67]:
fig26 = px.scatter(df_completo_1, x='Lesionados', y='Puntos',
                   size='Valor_Mercado', color='Equipo',
                   title='26. ¿Afectan las lesiones a los puntos conseguidos?')
fig26.show()

27. Factor Cancha: Puntos vs Capacidad del Estadio

In [68]:
fig27 = px.scatter(df_completo_1, x='Capacidad', y='Puntos',
                   color='Ciudad', size='Puntos',
                   hover_name='Estadio',
                   title='27. Puntos vs Capacidad del Estadio (Factor Grada)')
fig27.show()

28. Eficiencia de Mercado (Embudo Inverso). Quién paga MENOS euros de valor de mercado por cada punto conseguido (Equipos revelación)

In [69]:
df_eficiencia = df_completo_1.sort_values('Valor_Por_Punto')
fig28 = px.bar(df_eficiencia.head(10), x='Equipo', y='Valor_Por_Punto',
               color='Valor_Por_Punto',
               title='28. Top 10 Equipos más Eficientes (Menor Coste de Plantilla por Punto)')
fig28.show()

29. Radar Chart: Perfil del Top 3 (o Líder vs. Colista)

In [70]:
# Normalizamos datos para comparar
cols_radar = ['Puntos', 'Goles_favor', 'Partidos_ganados', 'Valor_Mercado', 'Capacidad']
df_norm = df_completo_1.copy()
for col in cols_radar:
    df_norm[col] = df_norm[col] / df_norm[col].max() # Escala 0 a 1

# Filtramos Top 3
top3_equipos = df_completo_1.sort_values('Puntos', ascending=False).head(3)['Equipo'].tolist()
df_radar = df_norm[df_norm['Equipo'].isin(top3_equipos)].melt(id_vars='Equipo', value_vars=cols_radar)

fig29 = px.line_polar(df_radar, r='value', theta='variable', line_close=True,
                      color='Equipo',
                      title='29. Comparativa Multimétrica del Top 3')
fig29.show()

30. Mapa de Puntos Geográfico (Treemap por Ciudad)

In [71]:
fig30 = px.treemap(df_completo_1, path=['Ciudad', 'Equipo'], values='Puntos',
                   color='Puntos',
                   title='30. Dominio Geográfico de LaLiga (Puntos por Ciudad)')
fig30.show()

#### PREDICCIÓN DE UN PARTIDO (1º o 2º)

In [72]:
# Utilizaremos el dataframe de próximos partidos limpiado previamente con openrefine
df_proximos_partidos_1_openrefine = pd.read_csv('df_proximos_partidos_1_openrefine.csv')
df_proximos_partidos_2_openrefine = pd.read_csv('df_proximos_partidos_2_openrefine.csv')

In [73]:
import numpy as np
import pandas as pd
import warnings

def calcular_racha_detallada(equipo, df_partidos):
    """
    Calcula racha con LIMPIEZA AGRESIVA de duplicados.
    Normaliza fechas y nombres antes de filtrar para asegurar que borra los repetidos reales.
    """
    # 1. Filtramos partidos del equipo
    df_equipo = df_partidos[
        (df_partidos['Local'] == equipo) | 
        (df_partidos['Visitante'] == equipo)
    ].copy()
    
    # LIMPIEZA DE DATOS PREVIA AL FILTRADO
    
    # A) Normalizamos Nombres (Minúsculas y sin espacios extra)
    # Esto hace que "Girona" sea igual a "girona "
    df_equipo['Local_temp'] = df_equipo['Local'].astype(str).str.lower().str.strip()
    df_equipo['Visitante_temp'] = df_equipo['Visitante'].astype(str).str.lower().str.strip()
    
    # B) Normalizamos Fecha (Extraemos solo dd.mm.yyyy)
    # Esto hace que "Sáb 20.01.2024" sea igual a "20.01.2024"
    if 'Fecha' in df_equipo.columns:
        df_equipo['Fecha_temp'] = df_equipo['Fecha'].astype(str).str.extract(r'(\d{2}\.\d{2}\.\d{4})')
    else:
        df_equipo['Fecha_temp'] = "sin_fecha"

    # BORRADO DE DUPLICADOS
    # Usamos las columnas normalizadas (_temp) como criterio
    df_equipo = df_equipo.drop_duplicates(subset=['Fecha_temp', 'Local_temp', 'Visitante_temp'], keep='first')
    
    # 2. CONVERSIÓN DE FECHA REAL
    # Usamos la fecha limpia que acabamos de crear
    if 'Fecha_temp' in df_equipo.columns:
        df_equipo['Fecha_dt'] = pd.to_datetime(df_equipo['Fecha_temp'], format='%d.%m.%Y', errors='coerce')
        df_equipo = df_equipo.dropna(subset=['Fecha_dt'])
        df_equipo = df_equipo.sort_values('Fecha_dt', ascending=False)
    else:
        df_equipo = df_equipo.sort_index(ascending=False)

    # 3. Cogemos los 5 más recientes (ya limpios y únicos)
    partidos_recientes = df_equipo.head(5)
    
    puntos = 0
    historial_letras = [] 
    rivales = [] 
    
    if partidos_recientes.empty:
        return 0, 1.0, "Sin datos", ""

    for _, partido in partidos_recientes.iterrows():
        try:
            g_loc = float(partido['Goles_local'])
            g_vis = float(partido['Goles_visitante'])
        except ValueError:
            continue
            
        if partido['Local'] == equipo:
            favor, contra = g_loc, g_vis
            rival = partido['Visitante']
        else:
            favor, contra = g_vis, g_loc
            rival = partido['Local']
            
        if favor > contra:
            puntos += 3
            historial_letras.append("G")
        elif favor == contra:
            puntos += 1
            historial_letras.append("E")
        else:
            historial_letras.append("P")
            
        fecha_str = partido['Fecha_dt'].strftime('%d/%m') if 'Fecha_dt' in partido else ""
        rivales.append(f"vs {rival} ({fecha_str})")
            
    # 4. Invertir para display
    texto_racha = "-".join(reversed(historial_letras))
    texto_rivales = " | ".join(reversed(rivales))
    
    # 5. Cálculo del factor de forma
    # Fórmula: 0.90 + (puntos obtenidos en últimos 5 partidos / 15) * 0.25
    # Explicación: Mínimo 0.90 (0 puntos), máximo 1.15 (15 puntos). Sólo varía un 25%.
    factor_forma = 0.90 + (puntos / 15) * 0.25
    
    return puntos, factor_forma, texto_racha, texto_rivales

def obtener_posicion(equipo, df_clasificacion):
    fila = df_clasificacion[df_clasificacion['Equipo'] == equipo]
    if fila.empty: 
        return 10 # Valor por defecto si no se encuentra
    if 'Pos' in df_clasificacion.columns: 
        pos = fila['Pos'].values[0]
        pos = pos.replace('º', '').replace('ª', '') # Limpieza
        return int(pos)
    elif 'Posicion' in df_clasificacion.columns: 
        pos = fila['Posicion'].values[0]
        pos = str(pos).replace('º', '').replace('ª', '') # Limpieza
        return int(pos)
    else: 
        return df_clasificacion.index.get_loc(fila.index[0]) + 1

def predecir_resultado_final(equipo_local, equipo_visitante, df_completo, df_partidos, df_clasificacion):
    
    # 1. VALIDACIÓN
    equipos_validos = df_completo['Equipo'].unique().tolist()
    if equipo_local not in equipos_validos or equipo_visitante not in equipos_validos:
        print(f"Error: Revisa los nombres. Disponibles: {sorted(equipos_validos)}")
        return None

    # 2. EXTRACCIÓN DE DATOS
    dl = df_completo[df_completo['Equipo'] == equipo_local]
    dv = df_completo[df_completo['Equipo'] == equipo_visitante]
    
    valor_real_l = dl['Valor_Mercado'].iloc[0]
    valor_real_v = dv['Valor_Mercado'].iloc[0]
    puntos_liga_l = dl['Puntos'].iloc[0]
    puntos_liga_v = dv['Puntos'].iloc[0]
    les_l = dl['Lesionados'].iloc[0]
    les_v = dv['Lesionados'].iloc[0]
    
    val_l_log = np.log(valor_real_l) 
    val_v_log = np.log(valor_real_v)
    
    puntos_racha_l, factor_forma_l, txt_racha_l, txt_rivales_l = calcular_racha_detallada(equipo_local, df_partidos)
    puntos_racha_v, factor_forma_v, txt_racha_v, txt_rivales_v = calcular_racha_detallada(equipo_visitante, df_partidos)
    
    pos_l = obtener_posicion(equipo_local, df_clasificacion)
    pos_v = obtener_posicion(equipo_visitante, df_clasificacion)

    # 3. ESTADÍSTICAS DE GOLES
    # Partidos jugados
    pj_l = dl['Partidos_jugados'].iloc[0]
    pj_v = dv['Partidos_jugados'].iloc[0]
    
    # Medias de goles
    media_gf_l = dl['Goles_favor'].iloc[0] / pj_l
    media_gc_l = dl['Goles_contra'].iloc[0] / pj_l
    media_gf_v = dv['Goles_favor'].iloc[0] / pj_v
    media_gc_v = dv['Goles_contra'].iloc[0] / pj_v
    
    # 4. CÁLCULO DE PREDICCIÓN (LÓGICA RAZONADA)
    # Base xG antes de ajustes
    # Cálculo: media de las medias goles a favor propio + medias goles en contra rival
    xg_base_local = (media_gf_l + media_gc_v) / 2
    xg_base_visita = (media_gf_v + media_gc_l) / 2
    
    # Ajustes Contextuales
    # A. Valor Mercado
    # Si hay una diferencia muy grande, se ajusta a favor del más caro
    if valor_real_l > valor_real_v * 2: 
        xg_base_local *= 1.15
        xg_base_visita *= 0.90
    elif valor_real_v > valor_real_l * 2:
        xg_base_local *= 0.90
        xg_base_visita *= 1.15
        
    # B. Forma y Campo
    # Local tiene ventaja de campo
    xg_base_local *= (factor_forma_l * 1.20)
    xg_base_visita *= (factor_forma_v * 0.85)
    
    # C. Lesiones
    # Penaliza un 2% por cada baja confirmada
    xg_base_local *= (1 - (les_l * 0.02))
    xg_base_visita *= (1 - (les_v * 0.02))

    # 5. RESULTADO FINAL
    # Cálculo de probabilidades
    # Fórmula ponderada: (xG * 100) + (puntos de liga * 0.5)
    pi_local = xg_base_local * 100 + (puntos_liga_l * 0.5)
    pi_visita = xg_base_visita * 100 + (puntos_liga_v * 0.5)
    
    total = pi_local + pi_visita
    # La probabilidad en porcentaje
    prob_local = (pi_local / total) * 100
    prob_visita = (pi_visita / total) * 100
    
    # Ajuste de probabilidad de empate según diferencia
    diferencia = abs(prob_local - prob_visita)
    prob_empate = 25 if diferencia < 10 else (15 if diferencia < 20 else 5)
    
    prob_local -= prob_empate/2
    prob_visita -= prob_empate/2
    
    # Redondeo de goles finales
    goles_l_final = int(xg_base_local)
    goles_v_final = int(xg_base_visita)
    
    dec_l = xg_base_local - goles_l_final
    dec_v = xg_base_visita - goles_v_final
    
    # Si la parte decimal es alta o la probabilidad de victoria es alta, sumamos un gol más
    if dec_l > 0.55 or (dec_l > 0.40 and prob_local > 50): goles_l_final += 1
    if dec_v > 0.55 or (dec_v > 0.40 and prob_visita > 50): goles_v_final += 1
    
    # 3. BLOQUE DE COHERENCIA INTELIGENTE (+1 o -1)
    # Verificamos si hay contradicción fuerte entre Probabilidad y Goles
    # Umbral: Diferencia de probabilidad > 10%
    
    # CASO A: Favorito LOCAL pero marcador dice Empate/Derrota
    if prob_local > (prob_visita + 10) and goles_l_final <= goles_v_final:
        # ¿Qué es más probable? ¿Que el Local marque otro o que el Visitante no marque?
        
        # Si el visitante tenía muy pocos méritos (ej: xG 0.65 -> redondeado a 1)
        # es más justo RESTARLE el gol (1-0) que sumar al local (2-1).
        if dec_v < 0.70 and goles_v_final > 0:
            goles_v_final -= 1 # La defensa local anula el gol visitante
        else:
            goles_l_final += 1 # El ataque local fuerza un gol extra
            
    # CASO B: Favorito VISITANTE pero marcador dice Empate/Derrota
    elif prob_visita > (prob_local + 10) and goles_v_final <= goles_l_final:
        
        # Si el local tenía poco xG (ej: 0.65 -> 1), se lo quitamos
        if dec_l < 0.70 and goles_l_final > 0:
            goles_l_final -= 1 # La defensa visitante deja a cero al local
        else:
            goles_v_final += 1 # El ataque visitante marca uno más

    # Definir texto pronóstico final
    if goles_l_final > goles_v_final: pronostico = f"Gana {equipo_local}"
    elif goles_v_final > goles_l_final: pronostico = f"Gana {equipo_visitante}"
    else: pronostico = "Empate"

    # 6. SALIDA DE DATOS
    return {
        "1. CABECERA DEL PARTIDO": f"{equipo_local} (Pos: {pos_l}º) vs {equipo_visitante} (Pos: {pos_v}º)",
        
        "2. PREDICCIÓN PRINCIPAL": {
            "Resultado Esperado": pronostico,
            "Marcador Estimado": f"{goles_l_final} - {goles_v_final}",
            "Goles Esperados (xG)": f"{round(xg_base_local, 2)} - {round(xg_base_visita, 2)}",
            "Confianza Local": f"{equipo_local}: {round(prob_local, 1)}%",
            "Confianza Empate": f"{round(prob_empate, 1)}%",
            "Confianza Visitante": f"{equipo_visitante}: {round(prob_visita, 1)}%"
        },
        
        "3. MOMENTO DE FORMA (ÚLTIMOS 5)": {
            f"Racha {equipo_local}": f"{txt_racha_l} ({puntos_racha_l} puntos de 15)",
            f"Últimos Rivales {equipo_local}": txt_rivales_l,
            f"Racha {equipo_visitante}": f"{txt_racha_v} ({puntos_racha_v} puntos de 15)",
            f"Últimos Rivales {equipo_visitante}": txt_rivales_v,
            "Tendencia": f"{equipo_local} llega mejor" if puntos_racha_l > puntos_racha_v else (f"{equipo_visitante} llega mejor" if puntos_racha_v > puntos_racha_l else "Llegan igualados")
        },
        
        "4. DATOS DE LA TEMPORADA": {
            "Puntos en Liga": f"{puntos_liga_l} vs {puntos_liga_v}",
            "Media Goles A Favor": f"{round(media_gf_l, 2)} vs {round(media_gf_v, 2)}",
            "Media Goles En Contra": f"{round(media_gc_l, 2)} vs {round(media_gc_v, 2)}"
        },
        
        "5. PLANTILLA Y BAJAS": {
            "Valor de Mercado": f"{valor_real_l:,.1f} M€ vs {valor_real_v:,.1f} M€",
            "Diferencia": f"x{round(valor_real_l/valor_real_v, 1) if valor_real_l > valor_real_v else round(valor_real_v/valor_real_l, 1)} a favor de {equipo_local if valor_real_l > valor_real_v else equipo_visitante}",
            "Bajas confirmadas": f"{equipo_local}: {les_l} vs {equipo_visitante}: {les_v}"
        }
    }


In [74]:
# USO DE LA FUNCIÓN
try:
    # DATOS A INTRODUCIR
    division = str(input("División (PRIMERA o SEGUNDA): "))
    equipo_local = str(input("Equipo Local: "))
    equipo_visitante = str(input("Equipo Visitante: "))

    print(f"INFORME {equipo_local} vs {equipo_visitante}:")

    if division == 'PRIMERA':
        informe_1 = predecir_resultado_final(equipo_local, equipo_visitante, df_completo_1, df_partidos_laliga_1, df_clasificacion_1)
    
        if informe_1:
            for seccion, contenido in informe_1.items():
                print(f"\n[{seccion}]")
                if isinstance(contenido, dict):
                    for k, v in contenido.items():
                        print(f"  • {k}: {v}")
                else:
                    print(f"  {contenido}")
    elif division == 'SEGUNDA':
        informe_2 = predecir_resultado_final(equipo_local, equipo_visitante, df_completo_2, df_partidos_laliga_2, df_clasificacion_2)
    
        if informe_2:
            for seccion, contenido in informe_2.items():
                print(f"\n[{seccion}]")
                if isinstance(contenido, dict):
                    for k, v in contenido.items():
                        print(f"  • {k}: {v}")
                else:
                    print(f"  {contenido}")
    else:
        print("Error: División no válida. Introduce 'PRIMERA' o 'SEGUNDA'.")

except Exception as e:
    print(f"Error: {e}")

INFORME Real Betis vs Valencia CF:

[1. CABECERA DEL PARTIDO]
  Real Betis (Pos: 6º) vs Valencia CF (Pos: 14º)

[2. PREDICCIÓN PRINCIPAL]
  • Resultado Esperado: Gana Real Betis
  • Marcador Estimado: 2 - 1
  • Goles Esperados (xG): 1.67 - 0.94
  • Confianza Local: Real Betis: 60.9%
  • Confianza Empate: 5%
  • Confianza Visitante: Valencia CF: 34.1%

[3. MOMENTO DE FORMA (ÚLTIMOS 5)]
  • Racha Real Betis: G-P-E-G-P (7 puntos de 15)
  • Últimos Rivales Real Betis: vs Getafe CF (21/12) | vs Real Madrid (04/01) | vs Real Oviedo (10/01) | vs Villarreal CF (17/01) | vs Deportivo Alavés (25/01)
  • Racha Valencia CF: E-P-E-G-G (8 puntos de 15)
  • Últimos Rivales Valencia CF: vs RCD Mallorca (19/12) | vs Celta de Vigo (03/01) | vs Elche CF (10/01) | vs Getafe CF (18/01) | vs RCD Espanyol (24/01)
  • Tendencia: Valencia CF llega mejor

[4. DATOS DE LA TEMPORADA]
  • Puntos en Liga: 32 vs 23
  • Media Goles A Favor: 1.62 vs 1.05
  • Media Goles En Contra: 1.29 vs 1.57

[5. PLANTILLA Y BAJAS]


#### PREDICCIÓN DE LOS SIGUIENTES PARTIDOS (1º y 2º)

In [75]:
import pandas as pd
import numpy as np

# --- MANTENEMOS LAS FUNCIONES---
# calcular_racha_detallada y predecir_resultado_final cargar en memoria

def obtener_pred_proximos_partidos(df_proximos_partidos):
    """
    Busca en el dataframe los partidos que no tienen resultado (goles = NaN o vacío).
    Devuelve una lista de tuplas [(Local, Visitante, Fecha), ...].
    """
    pendientes = []
    
    # 1. Limpieza de fechas para ordenar
    # (Usamos lógica de limpieza para poder ordenar por fecha más próxima)
    if 'Fecha' in df_proximos_partidos.columns:
        df_proximos_partidos['Fecha_clean'] = df_proximos_partidos['Fecha'].astype(str).str.extract(r'(\d{2}\.\d{2}\.\d{4})')
        df_proximos_partidos['Fecha_dt'] = pd.to_datetime(df_proximos_partidos['Fecha_clean'], format='%d.%m.%Y', errors='coerce')
        df_proximos_partidos = df_proximos_partidos.sort_values('Fecha_dt', ascending=True) # Ascendente: los más próximos primero
    
    # 2. Extraemos las parejas únicas
    # Usamos un set para no repetir (por si el scraping tiene duplicados)
    vistos = set()
    
    for _, fila in df_proximos_partidos.iterrows():
        local = str(fila['Local']).strip()
        visita = str(fila['Visitante']).strip()
        fecha = str(fila['Fecha']).strip()
        
        # Clave única del partido
        clave = (local, visita)
        
        if clave not in vistos:
            pendientes.append((local, visita, fecha))
            vistos.add(clave)
            
    return pendientes

def obtener_reporte_jornada(df_completo, df_partidos_laliga, df_clasificacion, df_proximos_partidos):
    """
    Genera un DataFrame con las predicciones de todos los partidos pendientes encontrados.
    """
    print("Buscando partidos pendientes en el calendario...")
    proximos_partidos = obtener_pred_proximos_partidos(df_proximos_partidos)
    
    if not proximos_partidos:
        print("No se encontraron partidos pendientes (sin resultado) en df_proximos_partidos.")
        print("Asegúrate de que df_proximos_partidos contiene el calendario futuro.")
        return None

    print(f"Se han encontrado {len(proximos_partidos)} partidos por jugar. Calculando predicciones...\n")
    
    resultados_lista = []
    
    for local, visita, fecha in proximos_partidos:
        # Ejecutamos función de predicción
        # Usamos try/except para que si falla un equipo (por nombre), no pare todo el proceso
        try:
            datos = predecir_resultado_final(local, visita, df_completo, df_partidos_laliga, df_clasificacion)
            
            if datos:
                # Extraemos los datos limpios del diccionario complejo que retorna tu función
                pred = datos["2. PREDICCIÓN PRINCIPAL"]
                
                fila = {
                    "Fecha": fecha,
                    "Partido": f"{local} vs {visita}",
                    "Pronóstico": pred["Resultado Esperado"],
                    "Marcador (Est)": pred["Marcador Estimado"],
                    "xG (Esperados)": pred["Goles Esperados (xG)"],
                    "Confianza Local": pred["Confianza Local"],
                    "Confianza Empate": pred["Confianza Empate"],
                    "Confianza Visitante": pred["Confianza Visitante"]
                }
                resultados_lista.append(fila)
            
        except Exception as e:
            print(f"Error procesando {local} vs {visita}: {e}")

    # Convertimos a DataFrame bonito
    df_resultados = pd.DataFrame(resultados_lista)
    return df_resultados

# --- EJECUCIÓN DEL ANÁLISIS ---
# 1º DIVISIÓN
df_predicciones_jornada_1 = obtener_reporte_jornada(df_completo_1, df_partidos_laliga_1, df_clasificacion_1, df_proximos_partidos_1_openrefine)

# MOSTRAR RESULTADOS
if df_predicciones_jornada_1 is not None and not df_predicciones_jornada_1.empty:
    print(f"INFORME DE PREDICCIONES: PRÓXIMOS {len(df_predicciones_jornada_1)} PARTIDOS 1º DIVISION")
    
    # Ajustamos opciones de pandas para que se vea todo el texto
    pd.set_option('display.max_colwidth', None)
    pd.set_option('display.width', 1000)
    
    # Mostramos la tabla
    display(df_predicciones_jornada_1)
    
else:
    print("\nNo se pudieron generar predicciones. Revisa que 'df_proximos_partidos_1' tenga partidos futuros.")

# 2º DIVISIÓN
df_predicciones_jornada_2 = obtener_reporte_jornada(df_completo_2, df_partidos_laliga_2, df_clasificacion_2, df_proximos_partidos_2_openrefine)

# MOSTRAR RESULTADOS
if df_predicciones_jornada_2 is not None and not df_predicciones_jornada_2.empty:
    print(f"INFORME DE PREDICCIONES: PRÓXIMOS {len(df_predicciones_jornada_2)} PARTIDOS 2º DIVISION")
    
    # Ajustamos opciones de pandas para que se vea todo el texto
    pd.set_option('display.max_colwidth', None)
    pd.set_option('display.width', 1000)
    
    # Mostramos la tabla
    display(df_predicciones_jornada_2)

else:
    print("\nNo se pudieron generar predicciones. Revisa que 'df_proximos_partidos_2' tenga partidos futuros.")

Buscando partidos pendientes en el calendario...
Se han encontrado 10 partidos por jugar. Calculando predicciones...

INFORME DE PREDICCIONES: PRÓXIMOS 10 PARTIDOS 1º DIVISION


Unnamed: 0,Fecha,Partido,Pronóstico,Marcador (Est),xG (Esperados),Confianza Local,Confianza Empate,Confianza Visitante
0,VIE 30.01.2026,RCD Espanyol vs Deportivo Alavés,Gana RCD Espanyol,2 - 1,1.38 - 0.82,RCD Espanyol: 59.9%,5%,Deportivo Alavés: 35.1%
1,SAB 31.01.2026,Levante UD vs Atlético de Madrid,Gana Atlético de Madrid,1 - 2,1.03 - 1.84,Levante UD: 32.7%,5%,Atlético de Madrid: 62.3%
2,SÁB 31.01.2026,CA Osasuna vs Villarreal CF,Empate,1 - 1,1.24 - 1.28,CA Osasuna: 35.4%,25%,Villarreal CF: 39.6%
3,SAB 31.01.2026,Elche CF vs FC Barcelona,Gana FC Barcelona,1 - 2,1.19 - 2.07,Elche CF: 33.4%,5%,FC Barcelona: 61.6%
4,SAB 31.01.2026,Real Oviedo vs Girona FC,Empate,1 - 1,1.06 - 1.23,Real Oviedo: 32.8%,25%,Girona FC: 42.2%
5,DOM 01.02.2026,Athletic Club vs Real Sociedad,Empate,1 - 1,1.05 - 1.14,Athletic Club: 35.4%,25%,Real Sociedad: 39.6%
6,DOM 01.02.2026,Getafe CF vs Celta de Vigo,Gana Celta de Vigo,1 - 2,0.94 - 1.16,Getafe CF: 36.7%,15%,Celta de Vigo: 48.3%
7,DOM 01.02.2026,Real Madrid vs Rayo Vallecano,Gana Real Madrid,3 - 0,2.54 - 0.54,Real Madrid: 78.6%,5%,Rayo Vallecano: 16.4%
8,DOM 01.02.2026,Real Betis vs Valencia CF,Gana Real Betis,2 - 1,1.67 - 0.94,Real Betis: 60.9%,5%,Valencia CF: 34.1%
9,LUN 02.02.2026,RCD Mallorca vs Sevilla FC,Gana RCD Mallorca,1 - 0,1.45 - 1.05,RCD Mallorca: 49.5%,15%,Sevilla FC: 35.5%


Buscando partidos pendientes en el calendario...
Se han encontrado 11 partidos por jugar. Calculando predicciones...

INFORME DE PREDICCIONES: PRÓXIMOS 11 PARTIDOS 2º DIVISION


Unnamed: 0,Fecha,Partido,Pronóstico,Marcador (Est),xG (Esperados),Confianza Local,Confianza Empate,Confianza Visitante
0,VIE 30.01.2026,Real Sociedad B vs UD Las Palmas,Gana UD Las Palmas,0 - 1,1.03 - 1.32,Real Sociedad B: 35.7%,15%,UD Las Palmas: 49.3%
1,SÁB 31.01.2026,Albacete BP vs Real Zaragoza,Gana Albacete BP,2 - 1,1.7 - 1.02,Albacete BP: 59.6%,5%,Real Zaragoza: 35.4%
2,SAB 31.01.2026,Burgos CF vs CD Leganés,Gana Burgos CF,2 - 1,1.3 - 0.91,Burgos CF: 50.7%,15%,CD Leganés: 34.3%
3,SÁB 31.01.2026,Córdoba CF vs Real Valladolid,Gana Córdoba CF,2 - 1,1.52 - 0.89,Córdoba CF: 59.6%,5%,Real Valladolid: 35.4%
4,SÁB 31.01.2026,Cultural Leonesa vs RC Deportivo,Gana RC Deportivo,1 - 2,1.12 - 1.55,Cultural Leonesa: 34.3%,15%,RC Deportivo: 50.7%
5,DOM 01.02.2026,UD Almería vs AD Ceuta FC,Gana UD Almería,2 - 1,2.06 - 1.07,UD Almería: 61.9%,5%,AD Ceuta FC: 33.1%
6,DOM 01.02.2026,SD Huesca vs Cádiz CF,Empate,1 - 1,1.12 - 1.09,SD Huesca: 37.1%,25%,Cádiz CF: 37.9%
7,DOM 01.02.2026,CD Castellón vs FC Andorra,Gana CD Castellón,2 - 1,1.81 - 0.97,CD Castellón: 61.6%,5%,FC Andorra: 33.4%
8,DOM 01.02.2026,Granada CF vs Racing de Santander,Gana Racing de Santander,1 - 2,1.31 - 1.71,Granada CF: 35.2%,15%,Racing de Santander: 49.8%
9,DOM 01.02.2026,SD Eibar vs Real Sporting,Gana SD Eibar,1 - 0,1.53 - 1.12,SD Eibar: 48.7%,15%,Real Sporting: 36.3%
