# RANKING V3

## Leer Datos

In [4]:
import pandas as pd
import numpy as np
from datetime import datetime, timedelta

# Cargar datos
data = pd.read_csv("df_peleas.csv")  
df = pd.DataFrame(data)

In [51]:
df.columns

Index(['Unnamed: 0', 'index', 'Peleador_A', 'Peleador_B', 'DATE', 'CATEGORY',
       'WINNER', 'METHOD', 'TIME', 'ROUND', 'KD_A', 'KD_B', 'SIG_STR_A',
       'SIG_STR_B', 'TD_PORC_A', 'TD_PORC_B', 'SUB_ATT_A', 'SUB_ATT_B',
       'REV_A', 'REV_B', 'CTRL_A', 'CTRL_B', 'TOTAL_STR_A_x', 'TOTAL_STR_A_y',
       'TOTAL_STR_B_x', 'TOTAL_STR_B_y', 'TD_A_x', 'TD_A_y', 'TD_B_x',
       'TD_B_y', 'STR_HEAD_A_x', 'STR_HEAD_A_y', 'STR_HEAD_B_x',
       'STR_HEAD_B_y', 'STR_BODY_A_x', 'STR_BODY_A_y', 'STR_BODY_B_x',
       'STR_BODY_B_y', 'STR_LEG_A_x', 'STR_LEG_A_y', 'STR_LEG_B_x',
       'STR_LEG_B_y', 'STR_DISTANCE_A_x', 'STR_DISTANCE_A_y',
       'STR_DISTANCE_B_x', 'STR_DISTANCE_B_y', 'STR_CLINCH_A_x',
       'STR_CLINCH_A_y', 'STR_CLINCH_B_x', 'STR_CLINCH_B_y', 'STR_GROUND_A_x',
       'STR_GROUND_A_y', 'STR_GROUND_B_x', 'STR_GROUND_B_y', 'TITLE_FIGHT',
       'WOMEN'],
      dtype='object')

## Convertir Fechas y Ordenar

In [6]:
# Convertir la columna DATE a formato datetime y ordenar de más antigua a más reciente
df["DATE"] = pd.to_datetime(df["DATE"], errors='coerce')  
df = df.sort_values(by="DATE", ascending=True)

## Calcular penalizaciones por antigüedad de la pelea

In [8]:
# Función para calcular la importancia del tiempo con caída gradual
def calcular_factor_tiempo(fecha_pelea):
    LAMBDA = 0.2  # Penalización más leve para peleas antiguas
    años_transcurridos = (datetime.today() - fecha_pelea).days / 365
    return np.exp(-LAMBDA * (años_transcurridos ** 1.1))

## Calcular el factor tiempo de pelea

In [10]:
# Función para calcular el tiempo de pelea
def calcular_tiempo(pelea):
    tiempo = pelea["TIME"]
    round_p = (pelea["ROUND"] - 1) * 5 * 60
    return round_p + tiempo

## Calcular factor método

In [12]:
# Función para obtener factor de método
def obtener_factor_metodo(metodo):
    factores = {
        'KO/TKO': 2.5,
        'Submission': 2.4,
        'Decision - Unanimous': 1.5,
        'Decision - Majority': 1,
        'Decision - Split': 0.85,
        "TKO - Doctor's Stoppage": 1.0
    }
    return factores.get(metodo, 1)

## Calcular factor Oponente

In [14]:
# Función para calcular el factor de oponente en un rango de 1 a 5
def calcular_factor_oponente(puntos_ganador, puntos_perdedor, ganador=True):
    if puntos_ganador == 0:
        return 1  # Evita división por cero
    
    ratio = (puntos_perdedor + 100) / (puntos_ganador + 100)
    ratio = max(0.5, min(ratio, 2.0))

    min_ratio = 0.5
    max_ratio = 2.0

    factor_oponente = 1 + 9 * ((np.sqrt(ratio) - np.sqrt(min_ratio)) / (np.sqrt(max_ratio) - np.sqrt(min_ratio)))

    return max(1, min(5, factor_oponente))

## Calcular Ranking

In [66]:
import pandas as pd

# Cargar los datos
df_peleas = pd.read_csv("df_peleas.csv")
df_peleas["DATE"] = pd.to_datetime(df_peleas["DATE"], errors='coerce')

df_peleas = df_peleas.sort_values(by=["DATE"])

# Diccionario de historial
peleadores_historial = {}
historial_datos = []
df_historico_peleas = []

# Columnas a procesar
stats_columns = ["KD", "SIG_STR", "TD_PORC", "SUB_ATT", "REV", "CTRL"]
stats_columns_2= ["TD_T", "TD_M",
"TOTAL_STR_T", "TOTAL_STR_M",
"STR_HEAD_T", "STR_HEAD_M",
"STR_BODY_T", "STR_BODY_M",
"STR_LEG_T", "STR_LEG_M",
"STR_DISTANCE_T", "STR_DISTANCE_M",
"STR_CLINCH_T", "STR_CLINCH_M",
"STR_GROUND_T", "STR_GROUND_M"]


def obtener_historial(peleador, fecha):
    """
    Devuelve el historial del peleador antes de la pelea.
    Si el peleador no tiene historial, devuelve valores iniciales en 0.
    """
    if peleador in peleadores_historial:
        return {"Peleador": peleador, "Fecha": fecha, **peleadores_historial[peleador].copy()}
    else:
        return {
            "Peleador": peleador,
            "Fecha": fecha,
            **{stat+"_A": 0 for stat in stats_columns},
            **{stat+"_R": 0 for stat in stats_columns},
            **{stat+"_A": 0 for stat in stats_columns_2},
            **{stat+"_R": 0 for stat in stats_columns_2},
            "Peleas": 0,
            "Puntos": 0,
            "Racha": 0
        }

def actualizar_estadisticas(peleador, stats_nuevas):
    """
    Actualiza las estadísticas de un peleador manteniendo la media acumulativa.
    """
    if peleador not in peleadores_historial:
        peleadores_historial[peleador] = stats_nuevas.copy()
        peleadores_historial[peleador]["Peleas"] = 1
        peleadores_historial[peleador]["Puntos"] = 0
        peleadores_historial[peleador]["Racha"] = 0
    else:
        peleas_previas = peleadores_historial[peleador]["Peleas"]
        for stat in stats_nuevas:
            peleadores_historial[peleador][stat] = (
                (peleadores_historial[peleador][stat] * peleas_previas) + stats_nuevas[stat]
            ) / (peleas_previas + 1)
        peleadores_historial[peleador]["Peleas"] += 1

# Iterar sobre cada pelea
for _, row in df_peleas.iterrows():
    peleador_a, peleador_b = row["Peleador_A"], row["Peleador_B"]
    fecha_pelea = row["DATE"]
    ganador = row["WINNER"]

    historial_a = obtener_historial(peleador_a, fecha_pelea)
    historial_b = obtener_historial(peleador_b, fecha_pelea)
    historial_datos.append(historial_a)
    historial_datos.append(historial_b)

    pelea_data = {"Fecha": fecha_pelea, "Peleador_A": peleador_a, "Peleador_B": peleador_b}
    for stat in stats_columns + stats_columns_2:
        pelea_data[stat+"_A"] = historial_a.get(stat+"_A", 0)
        pelea_data[stat+"_R_A"] = historial_a.get(stat+"_R", 0)
        pelea_data[stat+"_B"] = historial_b.get(stat+"_A", 0)
        pelea_data[stat+"_R_B"] = historial_b.get(stat+"_R", 0)
    pelea_data["Puntos_A"] = historial_a["Puntos"]
    pelea_data["Puntos_B"] = historial_b["Puntos"]
    pelea_data["Racha_A"] = historial_a["Racha"]
    pelea_data["Racha_B"] = historial_b["Racha"]
    df_historico_peleas.append(pelea_data)
    
    stats_a = {stat+"_A": row[stat+"_A"] for stat in stats_columns}
    stats_a.update({stat+"_R": row[stat+"_B"] for stat in stats_columns})
    
    stats_b = {stat+"_A": row[stat+"_B"] for stat in stats_columns}
    stats_b.update({stat+"_R": row[stat+"_A"] for stat in stats_columns})

    for stat in stats_columns_2:
        base_stat = stat[:-2]  # Elimina _T o _M
        stats_a[stat+"_A"] = row.get(base_stat+"_A_x", 0)
        stats_a[stat+"_R"] = row.get(base_stat+"_B_x", 0)
        stats_b[stat+"_A"] = row.get(base_stat+"_B_x", 0)
        stats_b[stat+"_R"] = row.get(base_stat+"_A_x", 0)
        
        stats_a[stat+"_A"] = row.get(base_stat+"_A_x", 0) / max(row.get(base_stat+"_A_y", 1), 1)
        stats_a[stat+"_R"] = row.get(base_stat+"_B_x", 0) / max(row.get(base_stat+"_B_y", 1), 1)
        stats_b[stat+"_A"] = row.get(base_stat+"_B_x", 0) / max(row.get(base_stat+"_B_y", 1), 1)
        stats_b[stat+"_R"] = row.get(base_stat+"_A_x", 0) / max(row.get(base_stat+"_A_y", 1), 1)
            
    actualizar_estadisticas(peleador_a, stats_a)
    actualizar_estadisticas(peleador_b, stats_b)
    
    factorTiempo = calcular_factor_tiempo(fecha_pelea)
    factorM = obtener_factor_metodo(row["METHOD"])
    factor_oAW = calcular_factor_oponente(peleadores_historial[peleador_a]["Puntos"], peleadores_historial[peleador_b]["Puntos"], ganador=True)
    factor_oAL = calcular_factor_oponente(peleadores_historial[peleador_a]["Puntos"], peleadores_historial[peleador_b]["Puntos"], ganador=False)
    factor_oBW = calcular_factor_oponente(peleadores_historial[peleador_b]["Puntos"], peleadores_historial[peleador_a]["Puntos"], ganador=True)
    factor_oBL = calcular_factor_oponente(peleadores_historial[peleador_b]["Puntos"], peleadores_historial[peleador_a]["Puntos"], ganador=False)
    
    factorTitleWin = 3 if row["TITLE_FIGHT"] else 1
    factorTitleLoss = 0.3 if row["TITLE_FIGHT"] else 1
    
    racha_A = 1 + 0.15 * peleadores_historial[peleador_a]["Racha"]
    racha_B = 1 + 0.15 * peleadores_historial[peleador_b]["Racha"]

    
    if ganador == 0:
        peleadores_historial[peleador_a]["Racha"] += 1
        peleadores_historial[peleador_b]["Racha"] = 0
        peleadores_historial[peleador_a]["Puntos"] += (10 * factorTitleWin * factorM * factor_oAW * factorTiempo * racha_A)
        peleadores_historial[peleador_b]["Puntos"] -= (10 * factorTitleLoss * factorM * factor_oBL * factorTiempo)
    elif ganador == 1:
        peleadores_historial[peleador_b]["Racha"] += 1
        peleadores_historial[peleador_a]["Racha"] = 0
        peleadores_historial[peleador_b]["Puntos"] += (10 * factorTitleWin * factorM * factor_oBW * factorTiempo * racha_B)
        peleadores_historial[peleador_a]["Puntos"] -= (10 * factorTitleLoss * factorM * factor_oAL * factorTiempo)
    
    peleadores_historial[peleador_a]["Puntos"] = max(0, peleadores_historial[peleador_a]["Puntos"])
    peleadores_historial[peleador_b]["Puntos"] = max(0, peleadores_historial[peleador_b]["Puntos"])
   
# Convertir el diccionario a un DataFrame

df_historico_peleas = pd.DataFrame(df_historico_peleas)
df_historico_peleas.to_csv("historial_peleas.csv", index=False)
df_historico = pd.DataFrame(historial_datos)
print(df_historico[df_historico["Peleador"]=="Ilia Topuria"])




           Peleador      Fecha      KD_A  SIG_STR_A  TD_PORC_A  SUB_ATT_A  \
11255  Ilia Topuria 2020-10-10  0.000000   0.000000   0.000000   0.000000   
11418  Ilia Topuria 2020-12-05  0.000000   0.390000   0.550000   5.000000   
12013  Ilia Topuria 2021-07-10  0.500000   0.440000   0.275000   2.500000   
12689  Ilia Topuria 2022-03-19  0.333333   0.480000   0.183333   1.666667   
13483  Ilia Topuria 2022-12-10  0.500000   0.480000   0.200000   1.250000   
14017  Ilia Topuria 2023-06-24  0.600000   0.486000   0.160000   1.200000   
14675  Ilia Topuria 2024-02-17  0.666667   0.478333   0.300000   1.000000   
15422  Ilia Topuria 2024-11-02  0.714286   0.474286   0.257143   0.857143   

       REV_A      CTRL_A      KD_R  SIG_STR_R  ...  STR_LEG_M_R  \
11255    0.0    0.000000  0.000000   0.000000  ...     0.000000   
11418    0.0  482.000000  0.000000   0.320000  ...     1.000000   
12013    0.0  242.500000  0.000000   0.310000  ...     0.750000   
12689    0.0  188.333333  0.000000   0

## Eliminar peleadores que no han peleado en más de 3 años

In [None]:
# Filtrar peleadores inactivos
#df_historico["Fecha"] = pd.to_datetime(df_historico["Fecha"])
#fecha_limite = datetime.today() - timedelta(days=3*365)
#df_historico = df_historico[df_historico["Fecha"] >= fecha_limite]
# Convertir el diccionario a un DataFrame

## Mostrar Top 15 LibraxLibra

In [64]:
df_peleadores = pd.DataFrame.from_dict(peleadores_historial, orient="index")

# Ordenar por puntos y mostrar los 15 mejores
df_top15 = df_peleadores.sort_values(by="Puntos", ascending=False).head(15)

print(df_top15)

                           KD_A  SIG_STR_A  TD_PORC_A  SUB_ATT_A     REV_A  \
Islam Makhachev        0.235294   0.568824   0.511765   0.764706  0.176471   
Jon Jones              0.250000   0.592083   0.548750   0.458333  0.000000   
Dricus Du Plessis      0.444444   0.506667   0.497778   0.666667  0.111111   
Ilia Topuria           0.750000   0.480000   0.350000   0.750000  0.000000   
Merab Dvalishvili      0.071429   0.429286   0.427143   0.285714  0.000000   
Alex Pereira           0.700000   0.651000   0.100000   0.200000  0.000000   
Belal Muhammad         0.000000   0.425263   0.291579   0.157895  0.000000   
Valentina Shevchenko   0.058824   0.575294   0.722353   0.411765  0.058824   
Alexander Volkanovski  0.375000   0.571250   0.259375   0.187500  0.187500   
Tom Aspinall           0.555556   0.698889   0.333333   0.222222  0.000000   
Sean O'Malley          0.461538   0.604615   0.038462   0.230769  0.076923   
Zhang Weili            0.250000   0.585000   0.332500   0.500000

## Mostrar Historial Peleador

In [43]:
# Mostrar el resultado
peleadores_historial["Wang Cong"]

{'Puntos': 14.979079981230205,
 'Peleas': 3,
 'Racha': 1,
 'Ultima_Pelea': Timestamp('2025-02-15 00:00:00')}