In [None]:
# Visualización: Estilos de pelea por región en UFC

Este notebook genera una visualización comparativa de estilos de pelea entre peleadores de Estados Unidos y Europa del Este utilizando Altair.


In [None]:
# Instalar librerías necesarias
!pip install altair vega_datasets


In [None]:
# Subir archivo CSV desde el computador
from google.colab import files
uploaded = files.upload()


In [None]:
# Importar librerías
import pandas as pd
import altair as alt


In [None]:
# Cargar el archivo CSV (ajusta el nombre si es distinto)
filename = list(uploaded.keys())[0]
df = pd.read_csv(filename)


In [None]:
# Clasificar regiones
europa_del_este = [
    "Russia", "Georgia", "Ukraine", "Poland", "Czech Republic", "Slovakia",
    "Hungary", "Romania", "Bulgaria", "Serbia", "Croatia", "Slovenia",
    "Bosnia and Herzegovina", "Montenegro", "North Macedonia", "Albania",
    "Moldova", "Belarus", "Armenia", "Lithuania", "Latvia", "Estonia"
]

def clasificar_region(pais):
    if pais == "United States":
        return "Estados Unidos"
    elif pais in europa_del_este:
        return "Europa del Este"
    else:
        return "Otro"

df["region"] = df["pais"].apply(clasificar_region)


In [None]:
# Filtrar solo regiones de interés y eliminar vacíos
df_filtrado = df[df["region"].isin(["Estados Unidos", "Europa del Este"])]
df_filtrado = df_filtrado[df_filtrado["estilo_pelea"].notna()]


In [None]:
# Agrupar y contar estilos por región
conteo = df_filtrado.groupby(["region", "estilo_pelea"]).size().reset_index(name="cantidad")


In [None]:
# Crear gráfico
chart = alt.Chart(conteo).mark_bar().encode(
    x=alt.X('cantidad:Q', title='Cantidad de peleadores'),
    y=alt.Y('estilo_pelea:N', sort='-x', title='Estilo de pelea'),
    color=alt.Color('region:N', title='Región'),
    tooltip=['region', 'estilo_pelea', 'cantidad']
).properties(
    title='Estilos de pelea por región: Estados Unidos vs Europa del Este',
    width=600,
    height=400
)

chart.show()
