# 📊 Exploración Inicial de Medallas Olímpicas
Este notebook tiene como objetivo explorar de forma preliminar el dataset `medallas_historicas.csv`, analizando su estructura, valores faltantes, estadísticas generales y primeras tendencias.

In [None]:
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns

sns.set(style="whitegrid")
plt.rcParams["figure.figsize"] = (10, 5)

# Cargar el dataset
df = pd.read_csv("../data/medallas_historicas.csv")


## Vista general del dataset

In [None]:
df.head()


In [None]:
df.info()


In [None]:
df.describe(include='all')


## Verificación de valores nulos

In [None]:
df.isnull().sum()


## Países y años únicos

In [None]:
print("Países únicos:", df["País"].nunique())
print("Años únicos:", df["Año"].nunique())
print("Rango de años:", df["Año"].min(), "-", df["Año"].max())


## Total de medallas por edición

In [None]:
df["Total"] = df["Oro"] + df["Plata"] + df["Bronce"]

df.groupby("Año")["Total"].sum().plot(kind="bar", title="Total de medallas entregadas por edición")
plt.ylabel("Cantidad de medallas")
plt.xlabel("Año")
plt.tight_layout()
plt.show()


## Top 15 países con más medallas en total

In [None]:
ranking_total = df.groupby("País")["Total"].sum().sort_values(ascending=False).head(15)

ranking_total.plot(kind="barh", title="Top 15 países con más medallas")
plt.xlabel("Total de medallas")
plt.gca().invert_yaxis()
plt.tight_layout()
plt.show()


## Conclusiones exploratorias
- El dataset contiene información de múltiples ediciones de los Juegos Olímpicos.
- Se analizaron los valores nulos, la distribución de países y años.
- Se identificaron los países con mayor cantidad de medallas en la historia olímpica.