# 📊 Análisis de YouTube Trending Videos (Top 1000)

Este notebook explora el dataset de los 1000 videos más trending en YouTube al 18 de abril de 2025.
Calcularemos media, mediana, moda y visualizaremos la distribución de:
- Vistas
- Likes
- Dislikes

In [None]:
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns

# Cargar el CSV
df = pd.read_csv('top-1000-trending-youtube-videos.csv')

# Limpiar columnas numéricas
cols = ['Video views', 'Likes', 'Dislikes']
for col in cols:
    df[col] = df[col].str.replace(',', '', regex=False)
    df[col] = pd.to_numeric(df[col], errors='coerce')

df[cols].info()

<class 'pandas.core.frame.DataFrame'>
RangeIndex: 1000 entries, 0 to 999
Data columns (total 3 columns):
 #   Column       Non-Null Count  Dtype  
---  ------       --------------  -----  
 0   Video views  1000 non-null   int64  
 1   Likes        973 non-null    float64
 2   Dislikes     687 non-null    float64
dtypes: float64(2), int64(1)
memory usage: 23.6 KB


In [None]:
# Calcular media, mediana y moda
for col in cols:
    media = df[col].mean()
    mediana = df[col].median()
    moda = df[col].mode().iloc[0] if not df[col].mode().empty else None
    print(f"\n📈 Estadísticas para '{col}':")
    print(f"Media: {media:,.0f}")
    print(f"Mediana: {mediana:,.0f}")
    print(f"Moda: {moda:,.0f}")


📈 Estadísticas para 'Video views':
Media: 24,890,216
Mediana: 2,829,316
Moda: 56,578

📈 Estadísticas para 'Likes':
Media: 159,208
Mediana: 3,604
Moda: 2

📈 Estadísticas para 'Dislikes':
Media: 1,680
Mediana: 257
Moda: 0


In [None]:
# Visualización: histogramas y boxplots
sns.set(style='whitegrid')
plt.figure(figsize=(16, 12))

for i, col in enumerate(cols, 1):
    plt.subplot(3, 2, i * 2 - 1)
    sns.histplot(df[col].dropna(), kde=True, bins=40)
    plt.title(f'Histograma: {col}')
    plt.xlabel(col)
    plt.ylabel('Frecuencia')

    plt.subplot(3, 2, i * 2)
    sns.boxplot(x=df[col].dropna())
    plt.title(f'Boxplot: {col}')
    plt.xlabel(col)

plt.tight_layout()
plt.show()