# Semana 5: Visualización y Presentación de Resultados

## Ciencia de Datos en el Deporte - Fundamentos con Python

---

**Objetivos de aprendizaje:**
- Crear visualizaciones avanzadas e informativas
- Desarrollar dashboards interactivos para análisis deportivo
- Aplicar principios de storytelling con datos
- Presentar resultados de manera profesional y comprensible
- Utilizar librerías de visualización avanzadas (Plotly, Seaborn)
- Generar reportes automatizados para equipos técnicos

---

## 1. Teoría: Visualización Efectiva de Datos

### 1.1 ¿Por qué es Importante la Visualización?

La visualización de datos es **fundamental** en el análisis deportivo porque:

#### **🧠 Cognición Humana**
- El cerebro procesa información visual **60,000 veces** más rápido que texto
- Los patrones visuales son más fáciles de identificar y recordar
- Las decisiones se toman más rápidamente con información visual clara

#### **📊 Comunicación Efectiva**
- **Simplifica** conceptos complejos para audiencias no técnicas
- **Persuade** y convence con evidencia visual
- **Unifica** la comprensión entre diferentes stakeholders

#### **🎯 Análisis Deportivo**
- **Identifica patrones** en el rendimiento que no son obvios en tablas
- **Compara** jugadores, equipos y métricas de manera intuitiva
- **Detecta tendencias** temporales y estacionales

### 1.2 Principios de Visualización Efectiva

#### **1.2.1 Claridad y Simplicidad**
- **Una idea por gráfico**: Enfoque en un mensaje principal
- **Menos es más**: Evitar saturación visual
- **Contexto apropiado**: Incluir información suficiente para interpretación

#### **1.2.2 Precisión e Integridad**
- **Escalas apropiadas**: Comenzar ejes en cero cuando sea relevante
- **Proporciones correctas**: Evitar distorsiones visuales
- **Datos completos**: Mostrar limitaciones y advertencias

#### **1.2.3 Diseño Intuitivo**
- **Colores significativos**: Usar paletas que apoyen el mensaje
- **Tipografía legible**: Tamaños y fuentes apropiadas
- **Jerarquía visual**: Destacar información más importante

### 1.3 Tipos de Visualizaciones en Fútbol

#### **📈 Análisis de Rendimiento**
- **Líneas de tiempo**: Evolución del rendimiento
- **Gráficos de barras**: Comparación entre jugadores/equipos
- **Heatmaps**: Distribución espacial o correlaciones

#### **⚽ Análisis Táctico**
- **Mapas de calor**: Posicionamiento de jugadores
- **Diagramas de flujo**: Patrones de pase
- **Redes de pases**: Conexiones entre jugadores

#### **💰 Análisis Económico**
- **Gráficos de dispersión**: Relación valor-rendimiento
- **Histogramas**: Distribución de salarios/transferencias
- **Dashboards**: Resúmenes ejecutivos

### 1.4 Herramientas y Librerías

#### **🐍 Python - Librerías Esenciales**
- **Matplotlib**: Base para visualizaciones estáticas
- **Seaborn**: Visualizaciones estadísticas elegantes
- **Plotly**: Gráficos interactivos y dashboards
- **Bokeh**: Visualizaciones web interactivas

#### **📊 Tipos de Gráficos por Propósito**

| Propósito | Tipo de Gráfico | Cuándo Usar |
|-----------|----------------|-------------|
| Comparación | Barras, Columnas | Comparar categorías |
| Evolución | Líneas | Mostrar cambios en tiempo |
| Distribución | Histogramas, Box plots | Analizar distribuciones |
| Correlación | Dispersión, Heatmaps | Relaciones entre variables |
| Composición | Pie, Stacked bars | Partes de un todo |

---

## 2. Configuración del Entorno

### 2.1 Librerías para Visualización Avanzada

Para crear visualizaciones profesionales necesitamos:

- **pandas**: Manipulación y análisis de datos
- **numpy**: Cálculos numéricos
- **matplotlib**: Visualizaciones estáticas básicas
- **seaborn**: Visualizaciones estadísticas elegantes
- **plotly**: Gráficos interactivos y dashboards
- **plotly.graph_objects**: Control detallado de gráficos
- **plotly.express**: Gráficos rápidos y expresivos
- **warnings**: Manejo de advertencias

In [1]:
# Importar librerías esenciales
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
import seaborn as sns
import warnings
from datetime import datetime, timedelta
import random

# Librerías para visualización avanzada
import plotly.express as px
import plotly.graph_objects as go
from plotly.subplots import make_subplots
import plotly.figure_factory as ff

# Configuración
warnings.filterwarnings('ignore')
pd.set_option('display.max_columns', None)
pd.set_option('display.width', None)

# Configurar matplotlib y seaborn
plt.style.use('seaborn-v0_8')
sns.set_palette("husl")
plt.rcParams['figure.figsize'] = (12, 8)
plt.rcParams['font.size'] = 12

# Configurar plotly para notebooks
import plotly.offline as pyo
pyo.init_notebook_mode(connected=True)

# Verificar versiones
print("✅ LIBRERÍAS IMPORTADAS EXITOSAMENTE")
print("=" * 50)
print(f"📊 Pandas: {pd.__version__}")
print(f"🔢 NumPy: {np.__version__}")
print(f"📈 Matplotlib: {plt.matplotlib.__version__}")
print(f"🎨 Seaborn: {sns.__version__}")
import plotly
print(f"📱 Plotly: {plotly.__version__}")

print("\n🔧 CONFIGURACIÓN APLICADA:")
print("- Estilo matplotlib: seaborn")
print("- Paleta seaborn: husl")
print("- Tamaño de figura: 12x8")
print("- Plotly configurado para notebooks")
print("- Advertencias suprimidas")

print("\n🚀 ¡Listo para crear visualizaciones impactantes!")

✅ LIBRERÍAS IMPORTADAS EXITOSAMENTE
📊 Pandas: 2.3.1
🔢 NumPy: 2.2.6
📈 Matplotlib: 3.10.3
🎨 Seaborn: 0.13.2
📱 Plotly: 6.2.0

🔧 CONFIGURACIÓN APLICADA:
- Estilo matplotlib: seaborn
- Paleta seaborn: husl
- Tamaño de figura: 12x8
- Plotly configurado para notebooks
- Advertencias suprimidas

🚀 ¡Listo para crear visualizaciones impactantes!


## 3. Carga y Preparación de Datos

### 3.1 Dataset para Visualización Avanzada

Para demostrar técnicas de visualización avanzada, crearemos un dataset rico que incluya:

- **Datos de jugadores**: Estadísticas individuales y métricas de rendimiento
- **Datos temporales**: Evolución del rendimiento a lo largo de la temporada
- **Datos de equipos**: Métricas agregadas y comparaciones
- **Datos económicos**: Valores de mercado y salarios
- **Datos geográficos**: Origen de los jugadores para visualizaciones de mapas

### 3.2 Estructura del Dataset

El dataset incluirá múltiples dimensiones para permitir visualizaciones complejas y storytelling efectivo.

In [2]:
# Generar dataset completo para visualizaciones avanzadas
np.random.seed(42)

# Configurar datos base
n_jugadores = 200
n_equipos = 10
n_fechas = 20  # Fechas de la temporada

# Equipos y sus características
equipos = ['Real Madrid', 'Barcelona', 'Atlético Madrid', 'Valencia', 'Sevilla', 
           'Athletic Bilbao', 'Real Sociedad', 'Villarreal', 'Betis', 'Espanyol']

presupuestos = [200, 180, 120, 80, 90, 60, 70, 85, 65, 45]  # Millones de euros
ligas = ['Primera División'] * 10

# Países de origen
paises = ['España', 'Brasil', 'Argentina', 'Francia', 'Alemania', 'Portugal', 
          'Inglaterra', 'Italia', 'Colombia', 'México', 'Uruguay', 'Chile']
coords_paises = {
    'España': (40.4168, -3.7038), 'Brasil': (-14.2350, -51.9253),
    'Argentina': (-38.4161, -63.6167), 'Francia': (46.6034, 1.8883),
    'Alemania': (51.1657, 10.4515), 'Portugal': (39.3999, -8.2245),
    'Inglaterra': (52.3555, -1.1743), 'Italia': (41.8719, 12.5674),
    'Colombia': (4.5709, -74.2973), 'México': (23.6345, -102.5528),
    'Uruguay': (-32.5228, -55.7658), 'Chile': (-35.6751, -71.5430)
}

print("🚀 GENERANDO DATASET PARA VISUALIZACIONES AVANZADAS")
print("=" * 60)

# Generar datos de jugadores
jugadores_data = []
for i in range(n_jugadores):
    equipo = np.random.choice(equipos)
    equipo_idx = equipos.index(equipo)
    posicion = np.random.choice(['Delantero', 'Mediocampista', 'Defensor', 'Portero'], 
                               p=[0.25, 0.35, 0.30, 0.10])
    
    # Datos básicos
    edad = int(np.random.normal(26, 4))
    edad = max(18, min(35, edad))
    
    pais = np.random.choice(paises, p=[0.35, 0.15, 0.10, 0.08, 0.07, 0.06, 0.05, 0.05, 0.03, 0.03, 0.02, 0.01])
    altura = np.random.normal(178, 8)  # cm
    peso = np.random.normal(75, 8)     # kg
    
    # Factor de calidad del equipo afecta las estadísticas
    factor_equipo = presupuestos[equipo_idx] / 200  # Normalizar al mejor equipo
    
    # Estadísticas base (influenciadas por posición y equipo)
    if posicion == 'Delantero':
        goles_base = np.random.poisson(12 * factor_equipo)
        asistencias_base = np.random.poisson(4 * factor_equipo)
    elif posicion == 'Mediocampista':
        goles_base = np.random.poisson(6 * factor_equipo)
        asistencias_base = np.random.poisson(10 * factor_equipo)
    elif posicion == 'Defensor':
        goles_base = np.random.poisson(2 * factor_equipo)
        asistencias_base = np.random.poisson(3 * factor_equipo)
    else:  # Portero
        goles_base = 0
        asistencias_base = np.random.poisson(1)
    
    # Minutos y partidos
    partidos = np.random.randint(15, 38)
    minutos_por_partido = np.random.normal(70, 15) if posicion != 'Portero' else np.random.normal(85, 10)
    minutos_totales = int(partidos * minutos_por_partido)
    
    # Valor de mercado (influenciado por múltiples factores)
    valor_base = 10 + (goles_base * 1.5) + (asistencias_base * 0.8) + (factor_equipo * 20)
    factor_edad = 1.3 if 22 <= edad <= 28 else 0.8 if edad > 30 else 1.0
    valor_mercado = valor_base * factor_edad * np.random.uniform(0.7, 1.3)
    
    # Salario (correlacionado con valor de mercado)
    salario_anual = valor_mercado * 0.8 * np.random.uniform(0.8, 1.2)  # Millones
    
    # Rating promedio (0-100)
    rating = 60 + (goles_base + asistencias_base) * 2 + factor_equipo * 15 + np.random.normal(0, 5)
    rating = max(50, min(95, rating))
    
    jugadores_data.append({
        'jugador_id': f'J{i+1:03d}',
        'nombre': f'Jugador_{i+1:03d}',
        'equipo': equipo,
        'posicion': posicion,
        'edad': edad,
        'pais': pais,
        'altura': round(altura, 1),
        'peso': round(peso, 1),
        'goles_temporada': goles_base,
        'asistencias_temporada': asistencias_base,
        'partidos_jugados': partidos,
        'minutos_totales': minutos_totales,
        'valor_mercado': round(valor_mercado, 1),
        'salario_anual': round(salario_anual, 1),
        'rating_promedio': round(rating, 1)
    })

# Crear DataFrame principal
df_jugadores = pd.DataFrame(jugadores_data)

# Agregar coordenadas geográficas
df_jugadores['lat'] = df_jugadores['pais'].map(lambda x: coords_paises[x][0])
df_jugadores['lon'] = df_jugadores['pais'].map(lambda x: coords_paises[x][1])

print(f"📊 Dataset de jugadores creado: {len(df_jugadores)} jugadores")
print(f"🏟️ Equipos representados: {len(df_jugadores['equipo'].unique())}")
print(f"🌍 Países de origen: {len(df_jugadores['pais'].unique())}")

# Generar datos temporales (evolución durante la temporada)
fechas = pd.date_range(start='2024-08-01', periods=n_fechas, freq='W')
datos_temporales = []

for fecha in fechas:
    for equipo in equipos:
        # Métricas agregadas del equipo por fecha
        jugadores_equipo = df_jugadores[df_jugadores['equipo'] == equipo]
        
        # Simular variabilidad temporal
        factor_temporal = np.random.uniform(0.8, 1.2)
        
        goles_fecha = int(np.sum(jugadores_equipo['goles_temporada']) / n_fechas * factor_temporal)
        puntos_acumulados = np.random.randint(0, min(60, (fechas.tolist().index(fecha) + 1) * 3))
        
        datos_temporales.append({
            'fecha': fecha,
            'equipo': equipo,
            'goles_fecha': goles_fecha,
            'puntos_acumulados': puntos_acumulados,
            'jornada': fechas.tolist().index(fecha) + 1
        })

df_temporal = pd.DataFrame(datos_temporales)

print(f"📅 Datos temporales creados: {len(df_temporal)} registros")
print(f"🗓️ Periodo: {fechas[0].strftime('%Y-%m-%d')} a {fechas[-1].strftime('%Y-%m-%d')}")

# Mostrar muestra de los datos
print("\n=== MUESTRA DEL DATASET DE JUGADORES ===")
print(df_jugadores.head())

print("\n=== ESTADÍSTICAS BÁSICAS ===")
print(df_jugadores.describe().round(2))

print("\n=== DISTRIBUCIÓN POR EQUIPO ===")
print(df_jugadores['equipo'].value_counts())

print("\n✅ Datos preparados para visualizaciones avanzadas")

🚀 GENERANDO DATASET PARA VISUALIZACIONES AVANZADAS
📊 Dataset de jugadores creado: 200 jugadores
🏟️ Equipos representados: 10
🌍 Países de origen: 12
📅 Datos temporales creados: 200 registros
🗓️ Periodo: 2024-08-04 a 2024-12-15

=== MUESTRA DEL DATASET DE JUGADORES ===
  jugador_id       nombre           equipo       posicion  edad       pais  \
0       J001  Jugador_001    Real Sociedad       Defensor    28  Argentina   
1       J002  Jugador_002          Sevilla       Defensor    23    Francia   
2       J003  Jugador_003          Sevilla       Defensor    23     España   
3       J004  Jugador_004  Athletic Bilbao  Mediocampista    32     España   
4       J005  Jugador_005            Betis  Mediocampista    21   Portugal   

   altura  peso  goles_temporada  asistencias_temporada  partidos_jugados  \
0   173.1  67.7                0                      0                22   
1   158.5  79.8                0                      1                29   
2   185.6  70.2                0

## 4. Visualizaciones Avanzadas con Plotly

### 4.1 Gráficos Interactivos para Análisis Deportivo

Plotly nos permite crear visualizaciones **interactivas** que mejoran significativamente la experiencia de análisis:

#### **Ventajas de la Interactividad:**
- **Exploración dinámica**: Zoom, filtros, hover para detalles
- **Múltiples perspectivas**: Cambio de variables en tiempo real
- **Engagement**: Mayor atención y comprensión de la audiencia
- **Análisis profundo**: Capacidad de drill-down en los datos

### 4.2 Gráficos de Dispersión Interactivos

Comenzamos con análisis de correlaciones mejorados con interactividad.

In [3]:
# 4.2 Gráfico de dispersión interactivo: Valor de Mercado vs Rendimiento

print("📊 VISUALIZACIONES INTERACTIVAS CON PLOTLY")
print("=" * 60)

# Crear gráfico de dispersión avanzado
fig_scatter = px.scatter(
    df_jugadores, 
    x='goles_temporada', 
    y='valor_mercado',
    color='posicion',
    size='rating_promedio',
    hover_data=['nombre', 'equipo', 'edad', 'asistencias_temporada'],
    title='💰 Relación entre Goles y Valor de Mercado por Posición',
    labels={
        'goles_temporada': 'Goles en la Temporada',
        'valor_mercado': 'Valor de Mercado (M€)',
        'posicion': 'Posición',
        'rating_promedio': 'Rating'
    }
)

# Personalizar el gráfico
fig_scatter.update_layout(
    width=900,
    height=600,
    title_font_size=16,
    xaxis_title_font_size=14,
    yaxis_title_font_size=14,
    legend_title_font_size=14,
    hovermode='closest',
    template='plotly_white'
)

# Agregar línea de tendencia
from sklearn.linear_model import LinearRegression
X = df_jugadores[['goles_temporada']]
y = df_jugadores['valor_mercado']
reg = LinearRegression().fit(X, y)
df_jugadores['valor_predicho'] = reg.predict(X)

fig_scatter.add_scatter(
    x=df_jugadores['goles_temporada'], 
    y=df_jugadores['valor_predicho'],
    mode='lines',
    name='Tendencia',
    line=dict(color='red', dash='dash')
)

fig_scatter.show()

print("✅ Gráfico de dispersión interactivo creado")
print(f"📈 Correlación Goles-Valor: {df_jugadores['goles_temporada'].corr(df_jugadores['valor_mercado']):.3f}")

# Gráfico de barras interactivo por equipos
fig_bar = px.bar(
    df_jugadores.groupby('equipo').agg({
        'valor_mercado': 'mean',
        'goles_temporada': 'sum',
        'rating_promedio': 'mean'
    }).reset_index(),
    x='equipo',
    y='valor_mercado',
    color='rating_promedio',
    title='🏆 Valor de Mercado Promedio por Equipo',
    labels={
        'equipo': 'Equipo',
        'valor_mercado': 'Valor Promedio (M€)',
        'rating_promedio': 'Rating Promedio'
    }
)

fig_bar.update_layout(
    width=900,
    height=500,
    xaxis_tickangle=-45,
    template='plotly_white'
)

fig_bar.show()

print("✅ Gráfico de barras interactivo por equipos creado")

# Análisis por posición con box plots
fig_box = px.box(
    df_jugadores,
    x='posicion',
    y='valor_mercado',
    color='posicion',
    title='📦 Distribución de Valor de Mercado por Posición',
    labels={
        'posicion': 'Posición',
        'valor_mercado': 'Valor de Mercado (M€)'
    }
)

fig_box.update_layout(
    width=800,
    height=500,
    template='plotly_white'
)

fig_box.show()

print("✅ Box plots interactivos por posición creados")

📊 VISUALIZACIONES INTERACTIVAS CON PLOTLY


✅ Gráfico de dispersión interactivo creado
📈 Correlación Goles-Valor: 0.673


✅ Gráfico de barras interactivo por equipos creado


✅ Box plots interactivos por posición creados


### 4.3 Visualizaciones Geográficas y Temporales

Los **mapas interactivos** y **series temporales** añaden dimensiones espaciales y temporales al análisis deportivo.

In [4]:
# 4.3 Mapa geográfico de origen de jugadores

print("\n🗺️ VISUALIZACIONES GEOGRÁFICAS Y TEMPORALES")
print("=" * 60)

# Agregar datos por país para el mapa
df_paises = df_jugadores.groupby('pais').agg({
    'jugador_id': 'count',
    'valor_mercado': 'mean',
    'rating_promedio': 'mean',
    'lat': 'first',
    'lon': 'first'
}).reset_index()

df_paises.columns = ['pais', 'num_jugadores', 'valor_promedio', 'rating_promedio', 'lat', 'lon']

# Crear mapa de dispersión geográfico
fig_map = px.scatter_geo(
    df_paises,
    lat='lat',
    lon='lon',
    size='num_jugadores',
    color='valor_promedio',
    hover_name='pais',
    hover_data=['num_jugadores', 'rating_promedio'],
    title='🌍 Distribución Global de Jugadores por País de Origen',
    labels={
        'valor_promedio': 'Valor Promedio (M€)',
        'num_jugadores': 'Número de Jugadores'
    }
)

fig_map.update_layout(
    geo=dict(
        projection_type='equirectangular',
        showland=True,
        landcolor='lightgray',
        coastlinecolor='darkgray',
    ),
    width=900,
    height=500
)

fig_map.show()

print("✅ Mapa geográfico de origen de jugadores creado")

# Gráfico de series temporales - Evolución de puntos por equipo
fig_temporal = px.line(
    df_temporal,
    x='fecha',
    y='puntos_acumulados',
    color='equipo',
    title='📈 Evolución de Puntos Acumulados por Equipo',
    labels={
        'fecha': 'Fecha',
        'puntos_acumulados': 'Puntos Acumulados',
        'equipo': 'Equipo'
    }
)

fig_temporal.update_layout(
    width=900,
    height=500,
    hovermode='x unified',
    template='plotly_white'
)

fig_temporal.show()

print("✅ Gráfico de series temporales creado")

# Heatmap de correlaciones interactivo
variables_numericas = ['edad', 'goles_temporada', 'asistencias_temporada', 
                      'valor_mercado', 'rating_promedio', 'salario_anual']

correlacion_matrix = df_jugadores[variables_numericas].corr()

fig_heatmap = px.imshow(
    correlacion_matrix,
    text_auto=True,
    aspect="auto",
    title='🔥 Matriz de Correlaciones entre Variables',
    color_continuous_scale='RdBu_r'
)

fig_heatmap.update_layout(
    width=700,
    height=500
)

fig_heatmap.show()

print("✅ Heatmap de correlaciones interactivo creado")

# Gráfico de violin para distribuciones detalladas
fig_violin = px.violin(
    df_jugadores,
    x='posicion',
    y='salario_anual',
    color='posicion',
    box=True,
    title='🎻 Distribución de Salarios por Posición',
    labels={
        'posicion': 'Posición',
        'salario_anual': 'Salario Anual (M€)'
    }
)

fig_violin.update_layout(
    width=800,
    height=500,
    template='plotly_white'
)

fig_violin.show()

print("✅ Gráfico de violin para distribuciones creado")

print(f"\n📊 Estadísticas del análisis geográfico:")
print(f"   🌍 Países representados: {len(df_paises)}")
print(f"   👥 País con más jugadores: {df_paises.loc[df_paises['num_jugadores'].idxmax(), 'pais']} ({df_paises['num_jugadores'].max()} jugadores)")
print(f"   💰 País con mayor valor promedio: {df_paises.loc[df_paises['valor_promedio'].idxmax(), 'pais']} ({df_paises['valor_promedio'].max():.1f} M€)")

print(f"\n📈 Estadísticas temporales:")
print(f"   📅 Periodo analizado: {df_temporal['jornada'].max()} jornadas")
print(f"   🏆 Equipo con más puntos: {df_temporal.groupby('equipo')['puntos_acumulados'].max().idxmax()}")
print(f"   ⚽ Total de goles por jornada: {df_temporal.groupby('jornada')['goles_fecha'].sum().mean():.1f} promedio")


🗺️ VISUALIZACIONES GEOGRÁFICAS Y TEMPORALES


✅ Mapa geográfico de origen de jugadores creado


✅ Gráfico de series temporales creado


✅ Heatmap de correlaciones interactivo creado


✅ Gráfico de violin para distribuciones creado

📊 Estadísticas del análisis geográfico:
   🌍 Países representados: 12
   👥 País con más jugadores: España (66 jugadores)
   💰 País con mayor valor promedio: Uruguay (40.1 M€)

📈 Estadísticas temporales:
   📅 Periodo analizado: 20 jornadas
   🏆 Equipo con más puntos: Barcelona
   ⚽ Total de goles por jornada: 22.8 promedio


## 5. Dashboards y Storytelling con Datos

### 5.1 Creación de Dashboards Integrados

Los **dashboards** combinan múltiples visualizaciones para contar una historia completa. Son esenciales para:

#### **📊 Análisis Executivo**
- **Resumen de métricas clave**: KPIs principales en una vista
- **Comparaciones rápidas**: Entre equipos, jugadores, temporadas
- **Detección de tendencias**: Patrones y anomalías

#### **🎯 Toma de Decisiones**
- **Información contextualizada**: Datos relevantes en tiempo real
- **Filtros dinámicos**: Exploración personalizada
- **Alertas visuales**: Destacar información crítica

### 5.2 Dashboard Ejecutivo de Rendimiento

Creamos un dashboard que combine las visualizaciones más importantes.

In [5]:
# 5.2 Dashboard ejecutivo integrado

print("\n📊 DASHBOARD EJECUTIVO DE RENDIMIENTO")
print("=" * 60)

# Crear dashboard con múltiples subgráficos
from plotly.subplots import make_subplots

# Configurar layout del dashboard (2x2)
fig_dashboard = make_subplots(
    rows=2, cols=2,
    subplot_titles=(
        '💰 Top 10 Jugadores por Valor',
        '⚽ Goles vs Asistencias',
        '🏆 Rendimiento por Equipo',
        '📊 Distribución de Edades'
    ),
    specs=[
        [{"type": "bar"}, {"type": "scatter"}],
        [{"type": "bar"}, {"type": "histogram"}]
    ]
)

# 1. Top 10 jugadores por valor (Barras)
top_jugadores = df_jugadores.nlargest(10, 'valor_mercado')
fig_dashboard.add_trace(
    go.Bar(
        x=top_jugadores['valor_mercado'],
        y=top_jugadores['nombre'],
        orientation='h',
        name='Valor M€',
        marker_color='lightblue'
    ),
    row=1, col=1
)

# 2. Goles vs Asistencias (Dispersión)
fig_dashboard.add_trace(
    go.Scatter(
        x=df_jugadores['goles_temporada'],
        y=df_jugadores['asistencias_temporada'],
        mode='markers',
        marker=dict(
            size=df_jugadores['rating_promedio']/5,
            color=df_jugadores['valor_mercado'],
            colorscale='Viridis',
            showscale=True
        ),
        text=df_jugadores['nombre'],
        name='Jugadores'
    ),
    row=1, col=2
)

# 3. Rendimiento por equipo (Barras)
rendimiento_equipos = df_jugadores.groupby('equipo').agg({
    'rating_promedio': 'mean',
    'valor_mercado': 'sum'
}).reset_index()

fig_dashboard.add_trace(
    go.Bar(
        x=rendimiento_equipos['equipo'],
        y=rendimiento_equipos['rating_promedio'],
        name='Rating Promedio',
        marker_color='lightgreen'
    ),
    row=2, col=1
)

# 4. Distribución de edades (Histograma)
fig_dashboard.add_trace(
    go.Histogram(
        x=df_jugadores['edad'],
        nbinsx=15,
        name='Frecuencia',
        marker_color='lightcoral'
    ),
    row=2, col=2
)

# Actualizar layout del dashboard
fig_dashboard.update_layout(
    height=800,
    showlegend=False,
    title_text="🏟️ Dashboard Ejecutivo de Rendimiento - Liga Española",
    title_x=0.5,
    title_font_size=20
)

# Personalizar ejes
fig_dashboard.update_xaxes(title_text="Valor de Mercado (M€)", row=1, col=1)
fig_dashboard.update_xaxes(title_text="Goles", row=1, col=2)
fig_dashboard.update_xaxes(title_text="Equipos", row=2, col=1, tickangle=45)
fig_dashboard.update_xaxes(title_text="Edad", row=2, col=2)

fig_dashboard.update_yaxes(title_text="Jugadores", row=1, col=1)
fig_dashboard.update_yaxes(title_text="Asistencias", row=1, col=2)
fig_dashboard.update_yaxes(title_text="Rating Promedio", row=2, col=1)
fig_dashboard.update_yaxes(title_text="Frecuencia", row=2, col=2)

fig_dashboard.show()

print("✅ Dashboard ejecutivo creado")

# Métricas KPI para el dashboard
print("\n📈 MÉTRICAS CLAVE (KPIs)")
print("-" * 40)

total_jugadores = len(df_jugadores)
valor_total_mercado = df_jugadores['valor_mercado'].sum()
edad_promedio = df_jugadores['edad'].mean()
rating_promedio_liga = df_jugadores['rating_promedio'].mean()
goles_total = df_jugadores['goles_temporada'].sum()

print(f"👥 Total de jugadores: {total_jugadores}")
print(f"💰 Valor total del mercado: {valor_total_mercado:.1f} M€")
print(f"🎂 Edad promedio: {edad_promedio:.1f} años")
print(f"⭐ Rating promedio de la liga: {rating_promedio_liga:.1f}/100")
print(f"⚽ Total de goles en la temporada: {goles_total}")

# Top performers
print(f"\n🏆 TOP PERFORMERS")
print("-" * 40)

mejor_jugador = df_jugadores.loc[df_jugadores['rating_promedio'].idxmax()]
mas_caro = df_jugadores.loc[df_jugadores['valor_mercado'].idxmax()]
maximo_goleador = df_jugadores.loc[df_jugadores['goles_temporada'].idxmax()]
mas_asistencias = df_jugadores.loc[df_jugadores['asistencias_temporada'].idxmax()]

print(f"🌟 Mejor jugador (rating): {mejor_jugador['nombre']} ({mejor_jugador['equipo']}) - {mejor_jugador['rating_promedio']:.1f}")
print(f"💎 Jugador más valioso: {mas_caro['nombre']} ({mas_caro['equipo']}) - {mas_caro['valor_mercado']:.1f} M€")
print(f"⚽ Máximo goleador: {maximo_goleador['nombre']} ({maximo_goleador['equipo']}) - {maximo_goleador['goles_temporada']} goles")
print(f"🎯 Más asistencias: {mas_asistencias['nombre']} ({mas_asistencias['equipo']}) - {mas_asistencias['asistencias_temporada']} asistencias")

print("\n✅ Dashboard y métricas ejecutivas completadas")


📊 DASHBOARD EJECUTIVO DE RENDIMIENTO


✅ Dashboard ejecutivo creado

📈 MÉTRICAS CLAVE (KPIs)
----------------------------------------
👥 Total de jugadores: 200
💰 Valor total del mercado: 5966.1 M€
🎂 Edad promedio: 25.7 años
⭐ Rating promedio de la liga: 76.7/100
⚽ Total de goles en la temporada: 555

🏆 TOP PERFORMERS
----------------------------------------
🌟 Mejor jugador (rating): Jugador_006 (Real Madrid) - 95.0
💎 Jugador más valioso: Jugador_126 (Real Madrid) - 90.9 M€
⚽ Máximo goleador: Jugador_173 (Barcelona) - 17 goles
🎯 Más asistencias: Jugador_128 (Real Madrid) - 16 asistencias

✅ Dashboard y métricas ejecutivas completadas


## 6. Storytelling y Presentación Profesional

### 6.1 Principios del Storytelling con Datos

El **storytelling** con datos transforma números en narrativas convincentes:

#### **📖 Estructura Narrativa**
- **Contexto**: Establecer el escenario y la importancia
- **Conflicto**: Identificar problemas o preguntas clave
- **Resolución**: Presentar insights y recomendaciones

#### **🎯 Elementos Clave**
- **Audiencia**: Adaptar el mensaje al público objetivo
- **Mensaje principal**: Una idea central clara y memorable
- **Evidencia visual**: Gráficos que apoyen la narrativa
- **Call to action**: Qué debe hacer la audiencia

### 6.2 Ejemplo de Storytelling: "El Mercado de Fichajes"

Vamos a crear una narrativa completa usando nuestros datos.

In [6]:
# 6.2 Storytelling: "Análisis del Mercado de Fichajes"

print("📖 STORYTELLING: ANÁLISIS DEL MERCADO DE FICHAJES")
print("=" * 70)

print("""
🎬 NARRATIVA: "La Revolución del Mercado de Fichajes"

CONTEXTO:
El fútbol moderno ha experimentado una inflación sin precedentes en los valores 
de mercado. Los equipos invierten cientos de millones buscando el éxito deportivo.

PREGUNTA CLAVE:
¿Qué factores realmente determinan el valor de un jugador?
¿Están los equipos invirtiendo de manera inteligente?

HALLAZGOS PRINCIPALES:
""")

# Análisis 1: Relación valor-rendimiento
print("\n🔍 HALLAZGO 1: LA EDAD DORADA")
print("-" * 50)

# Análisis por grupos de edad
df_jugadores['grupo_edad'] = pd.cut(df_jugadores['edad'], 
                                  bins=[17, 23, 28, 35], 
                                  labels=['Jóvenes (18-23)', 'Prime (24-28)', 'Veteranos (29+)'])

valor_por_edad = df_jugadores.groupby('grupo_edad').agg({
    'valor_mercado': ['mean', 'count'],
    'rating_promedio': 'mean'
}).round(2)

print("Análisis de valor por grupo de edad:")
for grupo in valor_por_edad.index:
    media_valor = valor_por_edad.loc[grupo, ('valor_mercado', 'mean')]
    cantidad = valor_por_edad.loc[grupo, ('valor_mercado', 'count')]
    rating = valor_por_edad.loc[grupo, ('rating_promedio', 'mean')]
    print(f"  {grupo}: {media_valor:.1f} M€ promedio (n={cantidad}, rating={rating:.1f})")

# Visualización del hallazgo
fig_edad = px.box(df_jugadores, x='grupo_edad', y='valor_mercado', 
                  title='💎 El "Prime" de 24-28 años domina el mercado',
                  labels={'grupo_edad': 'Grupo de Edad', 'valor_mercado': 'Valor (M€)'})
fig_edad.show()

print("\n🔍 HALLAZGO 2: EL FACTOR POSICIÓN")
print("-" * 50)

valor_por_posicion = df_jugadores.groupby('posicion').agg({
    'valor_mercado': ['mean', 'std'],
    'rating_promedio': 'mean'
}).round(2)

print("Valor promedio por posición:")
for pos in valor_por_posicion.index:
    media = valor_por_posicion.loc[pos, ('valor_mercado', 'mean')]
    std = valor_por_posicion.loc[pos, ('valor_mercado', 'std')]
    rating = valor_por_posicion.loc[pos, ('rating_promedio', 'mean')]
    print(f"  {pos}: {media:.1f} ± {std:.1f} M€ (rating={rating:.1f})")

print("\n🔍 HALLAZGO 3: LA BRECHA DE EFICIENCIA")
print("-" * 50)

# Calcular eficiencia: rendimiento vs valor
df_jugadores['eficiencia'] = (df_jugadores['rating_promedio'] / df_jugadores['valor_mercado']) * 10

eficiencia_equipos = df_jugadores.groupby('equipo').agg({
    'eficiencia': 'mean',
    'valor_mercado': 'sum',
    'rating_promedio': 'mean'
}).round(2)

print("Eficiencia por equipo (Rating/Valor):")
eficiencia_ordenada = eficiencia_equipos.sort_values('eficiencia', ascending=False)
for i, (equipo, row) in enumerate(eficiencia_ordenada.head().iterrows(), 1):
    print(f"  {i}. {equipo}: {row['eficiencia']:.2f} (valor total: {row['valor_mercado']:.1f} M€)")

# Visualización de eficiencia
fig_eficiencia = px.scatter(eficiencia_equipos.reset_index(), 
                           x='valor_mercado', y='rating_promedio',
                           size='eficiencia', hover_name='equipo',
                           title='⚖️ Eficiencia: Rating vs Inversión Total',
                           labels={'valor_mercado': 'Inversión Total (M€)', 
                                  'rating_promedio': 'Rating Promedio'})
fig_eficiencia.show()

print("\n🔍 HALLAZGO 4: EL MITO DE LA NACIONALIDAD")
print("-" * 50)

valor_por_pais = df_jugadores.groupby('pais').agg({
    'valor_mercado': ['mean', 'count']
}).round(2)

# Solo países con más de 5 jugadores
paises_relevantes = valor_por_pais[valor_por_pais[('valor_mercado', 'count')] >= 5]
paises_ordenados = paises_relevantes.sort_values(('valor_mercado', 'mean'), ascending=False)

print("Valor promedio por nacionalidad (países con 5+ jugadores):")
for pais in paises_ordenados.head().index:
    media = paises_ordenados.loc[pais, ('valor_mercado', 'mean')]
    cantidad = paises_ordenados.loc[pais, ('valor_mercado', 'count')]
    print(f"  {pais}: {media:.1f} M€ promedio (n={cantidad})")

print("\n💡 INSIGHTS CLAVE:")
print("-" * 50)
print("1. 🎯 EDAD ÓPTIMA: Los jugadores entre 24-28 años tienen el mayor valor")
print("2. ⚽ POSICIÓN IMPORTA: Los delanteros y mediocampistas dominan el mercado")
print("3. 📊 EFICIENCIA VARIABLE: No siempre más caro significa mejor rendimiento")
print("4. 🌍 DIVERSIDAD GLOBAL: El talento no conoce fronteras")

print("\n🎯 RECOMENDACIONES:")
print("-" * 50)
print("• PARA SCOUTS: Buscar talentos jóvenes antes de los 24 años")
print("• PARA DIRECTIVOS: Evaluar eficiencia, no solo valor absoluto")
print("• PARA ENTRENADORES: El rating promedio es mejor predictor que el precio")
print("• PARA INVERSORES: Los mercados emergentes ofrecen mejor relación calidad-precio")

print("\n✅ Análisis narrativo completado")

📖 STORYTELLING: ANÁLISIS DEL MERCADO DE FICHAJES

🎬 NARRATIVA: "La Revolución del Mercado de Fichajes"

CONTEXTO:
El fútbol moderno ha experimentado una inflación sin precedentes en los valores 
de mercado. Los equipos invierten cientos de millones buscando el éxito deportivo.

PREGUNTA CLAVE:
¿Qué factores realmente determinan el valor de un jugador?
¿Están los equipos invirtiendo de manera inteligente?

HALLAZGOS PRINCIPALES:


🔍 HALLAZGO 1: LA EDAD DORADA
--------------------------------------------------
Análisis de valor por grupo de edad:
  Jóvenes (18-23): 29.4 M€ promedio (n=60, rating=76.0)
  Prime (24-28): 32.0 M€ promedio (n=93, rating=76.1)
  Veteranos (29+): 26.1 M€ promedio (n=47, rating=78.9)



🔍 HALLAZGO 2: EL FACTOR POSICIÓN
--------------------------------------------------
Valor promedio por posición:
  Defensor: 25.7 ± 7.9 M€ (rating=71.6)
  Delantero: 34.5 ± 13.9 M€ (rating=81.8)
  Mediocampista: 31.7 ± 12.2 M€ (rating=79.5)
  Portero: 22.4 ± 7.5 M€ (rating=68.0)

🔍 HALLAZGO 3: LA BRECHA DE EFICIENCIA
--------------------------------------------------
Eficiencia por equipo (Rating/Valor):
  1. Betis: 34.70 (valor total: 439.1 M€)
  2. Espanyol: 34.33 (valor total: 378.4 M€)
  3. Athletic Bilbao: 33.51 (valor total: 711.6 M€)
  4. Real Sociedad: 29.04 (valor total: 441.4 M€)
  5. Villarreal: 28.85 (valor total: 522.9 M€)



🔍 HALLAZGO 4: EL MITO DE LA NACIONALIDAD
--------------------------------------------------
Valor promedio por nacionalidad (países con 5+ jugadores):
  México: 33.6 M€ promedio (n=6)
  Brasil: 33.0 M€ promedio (n=35)
  Italia: 31.2 M€ promedio (n=7)
  España: 30.7 M€ promedio (n=66)
  Argentina: 29.7 M€ promedio (n=22)

💡 INSIGHTS CLAVE:
--------------------------------------------------
1. 🎯 EDAD ÓPTIMA: Los jugadores entre 24-28 años tienen el mayor valor
2. ⚽ POSICIÓN IMPORTA: Los delanteros y mediocampistas dominan el mercado
3. 📊 EFICIENCIA VARIABLE: No siempre más caro significa mejor rendimiento
4. 🌍 DIVERSIDAD GLOBAL: El talento no conoce fronteras

🎯 RECOMENDACIONES:
--------------------------------------------------
• PARA SCOUTS: Buscar talentos jóvenes antes de los 24 años
• PARA DIRECTIVOS: Evaluar eficiencia, no solo valor absoluto
• PARA ENTRENADORES: El rating promedio es mejor predictor que el precio
• PARA INVERSORES: Los mercados emergentes ofrecen mejor relación c

## 🎯 Conclusiones y Resumen de la Semana 5

### Objetivos Alcanzados

En esta semana hemos dominado los fundamentos de la **visualización avanzada** y **presentación profesional** de datos en el contexto del fútbol. Los principales logros incluyen:

#### 1. **Visualización Interactiva**
- ✅ Creación de gráficos interactivos con Plotly
- ✅ Implementación de mapas geográficos para análisis global
- ✅ Desarrollo de visualizaciones temporales para tendencias
- ✅ Uso de matrices de correlación y heatmaps

#### 2. **Dashboard Ejecutivo**
- ✅ Diseño de paneles de control con KPIs clave
- ✅ Identificación automática de mejores jugadores
- ✅ Visualización de métricas financieras y deportivas
- ✅ Presentación clara de insights de negocio

#### 3. **Storytelling con Datos**
- ✅ Construcción de narrativas convincentes
- ✅ Análisis de mercado de fichajes con insights accionables
- ✅ Identificación de patrones y tendencias ocultas
- ✅ Formulación de recomendaciones estratégicas

### Conceptos Clave Aprendidos

1. **Principios de Visualización Efectiva**
   - Claridad sobre complejidad
   - Elección del tipo de gráfico correcto
   - Uso apropiado de colores y escalas

2. **Herramientas Avanzadas**
   - Plotly para interactividad
   - Seaborn para análisis estadístico
   - Pandas para manipulación de datos
   - Matplotlib para personalización

3. **Análisis de Negocio**
   - Eficiencia en inversiones deportivas
   - Identificación de oportunidades de mercado
   - Evaluación de rendimiento vs. costo

### Aplicaciones Prácticas

Los conocimientos adquiridos en esta semana son directamente aplicables a:

- **Análisis de scouting**: Identificación de talentos subestimados
- **Gestión financiera**: Optimización de presupuestos de fichajes
- **Estrategia deportiva**: Evaluación de rendimiento de plantillas
- **Comunicación ejecutiva**: Presentación de datos a stakeholders

### Preparación para el Bloque 2

Con una base sólida en visualización y presentación, estamos listos para avanzar al **Bloque 2: Modelado Predictivo**, donde aplicaremos:

- Machine Learning para predicción de rendimiento
- Modelos de regresión avanzada
- Algoritmos de clasificación
- Optimización de hiperparámetros

### Recursos Adicionales

Para profundizar en visualización avanzada:
- [Plotly Documentation](https://plotly.com/python/)
- [Seaborn Gallery](https://seaborn.pydata.org/examples/)
- [Storytelling with Data](https://www.storytellingwithdata.com/)

---

**¡Felicitaciones!** Has completado exitosamente la Semana 5 del Bloque 1. Los fundamentos de visualización y presentación que has dominado serán la base para crear insights impactantes en proyectos futuros de ciencia de datos aplicada al fútbol.

---

## 🏆 Ejercicio Práctico Final

### Desafío: Crear tu Propio Dashboard de Análisis

**Objetivo**: Aplicar todos los conceptos aprendidos para crear un dashboard personalizado.

### Instrucciones:

1. **Genera un nuevo dataset** con las siguientes características:
   - 100 jugadores de 5 ligas diferentes
   - Incluye variables económicas (salario, bonos, cláusula)
   - Añade métricas de rendimiento (partidos, goles, asistencias, tarjetas)
   - Incorpora datos temporales (2 temporadas)

2. **Crea 4 visualizaciones diferentes**:
   - Un gráfico de dispersión que muestre relación valor-rendimiento
   - Un mapa que muestre distribución geográfica del talento
   - Una serie temporal que muestre evolución del mercado
   - Un dashboard ejecutivo con 3 KPIs principales

3. **Desarrolla una narrativa** que responda:
   - ¿Qué liga tiene mejor relación calidad-precio?
   - ¿Cuál es el perfil del jugador más eficiente?
   - ¿Qué tendencias se observan en el mercado?

### Criterios de Evaluación:
- ✅ **Técnico**: Código limpio y funcional
- ✅ **Visual**: Gráficos claros y atractivos
- ✅ **Analítico**: Insights relevantes y accionables
- ✅ **Comunicativo**: Narrativa convincente y bien estructurada

### Tiempo Estimado: 2-3 horas

**¡Demuestra tu dominio en visualización avanzada!**

In [7]:
# 🚀 PLANTILLA PARA EJERCICIO PRÁCTICO
# Completa este código para crear tu dashboard personalizado

# Paso 1: Generar dataset personalizado (completa la función)
def generar_dataset_personalizado(n_jugadores=100, n_ligas=5):
    """
    Genera un dataset personalizado para el ejercicio final
    """
    # TODO: Implementar generación de datos
    # Incluir: nombre, liga, posición, edad, valor_mercado, salario, 
    # rendimiento_2023, rendimiento_2024, nacionalidad, etc.
    
    jugadores_data = []
    
    # Tu código aquí...
    
    return pd.DataFrame(jugadores_data)

# Paso 2: Crear visualizaciones (completa las funciones)
def crear_grafico_valor_rendimiento(df):
    """Gráfico de dispersión valor vs rendimiento"""
    # TODO: Crear gráfico interactivo con Plotly
    pass

def crear_mapa_geografico(df):
    """Mapa mundial del talento"""
    # TODO: Crear mapa con distribución geográfica
    pass

def crear_serie_temporal(df):
    """Evolución temporal del mercado"""
    # TODO: Crear serie temporal con tendencias
    pass

def crear_dashboard_ejecutivo(df):
    """Dashboard con KPIs principales"""
    # TODO: Crear dashboard con subplots
    pass

# Paso 3: Desarrollar narrativa
def analizar_narrativa(df):
    """
    Desarrolla insights y conclusiones del análisis
    """
    print("🎬 TU ANÁLISIS NARRATIVO")
    print("=" * 50)
    
    # TODO: Incluir análisis de:
    # - Mejor liga calidad-precio
    # - Perfil jugador más eficiente
    # - Tendencias del mercado
    
    pass

# Ejecutar ejercicio
print("🏆 INICIANDO EJERCICIO PRÁCTICO")
print("Completa las funciones anteriores para crear tu dashboard personalizado")
print("¡Demuestra tu dominio en visualización avanzada!")

# Descomenta estas líneas cuando hayas completado las funciones:
# df_ejercicio = generar_dataset_personalizado()
# crear_grafico_valor_rendimiento(df_ejercicio)
# crear_mapa_geografico(df_ejercicio)
# crear_serie_temporal(df_ejercicio)
# crear_dashboard_ejecutivo(df_ejercicio)
# analizar_narrativa(df_ejercicio)

🏆 INICIANDO EJERCICIO PRÁCTICO
Completa las funciones anteriores para crear tu dashboard personalizado
¡Demuestra tu dominio en visualización avanzada!
