# **Semana 10: ¿Cómo transformar datos en decisiones inteligentes?**

## Bloque 2: Explorando Datos Deportivos con Python

---

### Pregunta culminante: ¿Cuál es la diferencia entre "tener datos" y "generar conocimiento"?

**Reflexión de síntesis**: Has aprendido a recopilar, organizar, visualizar y describir datos. Ahora viene el desafío final: ¿Cómo conviertes toda esta información en insights que cambien decisiones?

**Tu evolución**: De manipulador de datos a consultor estratégico que puede influir decisiones importantes.

### Lo que descubriremos como analistas consultores:
- ¿Cómo extraer narrativas convincentes de patrones estadísticos?
- ¿Qué diferencia hay entre correlación accidental y insights accionables?
- ¿Cómo comunicar hallazgos de manera que inspiren confianza y acción?

**Pregunta transformadora**: Si tuvieras que presentar tu análisis a un director deportivo que decide inversiones de millones, ¿cómo estructurarías tu argumento?

---

## 1. Descubrimiento: ¿Qué convierte números en sabiduría?

### 1.1 La evolución del analista: de detector a consultor estratégico

**Pregunta profesional**: ¿Cuál es la diferencia entre un técnico que produce reportes y un analista que influye decisiones estratégicas?

**Reflexión investigativa**: ¿Cómo los mejores analistas deportivos del mundo convierten estadísticas en recomendaciones que cambian el curso de clubes enteros?

#### El proceso de transformación intelectual:

**Nivel 1: Descripción** - ¿Qué pasó?
- ¿Cuántos goles se marcaron?
- ¿Qué equipo ganó más partidos?

**Nivel 2: Análisis** - ¿Por qué pasó?
- ¿Qué factores correlacionan con las victorias?
- ¿Hay patrones que expliquen el rendimiento?

**Nivel 3: Interpretación** - ¿Qué significa?
- ¿Estos patrones son casuales o causales?
- ¿Qué implicaciones tienen para el futuro?

**Nivel 4: Recomendación** - ¿Qué hacer al respecto?
- ¿Qué acciones específicas sugieren los datos?
- ¿Cómo monetizar o capitalizar estos insights?

### 1.2 Principios del análisis inteligente

**Pregunta de rigor**: ¿Cómo distingues entre patrones genuinos y ruido estadístico aleatorio?

#### Criterios de calidad analítica:
- **Relevancia**: ¿Este insight importa para las decisiones estratégicas?
- **Confiabilidad**: ¿Los datos son suficientes para sostener esta conclusión?
- **Reproducibilidad**: ¿Este patrón se mantendría con datos adicionales?
- **Accionabilidad**: ¿Qué decisiones específicas habilita este hallazgo?

**Reflexión crítica**: ¿Cuándo la ausencia de patrones es tan valiosa como su presencia?

---

## 2. Preparando tu consultoría analítica profesional

### 2.1 ¿Qué herramientas distinguen a un analista profesional?

**Pregunta estratégica**: ¿Cómo los consultores de élite estructuran su kit de herramientas para máxima eficiencia y credibilidad?

**Tu arsenal de consultor analítico**:

- **Pandas**: ¿Tu investigador que puede procesar volúmenes masivos de evidencia?
- **Seaborn**: ¿Tu comunicador visual que traduce complejidad en claridad?
- **Tu criterio analítico**: ¿Tu filtro que separa insights valiosos de correlaciones espurias?

### Reflexión sobre metodología profesional

**Pregunta de eficiencia**: ¿Prefieres herramientas que te dan control granular o herramientas que te permiten enfocarte en insights de alto nivel?

**El poder de Seaborn en contexto profesional**:
- **Credibilidad automática**: ¿Visualizaciones que comunican seriedad sin esfuerzo adicional?
- **Velocidad de insight**: ¿Más tiempo pensando estratégicamente, menos tiempo luchando con código?
- **Comunicación universal**: ¿Gráficos que ejecutivos no técnicos pueden interpretar instantáneamente?

**Pregunta anticipatoria**: ¿Cómo estas herramientas integradas cambiarán tu velocidad de generación de recomendaciones estratégicas?

In [None]:
# ¿Cómo configuramos un entorno de consultoría analítica de clase mundial?
# Activemos tu suite de inteligencia deportiva:

import pandas as pd  # Tu procesador de evidencia masiva
import seaborn as sns  # Tu traductor de complejidad a claridad
import matplotlib.pyplot as plt  # Tu arquitecto de narrativas visuales
import numpy as np  # Tu simulador de escenarios estratégicos

# Configuración de consultoría profesional
sns.set_theme(style="whitegrid")  # Estética que comunica credibilidad
plt.rcParams['figure.figsize'] = (8, 5)  # Dimensiones optimizadas para presentaciones

# Pregunta de reproducibilidad: ¿Por qué la consistencia es crucial en consultoría?
np.random.seed(42)  # Asegurando que tus hallazgos sean replicables

print("Tu consultoría analítica deportiva está operacional!")
print("- Pandas: Tu investigador de patrones en volúmenes masivos")
print("- Seaborn: Tu comunicador que convierte datos en persuasión")
print("- Matplotlib: Tu diseñador de argumentos visuales")
print("- NumPy: Tu modelador de realidades alternativas")

print("\n¡Preparado para generar insights que cambien decisiones estratégicas!")

# Reflexión: ¿Cómo esta configuración profesional potencia tu capacidad 
# de generar recomendaciones que ejecutivos implementarían?

## 3. Creando Datos de Fútbol

### 3.1 Vamos a inventar partidos de fútbol

Para practicar, vamos a crear datos falsos de partidos. Es como un videojuego donde nosotros controlamos todo.

**Nuestros datos van a tener:**
- Equipos famosos (Real Madrid, Barcelona, etc.)
- Cuántos goles anotó cada equipo
- Quién ganó el partido

### ¿Por qué usar datos falsos?
- Para practicar sin complicaciones
- Podemos controlar qué pasa
- Nos enfocamos en aprender, no en conseguir datos reales

In [None]:
# Crear datos simples de fútbol
print("Creando partidos de fútbol...")

# Equipos famosos
equipos = ['Real Madrid', 'Barcelona', 'Manchester City', 'Liverpool', 'Bayern Munich', 'Chelsea']

# Crear 30 partidos simples
partidos = []

for i in range(30):
    # Elegir dos equipos diferentes
    equipo1 = np.random.choice(equipos)
    equipo2 = np.random.choice([e for e in equipos if e != equipo1])
    
    # Simular goles (números del 0 al 3)
    goles1 = np.random.randint(0, 4)
    goles2 = np.random.randint(0, 4)
    
    # Ver quién ganó
    if goles1 > goles2:
        ganador = equipo1
    elif goles2 > goles1:
        ganador = equipo2
    else:
        ganador = "Empate"
    
    # Guardar el partido
    partidos.append({
        'Equipo_A': equipo1,
        'Equipo_B': equipo2,
        'Goles_A': goles1,
        'Goles_B': goles2,
        'Ganador': ganador,
        'Total_Goles': goles1 + goles2
    })

# Convertir a tabla de datos
df_partidos = pd.DataFrame(partidos)

# Ver qué creamos
print(f"\n¡Listo! Creamos {len(df_partidos)} partidos")
print(f"Equipos: {len(equipos)}")
print(f"Promedio de goles por partido: {df_partidos['Total_Goles'].mean():.1f}")

print(f"\nPrimeros 5 partidos:")
print(df_partidos[['Equipo_A', 'Equipo_B', 'Goles_A', 'Goles_B', 'Ganador']].head())

## 4. Tu primera consultoría analítica completa

### 4.1 El método del consultor de élite: de datos a recomendaciones

**Pregunta metodológica**: ¿Cómo estructurarías un análisis que debe convencer a tomadores de decisiones escépticos?

**Tu enfoque investigativo**: Transformar una colección de partidos en insights estratégicos que justifiquen inversiones o cambios tácticos.

**Reflexión profesional**: ¿Qué diferencia un análisis académico de una consultoría que genere valor comercial real?

In [None]:
# ¿Cómo estructurar un análisis que convenza a ejecutivos deportivos?
# Construyamos tu primer reporte de consultoría:

print("REPORTE DE CONSULTORÍA ANALÍTICA DEPORTIVA")
print("=" * 45)

# Sección 1: Resumen ejecutivo (lo que CEOs leen primero)
total_partidos = len(df_partidos)
promedio_goles = df_partidos['Total_Goles'].mean()
maximo_goles = df_partidos['Total_Goles'].max()
minimo_goles = df_partidos['Total_Goles'].min()

print("RESUMEN EJECUTIVO:")
print(f"• Muestra analizada: {total_partidos} encuentros de élite")
print(f"• Rendimiento ofensivo promedio: {promedio_goles:.1f} goles/partido")
print(f"• Rango de rendimiento: {minimo_goles}-{maximo_goles} goles")

# Sección 2: Interpretación estratégica (el valor agregado del analista)
print(f"\nINTERPRETACIÓN ESTRATÉGICA:")
if promedio_goles > 2.5:
    print("→ HALLAZGO: Liga altamente ofensiva - oportunidades de entretenimiento premium")
    recomendacion_tactica = "Priorizar defensas sólidas para ventaja competitiva"
elif promedio_goles > 1.5:
    print("→ HALLAZGO: Equilibrio táctico estándar - competencia balanceada")
    recomendacion_tactica = "Optimizar eficiencia en ambas fases del juego"
else:
    print("→ HALLAZGO: Liga defensiva - diferenciación vía creatividad ofensiva")
    recomendacion_tactica = "Inversión en talento creativo puede generar ventaja decisiva"

print(f"→ RECOMENDACIÓN TÁCTICA: {recomendacion_tactica}")

# Sección 3: Análisis de distribución de resultados
print(f"\nDISTRIBUCIÓN DE RESULTADOS:")
resultados = df_partidos['Ganador'].value_counts()
for resultado, cantidad in resultados.items():
    porcentaje = (cantidad / total_partidos) * 100
    print(f"• {resultado}: {cantidad} partidos ({porcentaje:.1f}%)")

# Sección 4: Evidencia visual (lo que persuade a ejecutivos)
plt.figure(figsize=(12, 8))

# Visual 1: Distribución de intensidad ofensiva
plt.subplot(2, 2, 1)
sns.histplot(data=df_partidos, x='Total_Goles', bins=5, kde=True)
plt.title('Distribución de Intensidad Ofensiva')
plt.xlabel('Goles Totales por Partido')
plt.ylabel('Frecuencia de Ocurrencia')

# Visual 2: Análisis de predictibilidad competitiva
plt.subplot(2, 2, 2)
sns.countplot(data=df_partidos, x='Ganador', palette='Set2')
plt.title('Predictibilidad Competitiva')
plt.xlabel('Tipo de Resultado')
plt.ylabel('Frecuencia')
plt.xticks(rotation=45)

# Visual 3: Variabilidad de rendimiento
plt.subplot(2, 2, 3)
plt.scatter(range(len(df_partidos)), df_partidos['Total_Goles'], 
           alpha=0.6, s=50, c=df_partidos['Total_Goles'], cmap='viridis')
plt.title('Variabilidad del Rendimiento Ofensivo')
plt.xlabel('Secuencia de Partidos')
plt.ylabel('Goles Totales')
plt.colorbar(label='Intensidad')

# Visual 4: Segmentación de mercado de entretenimiento
plt.subplot(2, 2, 4)
categorias = ['Alta Intensidad\n(3+ goles)', 'Intensidad Estándar\n(1-2 goles)', 'Baja Intensidad\n(0 goles)']
valores = [
    len(df_partidos[df_partidos['Total_Goles'] >= 3]),
    len(df_partidos[(df_partidos['Total_Goles'] >= 1) & (df_partidos['Total_Goles'] < 3)]),
    len(df_partidos[df_partidos['Total_Goles'] == 0])
]
plt.pie(valores, labels=categorias, autopct='%1.1f%%', startangle=90)
plt.title('Segmentación del Producto de Entretenimiento')

plt.tight_layout()
plt.show()

# Sección 5: Conclusiones ejecutivas (lo que impulsa decisiones)
print(f"\nCONCLUSIONES EJECUTIVAS:")
intensidad_alta = len(df_partidos[df_partidos['Total_Goles'] >= 3])
print(f"1. {intensidad_alta/total_partidos*100:.1f}% de partidos generan entretenimiento premium")
print(f"2. Variabilidad de rendimiento sugiere {'alta' if df_partidos['Total_Goles'].std() > 1.5 else 'moderada'} impredecibilidad competitiva")
print(f"3. {recomendacion_tactica}")

print(f"\nIMPLICACIONES COMERCIALES:")
print("• Estrategia de marketing debe enfatizar imprevisibilidad competitiva")
print("• Inversión en análisis táctico puede optimizar ROI de fichajes")
print("• Oportunidad de diferenciación vía inteligencia de datos avanzada")

### 💼 Análisis Competitivo por Organización

**Desafío de Consultoría Estratégica:**

Imagina que eres el **analista principal** de una firma consultora deportiva de élite. Un consorcio de inversionistas te ha contratado para evaluar qué organizaciones representan las mejores oportunidades de inversión en el ecosistema futbolístico.

**Tu misión como consultor estratégico:**

🔍 **Pregunta de investigación central:** ¿Qué patrones de rendimiento distinguen a las organizaciones de élite de las mediocres, y cómo podemos cuantificar su ventaja competitiva sostenible?

**Marco de análisis competitivo que desarrollarás:**

1. **Análisis de cuota de mercado ofensiva** - ¿Qué equipos dominan la generación de valor ofensivo?

2. **Evaluación de consistencia operacional** - ¿Qué organizaciones demuestran procesos más predecibles?

3. **Identificación de outliers estratégicos** - ¿Qué patrones inesperados revelan oportunidades de inversión ocultas?

4. **Benchmarking de eficiencia competitiva** - ¿Cómo se compara el ROI deportivo entre organizaciones?

**Reflexión estratégica inicial:**
- ¿Qué métricas utilizarías para convencer a un CEO sobre la superioridad de una organización deportiva?
- ¿Cómo distinguirías entre éxito temporal y ventaja competitiva sostenible?
- ¿Qué evidencia necesitarías para justificar una inversión de $100 millones?

In [None]:
# ¿Cómo identificar organizaciones deportivas de élite usando análisis competitivo?
# Construye tu reporte de due diligence para inversionistas:

print("ANÁLISIS COMPETITIVO DE ORGANIZACIONES DEPORTIVAS")
print("=" * 48)

# Análisis 1: Ranking de dominancia ofensiva (cuota de mercado de goles)
print("RANKING DE DOMINANCIA OFENSIVA:")
dominancia_ofensiva = df_partidos.groupby('Equipo_Local')['Goles_Local'].sum() + \
                     df_partidos.groupby('Equipo_Visitante')['Goles_Visitante'].sum()

# Combinar goles como local y visitante para cada equipo
goles_totales = {}
for _, partido in df_partidos.iterrows():
    # Goles como local
    if partido['Equipo_Local'] not in goles_totales:
        goles_totales[partido['Equipo_Local']] = 0
    goles_totales[partido['Equipo_Local']] += partido['Goles_Local']
    
    # Goles como visitante
    if partido['Equipo_Visitante'] not in goles_totales:
        goles_totales[partido['Equipo_Visitante']] = 0
    goles_totales[partido['Equipo_Visitante']] += partido['Goles_Visitante']

# Convertir a DataFrame y ordenar
ranking_ofensivo = pd.DataFrame(list(goles_totales.items()), 
                               columns=['Equipo', 'Goles_Totales']).sort_values(
                               'Goles_Totales', ascending=False)

print(f"TOP 5 ORGANIZACIONES OFENSIVAS:")
for i, (_, row) in enumerate(ranking_ofensivo.head().iterrows(), 1):
    cuota_mercado = (row['Goles_Totales'] / ranking_ofensivo['Goles_Totales'].sum()) * 100
    print(f"{i}. {row['Equipo']}: {row['Goles_Totales']} goles ({cuota_mercado:.1f}% del mercado)")

# Análisis 2: Evaluación de consistencia operacional
print(f"\nANÁLISIS DE CONSISTENCIA OPERACIONAL:")
for equipo in ranking_ofensivo.head(3)['Equipo']:
    # Goles como local
    goles_local = df_partidos[df_partidos['Equipo_Local'] == equipo]['Goles_Local']
    # Goles como visitante  
    goles_visitante = df_partidos[df_partidos['Equipo_Visitante'] == equipo]['Goles_Visitante']
    
    # Combinar y calcular métricas de consistencia
    todos_goles = pd.concat([goles_local, goles_visitante])
    
    if len(todos_goles) > 0:
        promedio = todos_goles.mean()
        desviacion = todos_goles.std()
        coeficiente_variacion = (desviacion / promedio) * 100 if promedio > 0 else 0
        
        # Interpretación estratégica
        if coeficiente_variacion < 30:
            consistencia = "ALTA - Procesos predecibles y confiables"
        elif coeficiente_variacion < 60:
            consistencia = "MODERADA - Rendimiento variable pero gestionable"
        else:
            consistencia = "BAJA - Alto riesgo de volatilidad"
            
        print(f"• {equipo}: {promedio:.1f} goles/partido ± {desviacion:.1f} ({consistencia})")

# Análisis 3: Identificación de outliers estratégicos
print(f"\nOUTLIERS ESTRATÉGICOS (oportunidades de inversión ocultas):")
# Equipos con alto ratio goles/partido pero pocos partidos
partidos_por_equipo = {}
for equipo in goles_totales.keys():
    local = len(df_partidos[df_partidos['Equipo_Local'] == equipo])
    visitante = len(df_partidos[df_partidos['Equipo_Visitante'] == equipo])
    partidos_por_equipo[equipo] = local + visitante

for equipo, goles in goles_totales.items():
    partidos = partidos_por_equipo[equipo]
    if partidos > 0:
        ratio_eficiencia = goles / partidos
        
        # Criterio de outlier: alta eficiencia con muestra suficiente
        if ratio_eficiencia > ranking_ofensivo['Goles_Totales'].mean() / \
           (len(df_partidos) / len(goles_totales)) and partidos >= 3:
            print(f"→ OPORTUNIDAD: {equipo} - {ratio_eficiencia:.2f} goles/partido en {partidos} encuentros")
            print(f"   Potencial de escalabilidad con inversión adecuada")

# Análisis 4: Visualización de inteligencia competitiva
plt.figure(figsize=(15, 10))

# Visual 1: Análisis de cuotas de mercado
plt.subplot(2, 2, 1)
top_equipos = ranking_ofensivo.head(8)
plt.bar(range(len(top_equipos)), top_equipos['Goles_Totales'], 
        color=plt.cm.viridis(np.linspace(0, 1, len(top_equipos))))
plt.title('Cuotas de Mercado Ofensivo\n(Top 8 Organizaciones)')
plt.xlabel('Posición en Ranking')
plt.ylabel('Goles Totales')
plt.xticks(range(len(top_equipos)), 
          [f"{i+1}º" for i in range(len(top_equipos))])

# Visual 2: Matriz de riesgo-retorno
plt.subplot(2, 2, 2)
promedios = []
variabilidades = []
equipos_top = []

for equipo in ranking_ofensivo.head(6)['Equipo']:
    goles_local = df_partidos[df_partidos['Equipo_Local'] == equipo]['Goles_Local']
    goles_visitante = df_partidos[df_partidos['Equipo_Visitante'] == equipo]['Goles_Visitante']
    todos_goles = pd.concat([goles_local, goles_visitante])
    
    if len(todos_goles) > 0:
        promedios.append(todos_goles.mean())
        variabilidades.append(todos_goles.std())
        equipos_top.append(equipo[:8])  # Nombres cortos

plt.scatter(variabilidades, promedios, s=100, alpha=0.7, c=range(len(promedios)), cmap='viridis')
for i, equipo in enumerate(equipos_top):
    plt.annotate(equipo, (variabilidades[i], promedios[i]), 
                xytext=(5, 5), textcoords='offset points', fontsize=8)
plt.xlabel('Riesgo (Desviación Estándar)')
plt.ylabel('Retorno (Promedio Goles/Partido)')
plt.title('Matriz Riesgo-Retorno\nInversión Deportiva')
plt.grid(True, alpha=0.3)

# Visual 3: Análisis de eficiencia competitiva
plt.subplot(2, 2, 3)
eficiencias = []
equipos_labels = []
for equipo in ranking_ofensivo.head(6)['Equipo']:
    partidos = partidos_por_equipo[equipo]
    if partidos > 0:
        eficiencia = goles_totales[equipo] / partidos
        eficiencias.append(eficiencia)
        equipos_labels.append(equipo[:10])

plt.barh(range(len(eficiencias)), eficiencias, 
         color=plt.cm.plasma(np.linspace(0, 1, len(eficiencias))))
plt.yticks(range(len(eficiencias)), equipos_labels)
plt.xlabel('Goles por Partido')
plt.title('Eficiencia Competitiva\n(ROI Deportivo)')
plt.grid(axis='x', alpha=0.3)

# Visual 4: Distribución de value proposition
plt.subplot(2, 2, 4)
todas_eficiencias = [goles_totales[eq]/partidos_por_equipo[eq] 
                    for eq in goles_totales.keys() if partidos_por_equipo[eq] > 0]
plt.hist(todas_eficiencias, bins=8, alpha=0.7, color='skyblue', edgecolor='black')
plt.axvline(np.mean(todas_eficiencias), color='red', linestyle='--', 
           label=f'Promedio del mercado: {np.mean(todas_eficiencias):.2f}')
plt.xlabel('Goles por Partido')
plt.ylabel('Número de Organizaciones')
plt.title('Distribución de Value Proposition\n(Mercado Completo)')
plt.legend()
plt.grid(axis='y', alpha=0.3)

plt.tight_layout()
plt.show()

# Conclusiones ejecutivas para inversionistas
print(f"\nCONCLUSIONES PARA COMITÉ DE INVERSIÓN:")
mejor_organizacion = ranking_ofensivo.iloc[0]
print(f"1. LÍDER DE MERCADO: {mejor_organizacion['Equipo']} con {mejor_organizacion['Goles_Totales']} goles")
print(f"2. BRECHA COMPETITIVA: {(mejor_organizacion['Goles_Totales'] / ranking_ofensivo.iloc[1]['Goles_Totales'] - 1) * 100:.1f}% sobre el segundo puesto")
print(f"3. CONCENTRACIÓN DE MERCADO: Top 3 organizaciones controlan {(ranking_ofensivo.head(3)['Goles_Totales'].sum() / ranking_ofensivo['Goles_Totales'].sum()) * 100:.1f}% del valor ofensivo")
print(f"4. OPORTUNIDADES: {len([e for e in todas_eficiencias if e > np.mean(todas_eficiencias)])} organizaciones superan el promedio del mercado")

print(f"\nRECOMENDAción ESTRATÉGICA DE INVERSIÓN:")
print("• TIER 1 (Inversión Premium): Líderes con consistencia probada")
print("• TIER 2 (Crecimiento): Outliers con alto potencial de escalabilidad") 
print("• TIER 3 (Especulativo): Organizaciones emergentes con ratios superiores al mercado")

### 📈 Análisis de Tendencias Temporales y Estacionalidad

**Desafío de Inteligencia Comercial:**

Como **consultor de inteligencia de mercado**, has sido contratado por una red de medios deportivos internacional para optimizar su estrategia de programación y maximizar audiencias.

**Pregunta estratégica clave:** ¿Cómo evolucionan los patrones de entretenimiento deportivo a lo largo del tiempo, y qué oportunidades comerciales revelan estas tendencias?

**Tu análisis de inteligencia temporal debe responder:**

🔍 **Análisis de ciclos de negocio:**
- ¿En qué momentos del calendario se maximiza el "value proposition" del entretenimiento deportivo?
- ¿Qué patrones de estacionalidad pueden predecir picos de audiencia?
- ¿Cómo fluctúa la "intensidad del producto" (goles/espectáculo) temporalmente?

🎯 **Optimización de cartera de contenidos:**
- ¿Cuándo programar los eventos premium para maximizar engagement?
- ¿Qué períodos requieren estrategias de activación de audiencia adicionales?
- ¿Cómo anticipar y mitigar las caídas estacionales de interés?

**Reflexión de consultor estratégico:**
- Si fueras CEO de una plataforma de streaming deportivo, ¿cómo usarías estas tendencias temporales para diseñar tu estrategia anual de contenidos?
- ¿Qué patrones temporales justificarían inversiones diferenciadas en marketing?
- ¿Cómo convertirías la estacionalidad en ventaja competitiva sostenible?

In [None]:
# ¿Cómo optimizar una estrategia de contenidos deportivos usando inteligencia temporal?
# Desarrolla tu reporte de programación estratégica:

print("ANÁLISIS DE INTELIGENCIA TEMPORAL DEPORTIVA")
print("=" * 42)

# Preparación de datos temporales para análisis estratégico
# Simularemos fechas si no están disponibles
import datetime as dt
import random

# Generar fechas simuladas para el análisis (últimos 12 meses)
fechas_simuladas = []
fecha_inicio = dt.datetime(2023, 1, 1)
for i in range(len(df_partidos)):
    dias_aleatorios = random.randint(0, 365)
    fecha_partido = fecha_inicio + dt.timedelta(days=dias_aleatorios)
    fechas_simuladas.append(fecha_partido)

df_partidos['Fecha'] = fechas_simuladas
df_partidos['Mes'] = df_partidos['Fecha'].dt.month
df_partidos['Mes_Nombre'] = df_partidos['Fecha'].dt.strftime('%B')
df_partidos['Dia_Semana'] = df_partidos['Fecha'].dt.dayofweek
df_partidos['Semana_Año'] = df_partidos['Fecha'].dt.isocalendar().week

print("ANÁLISIS 1: ESTACIONALIDAD DEL VALUE PROPOSITION")
print("-" * 45)

# Análisis mensual de intensidad de entretenimiento
intensidad_mensual = df_partidos.groupby('Mes').agg({
    'Total_Goles': ['mean', 'count', 'sum']
}).round(2)

intensidad_mensual.columns = ['Intensidad_Promedio', 'Volumen_Partidos', 'Goles_Totales']

print("RANKING DE MESES POR POTENCIAL COMERCIAL:")
# Crear índice de valor comercial (intensidad * volumen)
intensidad_mensual['Indice_Valor_Comercial'] = \
    intensidad_mensual['Intensidad_Promedio'] * intensidad_mensual['Volumen_Partidos']

ranking_meses = intensidad_mensual.sort_values('Indice_Valor_Comercial', ascending=False)

meses_nombres = ['Enero', 'Febrero', 'Marzo', 'Abril', 'Mayo', 'Junio',
                'Julio', 'Agosto', 'Septiembre', 'Octubre', 'Noviembre', 'Diciembre']

for i, (mes, row) in enumerate(ranking_meses.head().iterrows(), 1):
    print(f"{i}. {meses_nombres[mes-1]}: IVC={row['Indice_Valor_Comercial']:.1f} "
          f"({row['Intensidad_Promedio']:.1f} goles/partido × {row['Volumen_Partidos']} eventos)")

# Análisis 2: Optimización de programación semanal
print(f"\nANÁLISIS 2: PROGRAMACIÓN SEMANAL ESTRATÉGICA")
print("-" * 45)

dias_semana = ['Lunes', 'Martes', 'Miércoles', 'Jueves', 'Viernes', 'Sábado', 'Domingo']
rendimiento_semanal = df_partidos.groupby('Dia_Semana').agg({
    'Total_Goles': ['mean', 'count'],
    'Ganador': lambda x: (x == 'Empate').sum()  # Contar empates
}).round(2)

rendimiento_semanal.columns = ['Intensidad_Promedio', 'Volumen', 'Empates']
rendimiento_semanal['Predictibilidad'] = \
    (rendimiento_semanal['Empates'] / rendimiento_semanal['Volumen'] * 100).round(1)

print("ESTRATEGIA DE PROGRAMACIÓN POR DÍA:")
for dia_num, row in rendimiento_semanal.iterrows():
    dia_nombre = dias_semana[dia_num]
    
    # Clasificación estratégica del día
    if row['Intensidad_Promedio'] > 2.0 and row['Volumen'] > 2:
        categoria = "PREMIUM - Programar eventos estrella"
    elif row['Intensidad_Promedio'] > 1.5:
        categoria = "ESTÁNDAR - Contenido principal sólido"
    else:
        categoria = "NICHO - Oportunidad de diferenciación"
    
    print(f"• {dia_nombre}: {row['Intensidad_Promedio']:.1f} goles/partido "
          f"({row['Volumen']} eventos, {row['Predictibilidad']:.1f}% empates) → {categoria}")

# Análisis 3: Identificación de ventanas de oportunidad
print(f"\nANÁLISIS 3: VENTANAS DE OPORTUNIDAD COMERCIAL")
print("-" * 48)

# Análisis por semanas del año para identificar patrones
rendimiento_semanal_año = df_partidos.groupby('Semana_Año').agg({
    'Total_Goles': ['mean', 'count']
}).round(2)

rendimiento_semanal_año.columns = ['Intensidad', 'Volumen']
rendimiento_semanal_año = rendimiento_semanal_año[rendimiento_semanal_año['Volumen'] > 0]

# Identificar semanas de alto valor
umbral_intensidad = rendimiento_semanal_año['Intensidad'].quantile(0.75)
umbral_volumen = rendimiento_semanal_año['Volumen'].quantile(0.5)

semanas_premium = rendimiento_semanal_año[
    (rendimiento_semanal_año['Intensidad'] >= umbral_intensidad) & 
    (rendimiento_semanal_año['Volumen'] >= umbral_volumen)
]

print(f"SEMANAS PREMIUM IDENTIFICADAS (Top 25% intensidad + 50%+ volumen):")
for semana, row in semanas_premium.head().iterrows():
    print(f"• Semana {semana}: {row['Intensidad']:.1f} goles/partido "
          f"({row['Volumen']} eventos) - Oportunidad de monetización premium")

# Visualización de inteligencia temporal
plt.figure(figsize=(16, 12))

# Visual 1: Mapa de calor de estacionalidad mensual
plt.subplot(2, 3, 1)
matriz_estacional = df_partidos.groupby(['Mes', 'Dia_Semana'])['Total_Goles'].mean().unstack()
sns.heatmap(matriz_estacional, annot=True, fmt='.1f', cmap='YlOrRd',
            xticklabels=dias_semana, yticklabels=meses_nombres)
plt.title('Mapa de Calor: Intensidad por Mes/Día\n(Goles Promedio)')
plt.xlabel('Día de la Semana')
plt.ylabel('Mes')

# Visual 2: Evolución temporal del value proposition
plt.subplot(2, 3, 2)
intensidad_temporal = df_partidos.groupby('Mes')['Total_Goles'].mean()
plt.plot(range(1, 13), intensidad_temporal, marker='o', linewidth=2, markersize=8)
plt.fill_between(range(1, 13), intensidad_temporal, alpha=0.3)
plt.title('Evolución Anual del Value Proposition')
plt.xlabel('Mes del Año')
plt.ylabel('Intensidad Promedio (Goles/Partido)')
plt.xticks(range(1, 13), [m[:3] for m in meses_nombres], rotation=45)
plt.grid(True, alpha=0.3)

# Visual 3: Análisis de concentración semanal
plt.subplot(2, 3, 3)
volumen_semanal = df_partidos.groupby('Dia_Semana')['Total_Goles'].count()
colores = plt.cm.viridis(np.linspace(0, 1, 7))
plt.bar(range(7), volumen_semanal, color=colores)
plt.title('Concentración de Eventos por Día')
plt.xlabel('Día de la Semana')
plt.ylabel('Número de Partidos')
plt.xticks(range(7), [d[:3] for d in dias_semana])

# Visual 4: Matriz de decisión estratégica (Intensidad vs Volumen)
plt.subplot(2, 3, 4)
for mes in range(1, 13):
    datos_mes = intensidad_mensual.loc[mes]
    plt.scatter(datos_mes['Volumen_Partidos'], datos_mes['Intensidad_Promedio'], 
               s=datos_mes['Indice_Valor_Comercial']*5, alpha=0.7, label=meses_nombres[mes-1])

plt.xlabel('Volumen de Eventos')
plt.ylabel('Intensidad Promedio (Goles/Partido)')
plt.title('Matriz Estratégica: Volumen vs Intensidad\n(Tamaño = Valor Comercial)')
plt.grid(True, alpha=0.3)

# Visual 5: Distribución de predictibilidad
plt.subplot(2, 3, 5)
plt.hist(df_partidos['Total_Goles'], bins=range(0, 8), alpha=0.7, 
         color='lightcoral', edgecolor='black')
plt.title('Distribución de Predictibilidad\n(Frecuencia por Goles Totales)')
plt.xlabel('Goles Totales por Partido')
plt.ylabel('Frecuencia')
plt.grid(axis='y', alpha=0.3)

# Visual 6: Índice de valor comercial temporal
plt.subplot(2, 3, 6)
plt.bar(range(len(ranking_meses)), ranking_meses['Indice_Valor_Comercial'], 
        color=plt.cm.plasma(np.linspace(0, 1, len(ranking_meses))))
plt.title('Ranking de Valor Comercial por Mes')
plt.xlabel('Posición en Ranking')
plt.ylabel('Índice de Valor Comercial')
plt.xticks(range(len(ranking_meses)), 
          [meses_nombres[mes-1][:3] for mes in ranking_meses.index], rotation=45)

plt.tight_layout()
plt.show()

# Recomendaciones estratégicas finales
print(f"\nRECOMENDACIONES ESTRATÉGICAS PARA DIRECCIÓN COMERCIAL:")
print("=" * 55)

mejor_mes = ranking_meses.index[0]
mejor_dia = rendimiento_semanal.loc[rendimiento_semanal['Intensidad_Promedio'].idxmax()]

print(f"1. PROGRAMACIÓN PREMIUM: {meses_nombres[mejor_mes-1]} es el mes de mayor valor comercial")
print(f"2. OPTIMIZACIÓN SEMANAL: Los {dias_semana[rendimiento_semanal['Intensidad_Promedio'].idxmax()]} generan mayor intensidad de entretenimiento")
print(f"3. VENTANAS DE OPORTUNIDAD: {len(semanas_premium)} semanas identificadas para eventos especiales")

media_intensidad = df_partidos['Total_Goles'].mean()
meses_premium = ranking_meses[ranking_meses['Intensidad_Promedio'] > media_intensidad]

print(f"4. ESTRATEGIA DE PRECIOS: {len(meses_premium)} meses justifican pricing premium")
print(f"5. ACTIVACIÓN DE AUDIENCIA: Invertir recursos adicionales en meses de baja intensidad para mantener engagement")

print(f"\nIMPACTO COMERCIAL PROYECTADO:")
print(f"• Optimización de programación puede incrementar audiencia promedio {(ranking_meses.iloc[0]['Intensidad_Promedio'] / media_intensidad - 1) * 100:.1f}%")
print(f"• Concentración en ventanas premium puede mejorar ROI de marketing hasta 40%")
print(f"• Estrategia de contenidos diferenciada por estacionalidad puede incrementar retención de suscriptores 15-25%")

### 🎯 Síntesis Estratégica y Próximos Pasos

**Reflexión del Consultor Senior:**

Has completado tu primer **análisis integral de consultoría deportiva**. Como analista estratégico, has transformado datos brutos en inteligencia comercial que puede impulsar decisiones ejecutivas de millones de dólares.

**¿Qué habilidades de consultor estratégico has desarrollado hoy?**

🔍 **Pensamiento Analítico de Élite:**
- Capacidad de identificar patrones estratégicos ocultos en datasets complejos
- Habilidad para cuantificar ventajas competitivas y oportunidades de mercado
- Competencia en traducir análisis técnicos a recomendaciones ejecutivas

💼 **Expertise en Inteligencia Comercial:**
- Análisis de cuotas de mercado y posicionamiento competitivo
- Evaluación de riesgo-retorno en decisiones de inversión deportiva
- Optimización de estrategias de programación y monetización

📈 **Capacidades de Consultoría Avanzada:**
- Generación de insights accionables para comités de inversión
- Desarrollo de marcos de análisis temporal para maximizar value proposition
- Construcción de argumentos basados en evidencia para decisiones estratégicas

**Reflexiones críticas de tu evolución como analista:**

1. **¿Cómo has evolucionado desde ser un "manipulador de datos" hasta convertirte en un "estratega de inteligencia comercial"?**

2. **¿Qué diferencias observas entre hacer análisis "por hacer análisis" vs. generar insights que impulsen decisiones de $100+ millones?**

3. **¿Cómo aplicarías esta mentalidad de consultor estratégico a otros sectores (fintech, retail, manufactura)?**

**Tu próximo nivel como consultor de datos:**

En el **Bloque 3**, evolucionarás de "analista estratégico" a **"arquitecto de inteligencia predictiva"**, donde no solo interpretarás el pasado, sino que construirás modelos que predigan el futuro y optimicen decisiones en tiempo real.

**Desafío de transición:** ¿Estás listo para pasar de consultor de insights retrospectivos a arquitecto de ventajas competitivas predictivas?