# FASE 1: Análisis Jerárquico - ACTUALIZADO
## Streaming Platform - Content Library & User Navigation

**Objetivo:** Analizar la estructura jerárquica del contenido y la navegación de usuarios para optimizar la organización de la biblioteca.

**Datos:** Datos reales de la carpeta `analyst`:
- `integrated_data.csv` - Datos principales con fechas, países, criptomonedas, interés
- `country_aggregated.csv` - Datos agregados por país y criptomoneda
- `trends_enriched.csv` - Datos de tendencias por fecha y país

**Adaptación:** Criptomonedas → Categorías de contenido de streaming
- Bitcoin → Drama
- Ethereum → Comedy
- BNB → Action
- Solana → Documentary
- Tether → Romance

**Audiencia:** Equipo de producto y UX
**Acción:** Reorganizar biblioteca de contenido y mejorar navegación
**Formato:** Presentación técnica (máximo 8 slides)

**NOTA:** Esta versión usa solo Python estándar para máxima compatibilidad.

In [1]:
# ======================================================================
# CELDA 1: Imports y configuración (solo Python estándar)
# ======================================================================

import csv
import json
import os
import random
import math
from collections import defaultdict, Counter
from datetime import datetime

print("✅ Imports cargados (solo Python estándar)")
print("✅ Listo para análisis jerárquico con datos reales")

✅ Imports cargados (solo Python estándar)
✅ Listo para análisis jerárquico con datos reales


In [3]:
# ======================================================================
# CELDA 2: Mapeo de datos y configuración
# ======================================================================

# Mapeo de criptomonedas a categorías de contenido
crypto_to_content = {
    'Bitcoin': 'Drama',
    'Ethereum': 'Comedy', 
    'BNB': 'Action',
    'Solana': 'Documentary',
    'Tether': 'Romance'
}

# Mapeo de países a regiones de mercado
country_to_region = {
    'US': 'North America',
    'CN': 'Asia',
    'JP': 'Asia',
    'DE': 'Europe',
    'GB': 'Europe',
    'IN': 'Asia',
    'BR': 'South America',
    'CA': 'North America',
    'AU': 'Oceania',
    'KR': 'Asia'
}

print("Mapeo de datos para análisis jerárquico:")
print("Criptomonedas → Contenido:")
for crypto, content in crypto_to_content.items():
    print(f"  {crypto} → {content}")
print()
print("Países → Regiones de Mercado:")
for country, region in country_to_region.items():
    print(f"  {country} → {region}")

Mapeo de datos para análisis jerárquico:
Criptomonedas → Contenido:
  Bitcoin → Drama
  Ethereum → Comedy
  BNB → Action
  Solana → Documentary
  Tether → Romance

Países → Regiones de Mercado:
  US → North America
  CN → Asia
  JP → Asia
  DE → Europe
  GB → Europe
  IN → Asia
  BR → South America
  CA → North America
  AU → Oceania
  KR → Asia


In [4]:
# ======================================================================
# CELDA 3: Carga de datos desde la carpeta analyst
# ======================================================================

def load_analyst_data():
    """Cargar datos desde los archivos de la carpeta analyst"""
    
    # 1. Cargar datos integrados
    integrated_data = []
    try:
        with open('analyst/integrated_data.csv', 'r', encoding='utf-8') as file:
            reader = csv.DictReader(file)
            for row in reader:
                if row['crypto'] in crypto_to_content:
                    integrated_data.append({
                        'date': row['Date'],
                        'country': row['country'],
                        'country_code': row['country_code'],
                        'crypto': row['crypto'],
                        'content_category': crypto_to_content[row['crypto']],
                        'interest': float(row['interest']),
                        'region': country_to_region.get(row['country_code'], 'Other'),
                        'close_price': float(row['Close']),
                        'volume': float(row['Volume']),
                        'returns': float(row['returns']),
                        'volatility_7d': float(row['volatility_7d'])
                    })
    except Exception as e:
        print(f"Error cargando integrated_data.csv: {e}")
    
    # 2. Cargar datos agregados por país
    country_aggregated = []
    try:
        with open('analyst/country_aggregated.csv', 'r', encoding='utf-8') as file:
            reader = csv.DictReader(file)
            for row in reader:
                if row['crypto'] in crypto_to_content:
                    country_aggregated.append({
                        'country_code': row['country_code'],
                        'country_name': row['name'],
                        'crypto': row['crypto'],
                        'content_category': crypto_to_content[row['crypto']],
                        'interest_mean': float(row['interest_mean']),
                        'interest_max': float(row['interest_max']),
                        'volatility_7d_mean': float(row['volatility_7d_mean']),
                        'close_mean': float(row['Close_mean']),
                        'region': country_to_region.get(row['country_code'], 'Other')
                    })
    except Exception as e:
        print(f"Error cargando country_aggregated.csv: {e}")
    
    # 3. Cargar datos de tendencias
    trends_data = []
    try:
        with open('analyst/trends_enriched.csv', 'r', encoding='utf-8') as file:
            reader = csv.DictReader(file)
            for row in reader:
                if row['keyword'] in crypto_to_content:
                    trends_data.append({
                        'date': row['date'],
                        'country': row['country'],
                        'country_code': row['country_code'],
                        'keyword': row['keyword'],
                        'content_category': crypto_to_content[row['keyword']],
                        'interest': float(row['interest']),
                        'region': country_to_region.get(row['country_code'], 'Other')
                    })
    except Exception as e:
        print(f"Error cargando trends_enriched.csv: {e}")
    
    return integrated_data, country_aggregated, trends_data

# Cargar datos
print("📊 CARGANDO DATOS DESDE LA CARPETA ANALYST...")
print("="*60)
integrated_data, country_aggregated, trends_data = load_analyst_data()

if integrated_data and country_aggregated and trends_data:
    print(f"\n📊 Resumen de datos cargados:")
    print(f"  Datos integrados: {len(integrated_data)} registros")
    print(f"  Datos agregados por país: {len(country_aggregated)} registros")
    print(f"  Datos de tendencias: {len(trends_data)} registros")
    print(f"  Países únicos: {len(set(d['country_code'] for d in integrated_data))}")
    print(f"  Categorías de contenido: {sorted(set(d['content_category'] for d in integrated_data))}")
    print(f"  Regiones: {sorted(set(d['region'] for d in integrated_data))}")
else:
    print("❌ Error: No se pudieron cargar los datos")

📊 CARGANDO DATOS DESDE LA CARPETA ANALYST...

📊 Resumen de datos cargados:
  Datos integrados: 13050 registros
  Datos agregados por país: 50 registros
  Datos de tendencias: 13100 registros
  Países únicos: 10
  Categorías de contenido: ['Action', 'Comedy', 'Documentary', 'Drama', 'Romance']
  Regiones: ['Asia', 'Europe', 'North America', 'Other', 'South America']


In [5]:
# ======================================================================
# CELDA 4: TREEMAP - Estructura de la Biblioteca de Contenido
# ======================================================================

print("🌳 TREEMAP: Estructura de la Biblioteca de Contenido")
print("="*70)

def create_treemap_data(country_aggregated):
    """Crear datos para treemap de la biblioteca de contenido"""
    
    # Agregar por categoría y región
    category_region_data = defaultdict(lambda: defaultdict(lambda: {
        'total_interest': 0, 'count': 0, 'avg_interest': 0, 'max_interest': 0
    }))
    
    for data in country_aggregated:
        category = data['content_category']
        region = data['region']
        
        category_region_data[category][region]['total_interest'] += data['interest_mean']
        category_region_data[category][region]['count'] += 1
        category_region_data[category][region]['max_interest'] = max(
            category_region_data[category][region]['max_interest'], 
            data['interest_max']
        )
    
    # Calcular promedios
    for category in category_region_data:
        for region in category_region_data[category]:
            data = category_region_data[category][region]
            data['avg_interest'] = data['total_interest'] / data['count']
    
    return dict(category_region_data)

treemap_data = create_treemap_data(country_aggregated)

print("📊 Estructura de la biblioteca por categoría y región:")
for category, regions in treemap_data.items():
    print(f"\n  {category}:")
    total_category_interest = sum(r['total_interest'] for r in regions.values())
    for region, data in regions.items():
        percentage = (data['total_interest'] / total_category_interest) * 100
        print(f"    {region}: {data['avg_interest']:.1f} interés promedio ({percentage:.1f}% del total)")

# Crear datos para visualización
treemap_visualization_data = []
for category, regions in treemap_data.items():
    for region, data in regions.items():
        treemap_visualization_data.append({
            'category': category,
            'region': region,
            'avg_interest': data['avg_interest'],
            'total_interest': data['total_interest'],
            'count': data['count'],
            'max_interest': data['max_interest']
        })

print(f"\n✅ Datos del treemap preparados: {len(treemap_visualization_data)} elementos")

🌳 TREEMAP: Estructura de la Biblioteca de Contenido
📊 Estructura de la biblioteca por categoría y región:

  Action:
    South America: 2.6 interés promedio (5.9% del total)
    Asia: 5.7 interés promedio (51.6% del total)
    Europe: 4.9 interés promedio (22.4% del total)
    Other: 1.9 interés promedio (8.5% del total)
    North America: 5.1 interés promedio (11.6% del total)

  Drama:
    South America: 39.9 interés promedio (13.2% del total)
    Asia: 28.7 interés promedio (37.9% del total)
    Europe: 31.1 interés promedio (20.5% del total)
    Other: 27.5 interés promedio (18.1% del total)
    North America: 31.2 interés promedio (10.3% del total)

  Comedy:
    South America: 4.7 interés promedio (8.0% del total)
    Asia: 6.1 interés promedio (41.7% del total)
    Europe: 6.0 interés promedio (20.3% del total)
    Other: 5.7 interés promedio (19.5% del total)
    North America: 6.1 interés promedio (10.4% del total)

  Documentary:
    South America: 1.0 interés promedio (3.3% 

In [6]:
# ======================================================================
# CELDA 5: SUNBURST CHART - Rutas de Navegación de Usuarios
# ======================================================================

print("☀️ SUNBURST CHART: Rutas de Navegación de Usuarios")
print("="*70)

def create_sunburst_data(integrated_data):
    """Crear datos para sunburst chart de rutas de navegación"""
    
    # Simular rutas de navegación basadas en patrones de interés
    navigation_paths = defaultdict(lambda: defaultdict(lambda: defaultdict(int)))
    
    # Agrupar por región y crear patrones de navegación
    for data in integrated_data:
        region = data['region']
        category = data['content_category']
        interest = data['interest']
        
        # Simular subcategorías basadas en el nivel de interés
        if interest > 50:
            subcategory = 'High Engagement'
        elif interest > 25:
            subcategory = 'Medium Engagement'
        else:
            subcategory = 'Low Engagement'
        
        # Simular tipo de contenido basado en volatilidad
        if data['volatility_7d'] > 0.05:
            content_type = 'Trending'
        elif data['volatility_7d'] > 0.02:
            content_type = 'Popular'
        else:
            content_type = 'Stable'
        
        navigation_paths[region][category][f"{subcategory}-{content_type}"] += 1
    
    return dict(navigation_paths)

sunburst_data = create_sunburst_data(integrated_data)
sunburst_visualization_data = []

print("📊 Rutas de navegación por región:")
for region, categories in sunburst_data.items():
    print(f"\n  {region}:")
    total_region_paths = sum(sum(paths.values()) for paths in categories.values())
    
    for category, paths in categories.items():
        print(f"    {category}:")
        for path, count in paths.items():
            percentage = (count / total_region_paths) * 100
            print(f"      {path}: {count} sesiones ({percentage:.1f}%)")
            
            sunburst_visualization_data.append({
                'region': region,
                'category': category,
                'path': path,
                'count': count,
                'percentage': percentage
            })

print(f"\n✅ Datos del sunburst preparados: {len(sunburst_visualization_data)} rutas")

☀️ SUNBURST CHART: Rutas de Navegación de Usuarios
📊 Rutas de navegación por región:

  North America:
    Drama:
      Low Engagement-Stable: 61 sesiones (4.7%)
      Low Engagement-Popular: 64 sesiones (4.9%)
      Medium Engagement-Stable: 29 sesiones (2.2%)
      Medium Engagement-Popular: 67 sesiones (5.1%)
      High Engagement-Popular: 21 sesiones (1.6%)
      High Engagement-Trending: 8 sesiones (0.6%)
      High Engagement-Stable: 1 sesiones (0.1%)
      Medium Engagement-Trending: 9 sesiones (0.7%)
      Low Engagement-Trending: 1 sesiones (0.1%)
    Comedy:
      Low Engagement-Stable: 45 sesiones (3.4%)
      Low Engagement-Popular: 169 sesiones (13.0%)
      Low Engagement-Trending: 44 sesiones (3.4%)
      Medium Engagement-Popular: 1 sesiones (0.1%)
      Medium Engagement-Trending: 2 sesiones (0.2%)
    Romance:
      Low Engagement-Stable: 261 sesiones (20.0%)
    Action:
      Low Engagement-Popular: 145 sesiones (11.1%)
      Low Engagement-Stable: 75 sesiones (5.7%)

In [7]:
# ======================================================================
# CELDA 6: ORGANIZATIONAL TREE - Estructura de Suscripciones
# ======================================================================

print("🌲 ORGANIZATIONAL TREE: Estructura de Suscripciones")
print("="*70)

def create_organizational_tree_data(country_aggregated):
    """Crear datos para árbol organizacional de suscripciones"""
    
    # Simular estructura de suscripciones basada en datos reales
    subscription_structure = defaultdict(lambda: defaultdict(lambda: defaultdict(lambda: {
        'total_users': 0, 'revenue': 0, 'engagement': 0
    })))
    
    for data in country_aggregated:
        region = data['region']
        category = data['content_category']
        
        # Simular tipos de suscripción basados en interés
        if data['interest_mean'] > 40:
            subscription_type = 'Premium'
            base_users = int(data['interest_mean'] * 1000)
            base_revenue = base_users * 15  # $15/mes
        elif data['interest_mean'] > 20:
            subscription_type = 'Standard'
            base_users = int(data['interest_mean'] * 500)
            base_revenue = base_users * 10  # $10/mes
        else:
            subscription_type = 'Basic'
            base_users = int(data['interest_mean'] * 200)
            base_revenue = base_users * 5   # $5/mes
        
        subscription_structure[region][category][subscription_type]['total_users'] += base_users
        subscription_structure[region][category][subscription_type]['revenue'] += base_revenue
        subscription_structure[region][category][subscription_type]['engagement'] += data['interest_mean']
    
    return dict(subscription_structure)

org_tree_data = create_organizational_tree_data(country_aggregated)
org_tree_visualization_data = []

print("📊 Estructura de suscripciones por región y categoría:")
total_revenue = 0
total_users = 0

for region, categories in org_tree_data.items():
    print(f"\n  {region}:")
    region_revenue = 0
    region_users = 0
    
    for category, subscription_types in categories.items():
        print(f"    {category}:")
        category_revenue = 0
        category_users = 0
        
        for sub_type, data in subscription_types.items():
            print(f"      {sub_type}: {data['total_users']:,} usuarios, ${data['revenue']:,}/mes")
            category_revenue += data['revenue']
            category_users += data['total_users']
            
            org_tree_visualization_data.append({
                'region': region,
                'category': category,
                'subscription_type': sub_type,
                'users': data['total_users'],
                'revenue': data['revenue'],
                'engagement': data['engagement']
            })
        
        print(f"      Total {category}: {category_users:,} usuarios, ${category_revenue:,}/mes")
        region_revenue += category_revenue
        region_users += category_users
    
    print(f"    Total {region}: {region_users:,} usuarios, ${region_revenue:,}/mes")
    total_revenue += region_revenue
    total_users += region_users

print(f"\n💰 RESUMEN GLOBAL:")
print(f"  Total usuarios: {total_users:,}")
print(f"  Ingresos mensuales: ${total_revenue:,}")
print(f"  Ingresos anuales: ${total_revenue * 12:,}")

print(f"\n✅ Datos del árbol organizacional preparados: {len(org_tree_visualization_data)} elementos")

🌲 ORGANIZATIONAL TREE: Estructura de Suscripciones
📊 Estructura de suscripciones por región y categoría:

  South America:
    Action:
      Basic: 518 usuarios, $2,590/mes
      Total Action: 518 usuarios, $2,590/mes
    Drama:
      Standard: 19,959 usuarios, $199,590/mes
      Total Drama: 19,959 usuarios, $199,590/mes
    Comedy:
      Basic: 942 usuarios, $4,710/mes
      Total Comedy: 942 usuarios, $4,710/mes
    Documentary:
      Basic: 193 usuarios, $965/mes
      Total Documentary: 193 usuarios, $965/mes
    Romance:
      Basic: 0 usuarios, $0/mes
      Total Romance: 0 usuarios, $0/mes
    Total South America: 21,612 usuarios, $207,855/mes

  Asia:
    Action:
      Basic: 4,526 usuarios, $22,630/mes
      Total Action: 4,526 usuarios, $22,630/mes
    Drama:
      Standard: 48,144 usuarios, $481,440/mes
      Basic: 3,726 usuarios, $18,630/mes
      Total Drama: 51,870 usuarios, $500,070/mes
    Comedy:
      Basic: 4,895 usuarios, $24,475/mes
      Total Comedy: 4,895 usua

In [8]:
# ======================================================================
# CELDA 7: HORIZONTAL BAR CHARTS - Análisis de Contenido
# ======================================================================

print("📊 HORIZONTAL BAR CHARTS: Análisis de Contenido")
print("="*70)

def create_horizontal_bar_data(country_aggregated):
    """Crear datos para gráficos de barras horizontales"""
    
    # Análisis por categoría de contenido
    category_analysis = defaultdict(lambda: {
        'total_interest': 0, 'avg_interest': 0, 'max_interest': 0, 
        'countries': 0, 'total_volatility': 0, 'avg_volatility': 0
    })
    
    for data in country_aggregated:
        category = data['content_category']
        
        category_analysis[category]['total_interest'] += data['interest_mean']
        category_analysis[category]['max_interest'] = max(
            category_analysis[category]['max_interest'], 
            data['interest_max']
        )
        category_analysis[category]['countries'] += 1
        category_analysis[category]['total_volatility'] += data['volatility_7d_mean']
    
    # Calcular promedios
    for category in category_analysis:
        data = category_analysis[category]
        data['avg_interest'] = data['total_interest'] / data['countries']
        data['avg_volatility'] = data['total_volatility'] / data['countries']
    
    return dict(category_analysis)

bar_chart_data = create_horizontal_bar_data(country_aggregated)

print("📊 Análisis por categoría de contenido:")
print("\n1. Interés promedio por categoría:")
sorted_by_interest = sorted(bar_chart_data.items(), key=lambda x: x[1]['avg_interest'], reverse=True)
for category, data in sorted_by_interest:
    print(f"  {category}: {data['avg_interest']:.1f} (máximo: {data['max_interest']:.1f})")

print("\n2. Volatilidad promedio por categoría:")
sorted_by_volatility = sorted(bar_chart_data.items(), key=lambda x: x[1]['avg_volatility'], reverse=True)
for category, data in sorted_by_volatility:
    print(f"  {category}: {data['avg_volatility']:.3f}")

print("\n3. Cobertura geográfica por categoría:")
sorted_by_countries = sorted(bar_chart_data.items(), key=lambda x: x[1]['countries'], reverse=True)
for category, data in sorted_by_countries:
    print(f"  {category}: {data['countries']} países")

# Crear datos para visualización
bar_chart_visualization_data = []
for category, data in bar_chart_data.items():
    bar_chart_visualization_data.append({
        'category': category,
        'avg_interest': data['avg_interest'],
        'max_interest': data['max_interest'],
        'countries': data['countries'],
        'avg_volatility': data['avg_volatility'],
        'total_interest': data['total_interest']
    })

print(f"\n✅ Datos de barras horizontales preparados: {len(bar_chart_visualization_data)} categorías")

📊 HORIZONTAL BAR CHARTS: Análisis de Contenido
📊 Análisis por categoría de contenido:

1. Interés promedio por categoría:
  Drama: 30.3 (máximo: 100.0)
  Comedy: 5.9 (máximo: 36.0)
  Action: 4.4 (máximo: 60.0)
  Documentary: 3.0 (máximo: 35.0)
  Romance: 0.6 (máximo: 5.0)

2. Volatilidad promedio por categoría:
  Documentary: 0.053
  Comedy: 0.036
  Action: 0.033
  Drama: 0.028
  Romance: 0.000

3. Cobertura geográfica por categoría:
  Action: 10 países
  Drama: 10 países
  Comedy: 10 países
  Documentary: 10 países
  Romance: 10 países

✅ Datos de barras horizontales preparados: 5 categorías


In [10]:
# ======================================================================
# CELDA 8: Análisis de Insights y Recomendaciones
# ======================================================================

print("💡 ANÁLISIS DE INSIGHTS Y RECOMENDACIONES")
print("="*70)

# Análisis de la biblioteca de contenido
print("\n📚 INSIGHTS DE LA BIBLIOTECA DE CONTENIDO:")

# Categoría más popular
most_popular_category = max(bar_chart_data.items(), key=lambda x: x[1]['avg_interest'])
print(f"• Categoría más popular: {most_popular_category[0]} (interés promedio: {most_popular_category[1]['avg_interest']:.1f})")

# Categoría con mayor cobertura geográfica
most_global_category = max(bar_chart_data.items(), key=lambda x: x[1]['countries'])
print(f"• Categoría más global: {most_global_category[0]} ({most_global_category[1]['countries']} países)")

# Categoría más volátil (tendencia)
most_volatile_category = max(bar_chart_data.items(), key=lambda x: x[1]['avg_volatility'])
print(f"• Categoría más volátil: {most_volatile_category[0]} (volatilidad: {most_volatile_category[1]['avg_volatility']:.3f})")

# Análisis de navegación
print("\n🧭 INSIGHTS DE NAVEGACIÓN:")

# Región con más rutas de navegación
region_navigation_counts = defaultdict(int)
for data in sunburst_visualization_data:
    region_navigation_counts[data['region']] += data['count']

most_navigated_region = max(region_navigation_counts.items(), key=lambda x: x[1])
print(f"• Región con más navegación: {most_navigated_region[0]} ({most_navigated_region[1]:,} sesiones)")

# Patrón de navegación más común
path_counts = defaultdict(int)
for data in sunburst_visualization_data:
    path_counts[data['path']] += data['count']

most_common_path = max(path_counts.items(), key=lambda x: x[1])
print(f"• Patrón de navegación más común: {most_common_path[0]} ({most_common_path[1]:,} sesiones)")

# Análisis de suscripciones
print("\n💰 INSIGHTS DE SUSCRIPCIONES:")

# Región con más ingresos
region_revenue = defaultdict(int)
for data in org_tree_visualization_data:
    region_revenue[data['region']] += data['revenue']

highest_revenue_region = max(region_revenue.items(), key=lambda x: x[1])
print(f"• Región con más ingresos: {highest_revenue_region[0]} (${highest_revenue_region[1]:,}/mes)")

# Tipo de suscripción más popular
subscription_counts = defaultdict(int)
for data in org_tree_visualization_data:
    subscription_counts[data['subscription_type']] += data['users']

most_popular_subscription = max(subscription_counts.items(), key=lambda x: x[1])
print(f"• Tipo de suscripción más popular: {most_popular_subscription[0]} ({most_popular_subscription[1]:,} usuarios)")

# Recomendaciones
print("\n🎯 RECOMENDACIONES:")
print(f"\n1. BIBLIOTECA DE CONTENIDO:")
print(f"   • Priorizar {most_popular_category[0]} en la página principal")
print(f"   • Expandir {most_global_category[0]} a nuevos mercados")
print(f"   • Monitorear tendencias en {most_volatile_category[0]}")

print(f"\n2. NAVEGACIÓN:")
print(f"   • Optimizar UX para {most_navigated_region[0]}")
print(f"   • Crear atajos para {most_common_path[0]}")
print(f"   • Implementar recomendaciones personalizadas")

print(f"\n3. SUSCRIPCIONES:")
print(f"   • Enfocar marketing en {highest_revenue_region[0]}")
print(f"   • Promocionar {most_popular_subscription[0]} como opción principal")
print(f"   • Desarrollar planes premium para {most_popular_category[0]}")

# Guardar resultados
results = {
    'library_insights': {
        'most_popular_category': most_popular_category[0],
        'most_global_category': most_global_category[0],
        'most_volatile_category': most_volatile_category[0]
    },
    'navigation_insights': {
        'most_navigated_region': most_navigated_region[0],
        'most_common_path': most_common_path[0]
    },
    'subscription_insights': {
        'highest_revenue_region': highest_revenue_region[0],
        'most_popular_subscription': most_popular_subscription[0]
    },
    'raw_data': {
        'treemap_data': treemap_visualization_data,
        'sunburst_data': sunburst_visualization_data,
        'org_tree_data': org_tree_visualization_data,
        'bar_chart_data': bar_chart_visualization_data
    }
}

with open('phase1_hierarchical_results_updated.json', 'w') as f:
    json.dump(results, f, indent=2, default=str)

print("\n✅ Resultados guardados en: phase1_hierarchical_results_updated.json")

💡 ANÁLISIS DE INSIGHTS Y RECOMENDACIONES

📚 INSIGHTS DE LA BIBLIOTECA DE CONTENIDO:
• Categoría más popular: Drama (interés promedio: 30.3)
• Categoría más global: Action (10 países)
• Categoría más volátil: Documentary (volatilidad: 0.053)

🧭 INSIGHTS DE NAVEGACIÓN:
• Región con más navegación: Asia (5,220 sesiones)
• Patrón de navegación más común: Low Engagement-Popular (5,177 sesiones)

💰 INSIGHTS DE SUSCRIPCIONES:
• Región con más ingresos: Asia ($569,145/mes)
• Tipo de suscripción más popular: Standard (142,252 usuarios)

🎯 RECOMENDACIONES:

1. BIBLIOTECA DE CONTENIDO:
   • Priorizar Drama en la página principal
   • Expandir Action a nuevos mercados
   • Monitorear tendencias en Documentary

2. NAVEGACIÓN:
   • Optimizar UX para Asia
   • Crear atajos para Low Engagement-Popular
   • Implementar recomendaciones personalizadas

3. SUSCRIPCIONES:
   • Enfocar marketing en Asia
   • Promocionar Standard como opción principal
   • Desarrollar planes premium para Drama

✅ Resultados 

In [11]:
# ======================================================================
# CELDA 9: RESUMEN Y BIG IDEA DE LA FASE 1
# ======================================================================

print("🎯 RESUMEN DE LA FASE 1: ANÁLISIS JERÁRQUICO (ACTUALIZADO)")
print("="*80)

print("\n📊 ANÁLISIS COMPLETADOS:")
print("✅ 1. Treemap: Estructura de la biblioteca de contenido")
print("✅ 2. Sunburst Chart: Rutas de navegación de usuarios")
print("✅ 3. Organizational Tree: Estructura de suscripciones")
print("✅ 4. Horizontal Bar Charts: Análisis de contenido")

print("\n🔍 INSIGHTS PRINCIPALES:")
print(f"• Categoría más popular: {most_popular_category[0]} (interés: {most_popular_category[1]['avg_interest']:.1f})")
print(f"• Categoría más global: {most_global_category[0]} ({most_global_category[1]['countries']} países)")
print(f"• Región con más navegación: {most_navigated_region[0]} ({most_navigated_region[1]:,} sesiones)")
print(f"• Región con más ingresos: {highest_revenue_region[0]} (${highest_revenue_region[1]:,}/mes)")
print(f"• Suscripción más popular: {most_popular_subscription[0]} ({most_popular_subscription[1]:,} usuarios)")

print("\n💡 BIG IDEA:")
print(f"Nuestro análisis jerárquico revela que debemos reorganizar la biblioteca")
print(f"priorizando {most_popular_category[0]} en la página principal, optimizar la")
print(f"navegación para {most_navigated_region[0]}, y enfocar el marketing de")
print(f"suscripciones en {highest_revenue_region[0]} para maximizar ingresos y")
print(f"mejorar la experiencia del usuario.")

print("\n📁 ARCHIVOS GENERADOS:")
print("• phase1_hierarchical_results_updated.json")

print("\n" + "="*80)
print("FASE 1 COMPLETADA EXITOSAMENTE (ACTUALIZADA CON DATOS REALES)")
print("="*80)

🎯 RESUMEN DE LA FASE 1: ANÁLISIS JERÁRQUICO (ACTUALIZADO)

📊 ANÁLISIS COMPLETADOS:
✅ 1. Treemap: Estructura de la biblioteca de contenido
✅ 2. Sunburst Chart: Rutas de navegación de usuarios
✅ 3. Organizational Tree: Estructura de suscripciones
✅ 4. Horizontal Bar Charts: Análisis de contenido

🔍 INSIGHTS PRINCIPALES:
• Categoría más popular: Drama (interés: 30.3)
• Categoría más global: Action (10 países)
• Región con más navegación: Asia (5,220 sesiones)
• Región con más ingresos: Asia ($569,145/mes)
• Suscripción más popular: Standard (142,252 usuarios)

💡 BIG IDEA:
Nuestro análisis jerárquico revela que debemos reorganizar la biblioteca
priorizando Drama en la página principal, optimizar la
navegación para Asia, y enfocar el marketing de
suscripciones en Asia para maximizar ingresos y
mejorar la experiencia del usuario.

📁 ARCHIVOS GENERADOS:
• phase1_hierarchical_results_updated.json

FASE 1 COMPLETADA EXITOSAMENTE (ACTUALIZADA CON DATOS REALES)
