# **M√©trica Ponderada para Representatividad Distributiva**
## **Gu√≠a de Uso General**

### **¬øQu√© hace esta herramienta?**

Esta herramienta calcula una **m√©trica de tendencia central ponderada** que es m√°s robusta que la media aritm√©tica simple para distribuciones asim√©tricas. Es especialmente √∫til para:

- üìä **Datos de ingresos** y variables econ√≥micas
- üè• **Tiempos de espera** y datos m√©dicos  
- üåê **Datos web** (tiempo de respuesta, tr√°fico)
- üìà **Datos financieros** (precios, rendimientos)
- üî¨ **Cualquier distribuci√≥n asim√©trica**

### **¬øC√≥mo funciona?**

1. **Analiza autom√°ticamente** las caracter√≠sticas de tu distribuci√≥n
2. **Detecta el nivel de asimetr√≠a** (baja, moderada, alta)
3. **Selecciona los par√°metros √≥ptimos** seg√∫n las caracter√≠sticas detectadas
4. **Combina inteligentemente** media, mediana y moda (cuando es apropiado)
5. **Proporciona una m√©trica m√°s representativa** que la media simple

### **Ventajas principales:**

‚úÖ **M√°s robusta** ante valores extremos  
‚úÖ **Se adapta autom√°ticamente** a diferentes tipos de distribuciones  
‚úÖ **F√°cil de usar** - solo necesitas tus datos  
‚úÖ **Respaldo matem√°tico s√≥lido** con validaci√≥n estad√≠stica  
‚úÖ **Interpretable** - explica por qu√© eligi√≥ cada configuraci√≥n

In [None]:
# ========== CONFIGURACI√ìN INICIAL ==========
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
import warnings
warnings.filterwarnings("ignore")

# Importar nuestras funciones desarrolladas
from defs import *

print("üöÄ SISTEMA DE M√âTRICA PONDERADA CARGADO")
print("=" * 50)
print("‚úÖ Todas las funciones han sido importadas correctamente")
print("‚úÖ Listo para analizar tus datos")
print("\nüìã FUNCIONES PRINCIPALES DISPONIBLES:")
print("   ‚Ä¢ metrica_ajustada() - An√°lisis autom√°tico completo")
print("   ‚Ä¢ metrica_ponderada() - Control manual de par√°metros")
print("   ‚Ä¢ Funciones auxiliares: mad(), madn(), bowley_skew(), etc.")
print("=" * 50)

## **Paso 1: Cargar tus datos** üìÇ

### **¬°IMPORTANTE! Elige UNA opci√≥n:**

üéØ **¬øTienes tus propios datos para analizar?** 
- ‚úÖ **S√ç** ‚Üí Usa la **Opci√≥n 1** (CSV/Excel) o **Opci√≥n 2** (Lista) con tus datos reales
- ‚ùå **NO** ‚Üí Usa la **Opci√≥n 3** (Datos de ejemplo) para explorar la herramienta

**‚ö†Ô∏è Los datos que elijas en este paso se usar√°n en TODO el an√°lisis posterior.**

Elige **SOLO UNA** de las siguientes opciones:

In [None]:
# ========== OPCI√ìN 1: CARGAR DESDE ARCHIVO CSV/EXCEL ==========
print("üìÅ OPCI√ìN 1: Cargar datos desde archivo CSV o Excel")
print("=" * 60)

def cargar_desde_archivo(ruta_archivo, columna=None, separador=',', encoding='latin1'):
    """
    Carga datos desde un archivo CSV o Excel
    
    Par√°metros:
    - ruta_archivo: ruta al archivo (ej: 'datos.csv', 'datos.xlsx')
    - columna: nombre de la columna a analizar (si es None, usa la primera columna num√©rica)
    - separador: separador para CSV (por defecto ',')
    - encoding: codificaci√≥n del archivo (por defecto 'latin1', prueba 'utf-8' si hay problemas)
    """
    try:
        # Detectar tipo de archivo
        if ruta_archivo.endswith('.xlsx') or ruta_archivo.endswith('.xls'):
            df = pd.read_excel(ruta_archivo)
            print(f"‚úÖ Archivo Excel cargado: {ruta_archivo}")
        elif ruta_archivo.endswith('.json'):
            df = pd.read_json(ruta_archivo)
            print(f"‚úÖ Archivo JSON cargado: {ruta_archivo}")
        else:
            df = pd.read_csv(ruta_archivo, sep=separador, encoding=encoding)
            print(f"‚úÖ Archivo CSV cargado: {ruta_archivo}")
        
        print(f"üìä Dimensiones: {df.shape[0]} filas, {df.shape[1]} columnas")
        print(f"üìã Columnas disponibles: {list(df.columns)}")
        
        # Seleccionar columna
        if columna is None:
            # Buscar primera columna num√©rica
            columnas_numericas = df.select_dtypes(include=[np.number]).columns
            if len(columnas_numericas) == 0:
                raise ValueError("No se encontraron columnas num√©ricas")
            columna = columnas_numericas[0]
            print(f"üéØ Usando columna autom√°tica: '{columna}'")
        else:
            if columna not in df.columns:
                raise ValueError(f"Columna '{columna}' no encontrada")
            print(f"üéØ Usando columna especificada: '{columna}'")
        
        # Extraer datos y limpiar
        datos = df[columna].dropna()
        datos = datos[pd.to_numeric(datos, errors='coerce').notna()]  # Solo valores num√©ricos
        datos = pd.to_numeric(datos)
        
        print(f"‚úÖ Datos extra√≠dos: {len(datos)} valores v√°lidos")
        print(f"üìà Rango: {datos.min():.2f} - {datos.max():.2f}")
        
        return datos, df
        
    except Exception as e:
        print(f"‚ùå Error al cargar archivo: {e}")
        print("\nüí° Consejos:")
        print("   ‚Ä¢ Verifica que la ruta del archivo sea correcta")
        print("   ‚Ä¢ Para archivos con caracteres especiales, prueba encoding='utf-8'")
        print("   ‚Ä¢ Aseg√∫rate de que el archivo tenga columnas num√©ricas")
        return None, None

# ========== ¬øTIENES UN ARCHIVO PARA CARGAR? ==========
print("\nüî• ¬øQUIERES CARGAR TU PROPIO ARCHIVO?")
print("=" * 50)
print("üìù EJEMPLOS DE USO:")
print("   datos, df = cargar_desde_archivo('mi_archivo.csv', 'mi_columna')")
print("   datos, df = cargar_desde_archivo('datos.xlsx', 'ingresos')")
print("   datos, df = cargar_desde_archivo('archivo.json', 'valores')")
print("   datos, df = cargar_desde_archivo('archivo.csv', encoding='utf-8')")

print("\nüéØ MODIFICA Y EJECUTA UNA DE ESTAS L√çNEAS:")
print("=" * 50)

# ========== DESCOMENTA Y MODIFICA UNA DE ESTAS L√çNEAS ==========
# EJEMPLO 1: Archivo CSV con columna espec√≠fica
# datos, df_original = cargar_desde_archivo('mi_archivo.csv', 'nombre_columna')

# EJEMPLO 2: Archivo Excel 
# datos, df_original = cargar_desde_archivo('datos.xlsx', 'columna_valores')

# EJEMPLO 3: Archivo CSV con detecci√≥n autom√°tica de columna
# datos, df_original = cargar_desde_archivo('mi_archivo.csv')

# EJEMPLO 4: Archivo CSV con encoding espec√≠fico
# datos, df_original = cargar_desde_archivo('archivo.csv', 'columna', encoding='utf-8')

# ========== L√çNEA DE EJEMPLO (DESCOM√âNTALA SI TIENES EL ARCHIVO) ==========
# datos, df_original = cargar_desde_archivo('insumos/ENOE_SDEMT423.csv', 'ing_x_hrs')

# ========== VERIFICAR SI SE CARGARON DATOS ==========
try:
    if 'datos' in locals() and datos is not None:
        print(f"\n‚úÖ ¬°PERFECTO! Tus datos han sido cargados exitosamente")
        print(f"üìä Observaciones: {len(datos):,}")
        print(f"üìà Estos datos se usar√°n en todo el an√°lisis")
        datos_origen = "archivo_usuario"
        # Saltar a las celdas de an√°lisis autom√°tico
        print(f"\nüöÄ PUEDES CONTINUAR CON PASO 1.5 (Limpieza) o saltar al PASO 2 (An√°lisis)")
    else:
        print(f"\n‚ùå No se cargaron datos desde archivo")
        print(f"üí° Si no tienes archivo, contin√∫a con las opciones 2 o 3")
        datos_origen = None
except:
    print(f"\n‚ùå No se cargaron datos desde archivo")
    print(f"üí° Si no tienes archivo, contin√∫a con las opciones 2 o 3") 
    datos_origen = None

In [None]:
# ========== OPCI√ìN 2: DATOS DESDE LISTA O ARRAY ==========
print("üìã OPCI√ìN 2: Cargar datos desde lista o array")
print("=" * 60)

# ========== VERIFICAR SI YA TIENES DATOS ==========
if 'datos_origen' in locals() and datos_origen == "archivo_usuario":
    print("‚úÖ Ya tienes datos cargados desde archivo")
    print("‚ö†Ô∏è  Esta celda es opcional - ya puedes ir al Paso 2")
    print("üîÑ Solo ejecuta esta celda si quieres CAMBIAR a datos de lista")
    print()

def cargar_desde_lista(datos_lista, nombre_variable="datos"):
    """
    Convierte una lista o array en formato apropiado para an√°lisis
    
    Par√°metros:
    - datos_lista: lista, tuple, o array con los datos
    - nombre_variable: nombre descriptivo para los datos
    """
    try:
        # Convertir a pandas Series
        datos = pd.Series(datos_lista)
        
        # Limpiar datos (quitar NaN y valores no num√©ricos)
        datos_limpios = datos.dropna()
        datos_limpios = pd.to_numeric(datos_limpios, errors='coerce').dropna()
        
        print(f"‚úÖ Datos cargados desde lista: '{nombre_variable}'")
        print(f"üìä Valores originales: {len(datos)}")
        print(f"üìä Valores v√°lidos: {len(datos_limpios)}")
        print(f"üìà Rango: {datos_limpios.min():.2f} - {datos_limpios.max():.2f}")
        
        return datos_limpios
        
    except Exception as e:
        print(f"‚ùå Error al procesar lista: {e}")
        return None

print("üìù EJEMPLOS DE USO:")
print("=" * 40)

# Ejemplo 1: Lista de n√∫meros
ejemplo_ingresos = [25000, 30000, 28000, 45000, 35000, 120000, 22000, 38000, 42000]
print(f"üî∏ Ejemplo 1 - Ingresos mensuales:")
datos_ejemplo1 = cargar_desde_lista(ejemplo_ingresos, "ingresos_mensuales")

# Ejemplo 2: Datos con valores at√≠picos
ejemplo_tiempos = [2.1, 3.5, 2.8, 4.1, 3.2, 25.6, 3.8, 2.9, 3.7, 4.5, 100.2, 3.1]
print(f"\nüî∏ Ejemplo 2 - Tiempos de respuesta (seg):")
datos_ejemplo2 = cargar_desde_lista(ejemplo_tiempos, "tiempos_respuesta")

print(f"\nüéØ PARA USAR TUS PROPIOS DATOS DE LISTA:")
print("=" * 50)
print(f"   mis_datos = [valor1, valor2, valor3, ...]")
print(f"   datos = cargar_desde_lista(mis_datos, 'nombre_descriptivo')")
print(f"   datos_origen = 'lista_usuario'")

print(f"\nüí° DESCOMENTA Y MODIFICA ESTAS L√çNEAS CON TUS DATOS:")
print("-" * 50)
# EJEMPLO: Reemplaza con tus datos reales
# mis_datos = [1, 2, 3, 4, 5, 100, 2, 3, 4, 50]  # Reemplaza con tus datos
# datos = cargar_desde_lista(mis_datos, "mi_variable")
# datos_origen = "lista_usuario"
# print(f"‚úÖ Tus datos de lista han sido cargados y se usar√°n en el an√°lisis")

# Verificar estado de datos
if 'datos_origen' not in locals() or datos_origen != "archivo_usuario":
    print(f"\n‚ùå A√∫n no has cargado tus datos de lista")
    print(f"üí° Si no tienes datos propios, contin√∫a con la Opci√≥n 3 (datos de ejemplo)")

In [None]:
# ========== OPCI√ìN 3: GENERAR DATOS DE EJEMPLO ==========
print("üé≤ OPCI√ìN 3: Datos de ejemplo para explorar la herramienta")
print("=" * 60)

# ========== VERIFICAR SI YA TIENES DATOS ==========
if 'datos_origen' in locals() and datos_origen in ["archivo_usuario", "lista_usuario"]:
    print("‚úÖ Ya tienes datos cargados desde tu archivo/lista")
    print("‚ö†Ô∏è  Esta celda es opcional - ya puedes ir al Paso 2")
    print("üîÑ Solo ejecuta esta celda si quieres CAMBIAR a datos de ejemplo")
    print()
else:
    print("üéØ No se detectaron datos propios cargados")
    print("‚úÖ Esta opci√≥n te permitir√° explorar la herramienta con datos de ejemplo")
    print()

def generar_datos_ejemplo(tipo="ingresos", n=1000, semilla=42):
    """
    Genera datos de ejemplo para probar la herramienta
    
    Par√°metros:
    - tipo: "ingresos", "tiempos", "precios", "asimetrico_alto", "normal"
    - n: n√∫mero de observaciones
    - semilla: semilla para reproducibilidad
    """
    np.random.seed(semilla)
    
    if tipo == "ingresos":
        # Distribuci√≥n log-normal (t√≠pica de ingresos)
        datos = np.random.lognormal(mean=10, sigma=0.8, size=n)
        nombre = "Distribuci√≥n de Ingresos (log-normal)"
        unidad = "pesos"
        
    elif tipo == "tiempos":
        # Distribuci√≥n exponencial (t√≠pica de tiempos de espera)
        datos = np.random.exponential(scale=5, size=n)
        nombre = "Tiempos de Respuesta (exponencial)"
        unidad = "segundos"
        
    elif tipo == "precios":
        # Distribuci√≥n gamma (t√≠pica de precios)
        datos = np.random.gamma(shape=2, scale=100, size=n)
        nombre = "Precios de Productos (gamma)"
        unidad = "pesos"
        
    elif tipo == "asimetrico_alto":
        # Distribuci√≥n muy asim√©trica con outliers
        base = np.random.exponential(scale=2, size=int(n*0.9))
        outliers = np.random.exponential(scale=20, size=int(n*0.1)) + 50
        datos = np.concatenate([base, outliers])
        np.random.shuffle(datos)
        nombre = "Distribuci√≥n Altamente Asim√©trica"
        unidad = "unidades"
        
    elif tipo == "normal":
        # Distribuci√≥n normal para comparaci√≥n
        datos = np.random.normal(loc=50, scale=15, size=n)
        datos = datos[datos > 0]  # Solo valores positivos
        nombre = "Distribuci√≥n Normal"
        unidad = "unidades"
        
    else:
        raise ValueError(f"Tipo '{tipo}' no reconocido. Usa: ingresos, tiempos, precios, asimetrico_alto, normal")
    
    datos = pd.Series(datos)
    
    print(f"‚úÖ Datos generados: {nombre}")
    print(f"üìä Observaciones: {len(datos)}")
    print(f"üìà Rango: {datos.min():.2f} - {datos.max():.2f} {unidad}")
    
    return datos

# ========== DECISI√ìN AUTOM√ÅTICA DE DATOS ==========
if 'datos_origen' not in locals() or datos_origen is None:
    print("üé≤ GENERANDO DATOS DE EJEMPLO AUTOM√ÅTICAMENTE:")
    print("=" * 50)
    
    print("üî∏ Tipo 1: Distribuci√≥n de ingresos")
    datos_ingresos = generar_datos_ejemplo("ingresos", n=1000)
    
    print(f"\nüî∏ Tipo 2: Tiempos de respuesta")
    datos_tiempos = generar_datos_ejemplo("tiempos", n=500)
    
    print(f"\nüî∏ Tipo 3: Distribuci√≥n altamente asim√©trica")
    datos_asimetricos = generar_datos_ejemplo("asimetrico_alto", n=800)
    
    # Seleccionar datos por defecto para el an√°lisis
    datos = datos_ingresos  
    datos_origen = "ejemplo_ingresos"
    nombre_datos = "Distribuci√≥n de Ingresos (Ejemplo)"
    
    print(f"\nüéØ DATOS SELECCIONADOS AUTOM√ÅTICAMENTE:")
    print("=" * 50)
    print(f"‚úÖ Usando: {nombre_datos}")
    print(f"üìä {len(datos)} observaciones listas para analizar")
    print(f"üìà Estos datos se usar√°n en TODO el an√°lisis posterior")
    
    print(f"\nüí° PUEDES CAMBIAR A OTROS EJEMPLOS:")
    print("   datos = datos_tiempos      # Para usar tiempos de respuesta")
    print("   datos = datos_asimetricos  # Para usar distribuci√≥n muy asim√©trica")
    print("   nombre_datos = 'Tu nombre descriptivo'")
    
else:
    print("üìä Datos de ejemplo disponibles pero no necesarios")
    print("‚úÖ Ya tienes datos cargados para el an√°lisis")

# ========== RESUMEN FINAL DE DATOS PARA AN√ÅLISIS ==========
print(f"\n" + "=" * 70)
print("üìã RESUMEN - DATOS LISTOS PARA AN√ÅLISIS")
print("=" * 70)

if 'datos' in locals() and datos is not None:
    print(f"‚úÖ DATOS CARGADOS EXITOSAMENTE")
    print(f"üìä Observaciones: {len(datos):,}")
    print(f"üìà Rango: {datos.min():.2f} - {datos.max():.2f}")
    print(f"üéØ Origen: {datos_origen if 'datos_origen' in locals() else 'datos cargados'}")
    print(f"üìÅ Nombre: {nombre_datos if 'nombre_datos' in locals() else 'datos para an√°lisis'}")
    print(f"\nüöÄ ¬°LISTO! Contin√∫a con el PASO 1.5 (Limpieza Opcional) o PASO 2 (An√°lisis)")
else:
    print(f"‚ùå ERROR: No hay datos v√°lidos cargados")
    print(f"üí° Revisa las opciones anteriores y carga tus datos")

print("=" * 70)

## **Paso 1.5: Limpieza de Datos (Opcional)** üßπ

### **¬øNecesitas limpiar tus datos antes del an√°lisis?**

Esta celda te permite **filtrar y limpiar** tus datos si es necesario. Es especialmente √∫til para:

- üö´ **Remover valores nulos** (NaN, None)
- üî¢ **Filtrar ceros** (si no son v√°lidos en tu contexto)
- üìä **Eliminar valores negativos** (para variables que solo deben ser positivas)
- üéØ **Filtrar outliers extremos** (percentiles muy altos/bajos)
- üìã **Aplicar filtros personalizados** seg√∫n tu dominio

**‚ö†Ô∏è Solo ejecuta esta celda si necesitas limpiar tus datos. Si tus datos ya est√°n limpios, salta al Paso 2.**

In [None]:
# ========== LIMPIEZA DE DATOS OPCIONAL ==========
print("üßπ HERRAMIENTAS DE LIMPIEZA DE DATOS")
print("=" * 60)

# Verificar que tenemos datos para limpiar
if 'datos' not in locals() or datos is None:
    print("‚ùå No se encontraron datos para limpiar")
    print("üí° Primero carga tus datos en el Paso 1")
else:
    print(f"üìä DATOS ORIGINALES:")
    print(f"   ‚Ä¢ Observaciones: {len(datos):,}")
    print(f"   ‚Ä¢ Rango: {datos.min():.2f} - {datos.max():.2f}")
    print(f"   ‚Ä¢ Valores nulos: {datos.isnull().sum()}")
    print(f"   ‚Ä¢ Valores cero: {(datos == 0).sum()}")
    print(f"   ‚Ä¢ Valores negativos: {(datos < 0).sum()}")
    
    # Crear copia de datos original para preservar
    datos_originales = datos.copy()
    
    print(f"\nüõ†Ô∏è  OPCIONES DE LIMPIEZA DISPONIBLES:")
    print("=" * 50)
    
    # ========== FUNCI√ìN 1: REMOVER VALORES NULOS ==========
    def limpiar_nulos(datos):
        """Remueve valores nulos (NaN, None)"""
        datos_limpios = datos.dropna()
        removidos = len(datos) - len(datos_limpios)
        print(f"‚úÖ Valores nulos removidos: {removidos}")
        return datos_limpios
    
    # ========== FUNCI√ìN 2: REMOVER CEROS ==========
    def limpiar_ceros(datos):
        """Remueve valores igual a cero"""
        datos_limpios = datos[datos != 0]
        removidos = len(datos) - len(datos_limpios)
        print(f"‚úÖ Valores cero removidos: {removidos}")
        return datos_limpios
    
    # ========== FUNCI√ìN 3: REMOVER NEGATIVOS ==========
    def limpiar_negativos(datos):
        """Remueve valores negativos"""
        datos_limpios = datos[datos >= 0]
        removidos = len(datos) - len(datos_limpios)
        print(f"‚úÖ Valores negativos removidos: {removidos}")
        return datos_limpios
    
    # ========== FUNCI√ìN 4: FILTRAR OUTLIERS EXTREMOS ==========
    def limpiar_outliers(datos, percentil_inferior=1, percentil_superior=99):
        """Remueve outliers extremos basados en percentiles"""
        p_inf = np.percentile(datos, percentil_inferior)
        p_sup = np.percentile(datos, percentil_superior)
        datos_limpios = datos[(datos >= p_inf) & (datos <= p_sup)]
        removidos = len(datos) - len(datos_limpios)
        print(f"‚úÖ Outliers extremos removidos (P{percentil_inferior}-P{percentil_superior}): {removidos}")
        print(f"   ‚Ä¢ L√≠mite inferior: {p_inf:.2f}")
        print(f"   ‚Ä¢ L√≠mite superior: {p_sup:.2f}")
        return datos_limpios
    
    # ========== FUNCI√ìN 5: FILTRO PERSONALIZADO ==========
    def limpiar_personalizado(datos, valor_min=None, valor_max=None):
        """Aplica filtros personalizados de rango"""
        datos_limpios = datos.copy()
        removidos = 0
        
        if valor_min is not None:
            datos_filtrados = datos_limpios[datos_limpios >= valor_min]
            removidos += len(datos_limpios) - len(datos_filtrados)
            datos_limpios = datos_filtrados
            print(f"‚úÖ Valores < {valor_min} removidos")
            
        if valor_max is not None:
            datos_filtrados = datos_limpios[datos_limpios <= valor_max]
            removidos += len(datos_limpios) - len(datos_filtrados)
            datos_limpios = datos_filtrados
            print(f"‚úÖ Valores > {valor_max} removidos")
            
        print(f"   ‚Ä¢ Total removidos: {removidos}")
        return datos_limpios
    
    print("üí° PARA APLICAR LIMPIEZA, DESCOMENTA LAS L√çNEAS QUE NECESITES:")
    print("-" * 60)
    
    # ========== APLICAR LIMPIEZAS (DESCOMENTAR SEG√öN NECESIDADES) ==========
    
    # OPCI√ìN 1: Remover valores nulos
    # datos = limpiar_nulos(datos)
    
    # OPCI√ìN 2: Remover ceros (√∫til para ingresos, precios, etc.)
    # datos = limpiar_ceros(datos)
    
    # OPCI√ìN 3: Remover valores negativos (√∫til para variables que deben ser positivas)
    # datos = limpiar_negativos(datos)
    
    # OPCI√ìN 4: Filtrar outliers extremos (remover 1% superior e inferior)
    # datos = limpiar_outliers(datos, percentil_inferior=1, percentil_superior=99)
    
    # OPCI√ìN 5: Filtros personalizados de rango
    # datos = limpiar_personalizado(datos, valor_min=0, valor_max=1000000)
    
    # ========== LIMPIEZA T√çPICA PARA DATOS DE INGRESOS ==========
    print(f"\nüéØ EJEMPLO: LIMPIEZA T√çPICA PARA DATOS DE INGRESOS/PRECIOS:")
    print("   # datos = limpiar_nulos(datos)")
    print("   # datos = limpiar_ceros(datos)")
    print("   # datos = limpiar_negativos(datos)")
    print("   # datos = limpiar_outliers(datos, percentil_inferior=0.5, percentil_superior=99.5)")
    
    # ========== VERIFICAR SI SE APLICARON CAMBIOS ==========
    if len(datos) == len(datos_originales):
        print(f"\nüìä NO SE APLICARON FILTROS")
        print(f"   ‚Ä¢ Los datos originales se mantienen sin cambios")
        print(f"   ‚Ä¢ Si quieres limpiar, descomenta las l√≠neas correspondientes arriba")
    else:
        # Calcular estad√≠sticas despu√©s de limpieza
        observaciones_removidas = len(datos_originales) - len(datos)
        porcentaje_removido = (observaciones_removidas / len(datos_originales)) * 100
        
        print(f"\nüìä RESUMEN DE LIMPIEZA APLICADA:")
        print("=" * 50)
        print(f"   ‚Ä¢ Observaciones originales: {len(datos_originales):,}")
        print(f"   ‚Ä¢ Observaciones finales: {len(datos):,}")
        print(f"   ‚Ä¢ Removidas: {observaciones_removidas:,} ({porcentaje_removido:.1f}%)")
        print(f"   ‚Ä¢ Nuevo rango: {datos.min():.2f} - {datos.max():.2f}")
        print(f"   ‚Ä¢ Nueva media: {datos.mean():.2f}")
        print(f"   ‚Ä¢ Nueva mediana: {datos.median():.2f}")
        
        if porcentaje_removido > 20:
            print(f"\n‚ö†Ô∏è  ADVERTENCIA: Se removi√≥ m√°s del 20% de los datos")
            print(f"   ‚Ä¢ Verifica que los filtros sean apropiados para tu an√°lisis")
            print(f"   ‚Ä¢ Considera ajustar los criterios de limpieza")
        elif porcentaje_removido > 5:
            print(f"\nüü° MODERADO: Se removi√≥ {porcentaje_removido:.1f}% de los datos")
            print(f"   ‚Ä¢ Esto es normal para la mayor√≠a de an√°lisis")
        else:
            print(f"\nüü¢ LIMPIEZA M√çNIMA: Solo se removi√≥ {porcentaje_removido:.1f}% de los datos")
    
    # Actualizar nombre de datos si se aplic√≥ limpieza
    if 'nombre_datos' in locals() and len(datos) != len(datos_originales):
        nombre_datos = f"{nombre_datos} (limpio)"

    # ========== MOSTRAR ESTAD√çSTICAS FINALES (DESPU√âS DE LIMPIEZA) ==========
    print(f"\n" + "=" * 70)
    print("üìä ESTAD√çSTICAS FINALES DE LOS DATOS (post-limpieza)")
    print("=" * 70)
    print(f"‚Ä¢ Media aritm√©tica: {datos.mean():,.3f}")
    print(f"‚Ä¢ Mediana: {datos.median():,.3f}")
    print(f"‚Ä¢ Desviaci√≥n est√°ndar: {datos.std():,.3f}")
    print(f"‚Ä¢ Asimetr√≠a (momentos): {datos.skew():.3f}")
    print(f"‚Ä¢ Curtosis (momentos): {datos.kurtosis():.3f}")
    print(f"‚Ä¢ Coeficiente de variaci√≥n: {(datos.std() / datos.mean()):.3f}")
    
    print(f"\n‚úÖ DATOS FINALES LISTOS PARA AN√ÅLISIS:")
    print(f"   ‚Ä¢ Observaciones: {len(datos):,}")
    print(f"   ‚Ä¢ Rango: {datos.min():.2f} - {datos.max():.2f}")
    print(f"   ‚Ä¢ Estos datos se usar√°n en el an√°lisis autom√°tico")
    print(f"\nüöÄ Contin√∫a con el PASO 2 (An√°lisis Autom√°tico)")

## **Paso 2: An√°lisis Autom√°tico** ü§ñ

**¬°Esta es la parte principal!** La funci√≥n `metrica_ajustada()` analizar√° autom√°ticamente tus datos y:

1. üîç **Detectar√°** el nivel de asimetr√≠a  
2. ‚öôÔ∏è **Seleccionar√°** los par√°metros √≥ptimos  
3. üìä **Calcular√°** la m√©trica ponderada  
4. üìã **Explicar√°** todas las decisiones tomadas  

**Solo ejecuta la celda siguiente y obt√©n resultados completos:**

*Nota: Si aplicaste limpieza en el Paso 1.5, se usar√°n autom√°ticamente los datos limpios.*

In [None]:
# ========== AN√ÅLISIS AUTOM√ÅTICO COMPLETO ==========

def analizar_datos_completo(datos, nombre_datos="tus datos"):
    """
    Funci√≥n principal que ejecuta el an√°lisis completo de los datos
    """
    print("üöÄ INICIANDO AN√ÅLISIS AUTOM√ÅTICO")
    print("=" * 80)
    
    # Verificar que tenemos datos v√°lidos
    if datos is None or len(datos) == 0:
        print("‚ùå ERROR: No hay datos v√°lidos para analizar")
        print("üí° Aseg√∫rate de haber cargado tus datos correctamente en el paso anterior")
        return None
    
    print(f"üìä ANALIZANDO: {nombre_datos}")
    print(f"üìà Observaciones: {len(datos):,}")
    print(f"üìà Rango: {datos.min():.2f} - {datos.max():.2f}")
    
    # ========== AN√ÅLISIS AUTOM√ÅTICO CON M√âTRICA PONDERADA ==========
    print(f"\nü§ñ EJECUTANDO AN√ÅLISIS AUTOM√ÅTICO...")
    print("-" * 60)
    
    try:
        resultado_auto = metrica_ajustada(datos)
        resultado = resultado_auto['resultado']
        diagnostico = resultado_auto['diagnostico']
        
        print(f"‚úÖ AN√ÅLISIS COMPLETADO EXITOSAMENTE")
        
        # ========== DIAGN√ìSTICO AUTOM√ÅTICO ==========
        print(f"\nüîç DIAGN√ìSTICO AUTOM√ÅTICO:")
        print("-" * 50)
        print(f"‚Ä¢ Nivel de asimetr√≠a detectado: {diagnostico['nivel_asimetria'].upper()}")
        print(f"‚Ä¢ Asimetr√≠a de Bowley (robusta): {diagnostico['bowley_asimetria']:.4f}")
        print(f"‚Ä¢ Sesgo normalizado: {diagnostico['sesgo_normalizado']:.4f}")
        print(f"‚Ä¢ Exceso de curtosis: {diagnostico['exceso_curtosis']:.4f}")
        print(f"‚Ä¢ Curtosis significativa: {'S√≠' if diagnostico['curtosis_significativa'] else 'No'}")
        print(f"‚Ä¢ Inclusi√≥n de moda: {'S√≠' if diagnostico['usar_moda'] else 'No'}")
        
        if diagnostico['usar_moda']:
            print(f"‚Ä¢ Moda robusta: {'S√≠' if diagnostico['moda_robusta'] else 'No'}")
        
        # ========== CONFIGURACI√ìN ELEGIDA ==========
        params = diagnostico['parametros_elegidos']
        print(f"\n‚öôÔ∏è  CONFIGURACI√ìN AUTOM√ÅTICA ELEGIDA:")
        print("-" * 50)
        print(f"‚Ä¢ M√©todo de mapeo: {params['method'].upper()}")
        print(f"‚Ä¢ M√©todo de ponderaci√≥n: {params['weight_method'].upper()}")
        if params['weight_method'] == 'convex':
            print(f"‚Ä¢ Subm√©todo convexo: {params['convex_method']}")
        print(f"‚Ä¢ Uso de medida robusta (MADN): {'S√≠' if params['usar_medida_robusta'] else 'No'}")
        print(f"‚Ä¢ Ajuste por curtosis: {'S√≠' if params['use_kurtosis'] else 'No'}")
        print(f"‚Ä¢ Ajuste por Bowley: {'S√≠' if params['use_bowley'] else 'No'}")
        
        # ========== RESULTADOS PRINCIPALES ==========
        print(f"\nüìà RESULTADOS PRINCIPALES:")
        print("=" * 60)
        print(f"‚Ä¢ Media aritm√©tica simple: {resultado['media']:,.3f}")
        print(f"‚Ä¢ Mediana: {resultado['mediana']:,.3f}")
        
        if not pd.isna(resultado['moda']):
            print(f"‚Ä¢ Moda robusta (KDE): {resultado['moda']:,.3f}")
        
        print(f"\nüéØ M√âTRICA PONDERADA √ìPTIMA: {resultado['tendencia_ponderada']:,.3f}")
        
        # ========== COMPARACI√ìN E IMPACTO ==========
        diferencia_absoluta = abs(resultado['tendencia_ponderada'] - resultado['media'])
        diferencia_relativa = diferencia_absoluta / resultado['media'] * 100
        
        print(f"\nüí∞ IMPACTO DE LA OPTIMIZACI√ìN:")
        print("-" * 50)
        print(f"‚Ä¢ Diferencia vs media simple: {diferencia_absoluta:,.3f}")
        print(f"‚Ä¢ Diferencia relativa: {diferencia_relativa:.2f}%")
        
        if diferencia_relativa > 5:
            print(f"üî¥ DIFERENCIA SIGNIFICATIVA - La m√©trica ponderada es considerablemente diferente")
        elif diferencia_relativa > 1:
            print(f"üü° DIFERENCIA MODERADA - La optimizaci√≥n mejora la representatividad")
        else:
            print(f"üü¢ DIFERENCIA PEQUE√ëA - Los datos son relativamente sim√©tricos")
        
        # ========== DISTRIBUCI√ìN DE PESOS ==========
        print(f"\n‚öñÔ∏è  DISTRIBUCI√ìN DE PESOS √ìPTIMOS:")
        print("-" * 50)
        print(f"‚Ä¢ Peso de la media: {resultado['peso_media']:.3f} ({resultado['peso_media']*100:.1f}%)")
        print(f"‚Ä¢ Peso de la mediana: {resultado['peso_mediana']:.3f} ({resultado['peso_mediana']*100:.1f}%)")
        
        if resultado['peso_moda'] > 0:
            print(f"‚Ä¢ Peso de la moda: {resultado['peso_moda']:.3f} ({resultado['peso_moda']*100:.1f}%)")
        
        # ========== RECOMENDACI√ìN FINAL ==========
        print(f"\nüéØ RECOMENDACI√ìN FINAL:")
        print("=" * 60)
        
        if diagnostico['nivel_asimetria'] == "alta":
            mensaje = f"Tu distribuci√≥n tiene ALTA asimetr√≠a. Te recomendamos usar la m√©trica ponderada"
        elif diagnostico['nivel_asimetria'] == "moderada":
            mensaje = f"Tu distribuci√≥n tiene asimetr√≠a MODERADA. La m√©trica ponderada mejora la representatividad"
        else:
            mensaje = f"Tu distribuci√≥n es relativamente SIM√âTRICA. La media simple es confiable, pero la m√©trica ponderada puede ofrecer ventajas adicionales"
        
        print(f"‚úÖ {mensaje}")
        print(f"üìä Valor recomendado: {resultado['tendencia_ponderada']:,.3f}")
        print(f"üìä En lugar de la media simple: {resultado['media']:,.3f}")
        
        return resultado_auto
        
    except Exception as e:
        print(f"‚ùå ERROR en el an√°lisis autom√°tico: {e}")
        print("üí° Verifica que tus datos sean num√©ricos y no contengan valores extremos problem√°ticos")
        return None

# ========== VERIFICAR Y EJECUTAR AN√ÅLISIS ==========
print("üî• VERIFICANDO DATOS Y EJECUTANDO AN√ÅLISIS AUTOM√ÅTICO...")
print("=" * 80)

# Verificar que tenemos datos v√°lidos
if 'datos' not in locals() or datos is None:
    print("‚ùå ERROR: No se encontraron datos v√°lidos para analizar")
    print("üí° Regresa al PASO 1 y carga tus datos correctamente")
    print("üìã Opciones disponibles:")
    print("   ‚Ä¢ Opci√≥n 1: Cargar desde archivo CSV/Excel/JSON")
    print("   ‚Ä¢ Opci√≥n 2: Cargar desde lista de valores")
    print("   ‚Ä¢ Opci√≥n 3: Usar datos de ejemplo")
    resultado_final = None
else:
    # Determinar nombre descriptivo
    if 'nombre_datos' not in locals():
        if 'datos_origen' in locals():
            if datos_origen == "archivo_usuario":
                nombre_datos = "datos desde tu archivo"
            elif datos_origen == "lista_usuario":
                nombre_datos = "datos desde tu lista"
            else:
                nombre_datos = "datos de ejemplo"
        else:
            nombre_datos = "tus datos"
    
    print(f"‚úÖ Datos encontrados: {nombre_datos}")
    print(f"üìä Origen: {datos_origen if 'datos_origen' in locals() else 'desconocido'}")
    print("üöÄ Iniciando an√°lisis autom√°tico...")
    print()
    
    # Ejecutar el an√°lisis completo
    resultado_final = analizar_datos_completo(datos, nombre_datos)

# ========== RESULTADO FINAL ==========
if resultado_final is not None:
    print(f"\n" + "=" * 80)
    print("‚úÖ ¬°AN√ÅLISIS COMPLETADO CON √âXITO!")
    print("üìã Los resultados est√°n guardados en 'resultado_final'")
    print("üìä Contin√∫a con la siguiente celda para ver las visualizaciones")
    print("=" * 80)
else:
    print(f"\n" + "=" * 80)
    print("‚ùå EL AN√ÅLISIS NO SE COMPLET√ì")
    print("üí° Revisa los mensajes de error anteriores")
    print("üìã Aseg√∫rate de haber cargado datos v√°lidos en el Paso 1")
    print("=" * 80)

## **Paso 3: Visualizaciones Autom√°ticas** üìä

Las visualizaciones te ayudar√°n a **entender mejor** los resultados y **validar** las decisiones del algoritmo autom√°tico.

In [None]:
# ========== VISUALIZACIONES COMPREHENSIVAS ==========

def crear_visualizaciones(datos, resultado_auto, nombre_datos="tus datos"):
    """
    Crea un conjunto completo de visualizaciones para entender los resultados
    """
    
    if resultado_auto is None:
        print("‚ùå No hay resultados para visualizar. Ejecuta primero el an√°lisis autom√°tico.")
        return
    
    resultado = resultado_auto['resultado']
    diagnostico = resultado_auto['diagnostico']
    
    # Configurar el estilo de las gr√°ficas
    plt.style.use('default')
    fig = plt.figure(figsize=(20, 15))
    
    print(f"üìä CREANDO VISUALIZACIONES PARA: {nombre_datos}")
    print("=" * 70)
    
    # ========== GR√ÅFICO 1: DISTRIBUCI√ìN PRINCIPAL ==========
    ax1 = plt.subplot(3, 3, 1)
    ax1.hist(datos, bins=min(50, len(datos)//10), alpha=0.7, color='lightblue', 
             density=True, edgecolor='black', linewidth=0.5)
    
    # L√≠neas verticales para medidas de tendencia central
    ax1.axvline(resultado['media'], color='red', linestyle='--', linewidth=2.5, 
               label=f'Media: {resultado["media"]:,.1f}')
    ax1.axvline(resultado['mediana'], color='green', linestyle='--', linewidth=2.5, 
               label=f'Mediana: {resultado["mediana"]:,.1f}')
    ax1.axvline(resultado['tendencia_ponderada'], color='purple', linestyle='-', linewidth=3, 
               label=f'M√©trica Ponderada: {resultado["tendencia_ponderada"]:,.1f}')
    
    if not pd.isna(resultado['moda']):
        ax1.axvline(resultado['moda'], color='orange', linestyle=':', linewidth=2.5, 
                   label=f'Moda: {resultado["moda"]:,.1f}')
    
    ax1.set_title(f'Distribuci√≥n de {nombre_datos}', fontweight='bold', fontsize=12)
    ax1.set_xlabel('Valores')
    ax1.set_ylabel('Densidad')
    ax1.legend(fontsize=10)
    ax1.grid(True, alpha=0.3)
    
    # ========== GR√ÅFICO 2: COMPARACI√ìN DE M√âTRICOS ==========
    ax2 = plt.subplot(3, 3, 2)
    metricas = ['Media\nSimple', 'Mediana', 'M√©trica\nPonderada']
    valores = [resultado['media'], resultado['mediana'], resultado['tendencia_ponderada']]
    colores = ['red', 'green', 'purple']
    
    bars = ax2.bar(metricas, valores, color=colores, alpha=0.7, edgecolor='black')
    ax2.set_title('Comparaci√≥n de M√©tricos', fontweight='bold', fontsize=12)
    ax2.set_ylabel('Valor')
    
    # A√±adir valores en las barras
    for bar, valor in zip(bars, valores):
        height = bar.get_height()
        ax2.text(bar.get_x() + bar.get_width()/2., height,
                 f'{valor:,.1f}', ha='center', va='bottom', fontweight='bold', fontsize=10)
    
    ax2.grid(True, alpha=0.3, axis='y')
    
    # ========== GR√ÅFICO 3: DISTRIBUCI√ìN DE PESOS ==========
    ax3 = plt.subplot(3, 3, 3)
    if resultado['peso_moda'] > 0:
        labels = ['Media', 'Mediana', 'Moda']
        sizes = [resultado['peso_media'], resultado['peso_mediana'], resultado['peso_moda']]
        colors = ['red', 'green', 'orange']
    else:
        labels = ['Media', 'Mediana']
        sizes = [resultado['peso_media'], resultado['peso_mediana']]
        colors = ['red', 'green']
    
    wedges, texts, autotexts = ax3.pie(sizes, labels=labels, colors=colors, autopct='%1.1f%%', 
                                      startangle=90, textprops={'fontsize': 10})
    ax3.set_title('Distribuci√≥n de Pesos', fontweight='bold', fontsize=12)
    
    # ========== GR√ÅFICO 4: M√âTRICAS DE DIAGN√ìSTICO ==========
    ax4 = plt.subplot(3, 3, 4)
    metricas_diag = ['Asimetr√≠a\nBowley', 'Sesgo\nNormalizado', 'Exceso\nCurtosis']
    valores_diag = [abs(diagnostico['bowley_asimetria']), 
                   diagnostico['sesgo_normalizado'], 
                   abs(diagnostico['exceso_curtosis'])]
    colores_diag = ['blue', 'cyan', 'magenta']
    
    bars_diag = ax4.bar(metricas_diag, valores_diag, color=colores_diag, alpha=0.7, edgecolor='black')
    ax4.set_title('M√©tricas de Diagn√≥stico', fontweight='bold', fontsize=12)
    ax4.set_ylabel('Valor')
    
    for bar, valor in zip(bars_diag, valores_diag):
        height = bar.get_height()
        ax4.text(bar.get_x() + bar.get_width()/2., height,
                 f'{valor:.3f}', ha='center', va='bottom', fontweight='bold', fontsize=9)
    
    ax4.grid(True, alpha=0.3, axis='y')
    
    # ========== GR√ÅFICO 5: BOX PLOT ==========
    ax5 = plt.subplot(3, 3, 5)
    box = ax5.boxplot(datos, patch_artist=True, vert=True)
    box['boxes'][0].set_facecolor('lightcoral')
    box['boxes'][0].set_alpha(0.7)
    
    # A√±adir l√≠neas de referencia
    ax5.axhline(resultado['media'], color='red', linestyle='--', linewidth=2, label='Media')
    ax5.axhline(resultado['mediana'], color='green', linestyle='--', linewidth=2, label='Mediana')
    ax5.axhline(resultado['tendencia_ponderada'], color='purple', linestyle='-', linewidth=3, label='M√©trica Ponderada')
    
    ax5.set_title('Box Plot con M√©tricos', fontweight='bold', fontsize=12)
    ax5.set_ylabel('Valores')
    ax5.legend(fontsize=9)
    ax5.grid(True, alpha=0.3)
    
    # ========== GR√ÅFICO 6: HISTOGRAMA CON CURVA DE DENSIDAD ==========
    ax6 = plt.subplot(3, 3, 6)
    ax6.hist(datos, bins=min(30, len(datos)//20), alpha=0.5, color='lightgray', density=True, 
             label='Histograma')
    
    # A√±adir curva de densidad si hay suficientes datos
    if len(datos) > 50:
        try:
            datos.plot(kind='kde', ax=ax6, color='red', linewidth=2, label='Curva de densidad')
        except:
            pass  # Si no se puede calcular KDE, continuar sin √©l
    
    ax6.set_title('Distribuci√≥n con Curva de Densidad', fontweight='bold', fontsize=12)
    ax6.set_xlabel('Valores')
    ax6.set_ylabel('Densidad')
    ax6.legend(fontsize=10)
    ax6.grid(True, alpha=0.3)
    
    # ========== GR√ÅFICO 7: Q-Q PLOT CONTRA NORMAL ==========
    ax7 = plt.subplot(3, 3, 7)
    from scipy import stats
    stats.probplot(datos, dist="norm", plot=ax7)
    ax7.set_title('Q-Q Plot vs Distribuci√≥n Normal', fontweight='bold', fontsize=12)
    ax7.grid(True, alpha=0.3)
    
    # ========== GR√ÅFICO 8: REGI√ìN CENTRAL (SIN OUTLIERS) ==========
    ax8 = plt.subplot(3, 3, 8)
    # Filtrar regi√≥n central (percentiles 5-95)
    p5, p95 = np.percentile(datos, [5, 95])
    datos_centrales = datos[(datos >= p5) & (datos <= p95)]
    
    ax8.hist(datos_centrales, bins=min(30, len(datos_centrales)//10), alpha=0.7, 
             color='lightgreen', density=True, edgecolor='black', linewidth=0.5)
    
    # L√≠neas de referencia en regi√≥n central
    ax8.axvline(resultado['media'], color='red', linestyle='--', linewidth=2, label='Media')
    ax8.axvline(resultado['mediana'], color='green', linestyle='--', linewidth=2, label='Mediana')
    ax8.axvline(resultado['tendencia_ponderada'], color='purple', linestyle='-', linewidth=3, 
               label='M√©trica Ponderada')
    
    ax8.set_title('Regi√≥n Central (P5-P95)', fontweight='bold', fontsize=12)
    ax8.set_xlabel('Valores')
    ax8.set_ylabel('Densidad')
    ax8.legend(fontsize=9)
    ax8.grid(True, alpha=0.3)
    
    # ========== GR√ÅFICO 9: RESUMEN DE CONFIGURACI√ìN ==========
    ax9 = plt.subplot(3, 3, 9)
    ax9.axis('off')
    
    # Texto con informaci√≥n del an√°lisis
    config_text = f"""
CONFIGURACI√ìN AUTOM√ÅTICA:

‚Ä¢ Nivel de asimetr√≠a: {diagnostico['nivel_asimetria'].upper()}
‚Ä¢ M√©todo elegido: {diagnostico['parametros_elegidos']['method'].upper()}
‚Ä¢ Ponderaci√≥n: {diagnostico['parametros_elegidos']['weight_method'].upper()}

RESULTADOS CLAVE:

‚Ä¢ Observaciones: {len(datos):,}
‚Ä¢ Media simple: {resultado['media']:,.2f}
‚Ä¢ M√©trica ponderada: {resultado['tendencia_ponderada']:,.2f}
‚Ä¢ Diferencia: {abs(resultado['tendencia_ponderada'] - resultado['media']):,.2f}

PESOS FINALES:

‚Ä¢ Media: {resultado['peso_media']:.1%}
‚Ä¢ Mediana: {resultado['peso_mediana']:.1%}"""
    
    if resultado['peso_moda'] > 0:
        config_text += f"\n‚Ä¢ Moda: {resultado['peso_moda']:.1%}"
    
    ax9.text(0.1, 0.9, config_text, fontsize=11, verticalalignment='top', 
             bbox=dict(boxstyle="round,pad=0.5", facecolor="lightblue", alpha=0.7))
    
    plt.tight_layout()
    plt.show()
    
    print("‚úÖ Visualizaciones creadas exitosamente")
    print("üìä Interpretaci√≥n:")
    if diagnostico['nivel_asimetria'] == "alta":
        print("   üî¥ Tu distribuci√≥n es altamente asim√©trica - la m√©trica ponderada es muy recomendable")
    elif diagnostico['nivel_asimetria'] == "moderada":
        print("   üü° Tu distribuci√≥n tiene asimetr√≠a moderada - la m√©trica ponderada mejora la representatividad")
    else:
        print("   üü¢ Tu distribuci√≥n es relativamente sim√©trica - ambas m√©tricas son v√°lidas")

# ========== EJECUTAR VISUALIZACIONES ==========
print("üé® VERIFICANDO DATOS Y CREANDO VISUALIZACIONES...")
print("=" * 70)

if 'resultado_final' in locals() and resultado_final is not None and 'datos' in locals():
    # Determinar nombre de datos para visualizaciones
    nombre_para_viz = nombre_datos if 'nombre_datos' in locals() else "datos analizados"
    
    print(f"‚úÖ Datos y resultados encontrados")
    print(f"üìä Creando visualizaciones para: {nombre_para_viz}")
    print("üé® Generando 9 gr√°ficos comprehensivos...")
    print()
    
    crear_visualizaciones(datos, resultado_final, nombre_para_viz)
    
elif 'datos' not in locals() or datos is None:
    print("‚ùå No se encontraron datos v√°lidos para visualizar")
    print("üí° Regresa al PASO 1 y carga tus datos")
    
elif 'resultado_final' not in locals() or resultado_final is None:
    print("‚ùå No se encontraron resultados de an√°lisis para visualizar")
    print("üí° Ejecuta primero el PASO 2 (An√°lisis Autom√°tico)")
    
else:
    print("‚ùå Error inesperado al preparar visualizaciones")
    print("üí° Verifica que hayas ejecutado correctamente los pasos anteriores")

## **Paso 4: Uso Avanzado (Opcional)** ‚öôÔ∏è

Si quieres **mayor control** sobre el an√°lisis, puedes usar la funci√≥n `metrica_ponderada()` directamente con par√°metros personalizados.

In [None]:
# ========== USO AVANZADO CON PAR√ÅMETROS PERSONALIZADOS ==========

def uso_avanzado_ejemplos(datos):
    """
    Demuestra diferentes configuraciones avanzadas de la funci√≥n metrica_ponderada
    """
    print("‚öôÔ∏è  EJEMPLOS DE USO AVANZADO")
    print("=" * 70)
    
    # ========== CONFIGURACI√ìN 1: CONSERVADORA ==========
    print("\nüî∏ CONFIGURACI√ìN 1: CONSERVADORA (solo media-mediana)")
    resultado_conservador = metrica_ponderada(
        datos,
        method="linear",           # Mapeo menos agresivo
        incluir_moda=False,        # Sin moda
        use_kurtosis=False,        # Sin ajuste por curtosis
        use_bowley=False,          # Sin ajuste por Bowley
        temperature=1.0,           # Menos agresivo
        clip=(0.1, 0.9)           # M√°s conservador
    )
    
    print(f"   ‚Ä¢ Resultado: {resultado_conservador['tendencia_ponderada']:.3f}")
    print(f"   ‚Ä¢ Peso media: {resultado_conservador['peso_media']:.3f}")
    print(f"   ‚Ä¢ Peso mediana: {resultado_conservador['peso_mediana']:.3f}")
    
    # ========== CONFIGURACI√ìN 2: AGRESIVA ==========
    print("\nüî∏ CONFIGURACI√ìN 2: AGRESIVA (todas las optimizaciones)")
    resultado_agresivo = metrica_ponderada(
        datos,
        method="exponential",      # Mapeo m√°s agresivo
        incluir_moda=True,         # Incluir moda
        moda_robusta=True,         # Validar robustez de moda
        use_kurtosis=True,         # Ajuste por curtosis
        use_bowley=True,           # Ajuste por Bowley
        weight_method="convex",    # Pesos convexos
        temperature=0.3,           # M√°s agresivo
        clip=(0.01, 0.99)         # Menos restrictivo
    )
    
    print(f"   ‚Ä¢ Resultado: {resultado_agresivo['tendencia_ponderada']:.3f}")
    print(f"   ‚Ä¢ Peso media: {resultado_agresivo['peso_media']:.3f}")
    print(f"   ‚Ä¢ Peso mediana: {resultado_agresivo['peso_mediana']:.3f}")
    print(f"   ‚Ä¢ Peso moda: {resultado_agresivo['peso_moda']:.3f}")
    
    # ========== CONFIGURACI√ìN 3: SOLO MEDIANA ==========
    print("\nüî∏ CONFIGURACI√ìN 3: FORZAR SOLO MEDIANA")
    resultado_mediana = metrica_ponderada(
        datos,
        method="linear",
        incluir_moda=False,
        temperature=0.1,           # Muy agresivo hacia mediana
        s_max=0.1                 # Umbral muy bajo
    )
    
    print(f"   ‚Ä¢ Resultado: {resultado_mediana['tendencia_ponderada']:.3f}")
    print(f"   ‚Ä¢ Peso media: {resultado_mediana['peso_media']:.3f}")
    print(f"   ‚Ä¢ Peso mediana: {resultado_mediana['peso_mediana']:.3f}")
    
    # ========== CONFIGURACI√ìN 4: PERSONALIZADA PARA FINANZAS ==========
    print("\nüî∏ CONFIGURACI√ìN 4: OPTIMIZADA PARA DATOS FINANCIEROS")
    resultado_finanzas = metrica_ponderada(
        datos,
        method="logistic",         # Buen balance
        usar_medida_robusta=True,  # MADN en lugar de desv. std
        incluir_moda=False,        # Los datos financieros rara vez tienen moda clara
        use_kurtosis=True,         # Los datos financieros suelen tener colas pesadas
        use_bowley=True,           # Asimetr√≠a robusta importante
        temperature=0.5,
        alpha=1.0,                # Penalizaci√≥n moderada
        clip=(0.05, 0.95)
    )
    
    print(f"   ‚Ä¢ Resultado: {resultado_finanzas['tendencia_ponderada']:.3f}")
    print(f"   ‚Ä¢ Peso media: {resultado_finanzas['peso_media']:.3f}")
    print(f"   ‚Ä¢ Peso mediana: {resultado_finanzas['peso_mediana']:.3f}")
    
    # ========== COMPARACI√ìN DE TODAS LAS CONFIGURACIONES ==========
    print(f"\nüìä COMPARACI√ìN DE TODAS LAS CONFIGURACIONES:")
    print("-" * 70)
    
    configuraciones = {
        "Autom√°tica": resultado_final['resultado']['tendencia_ponderada'] if 'resultado_final' in globals() and resultado_final is not None else None,
        "Conservadora": resultado_conservador['tendencia_ponderada'],
        "Agresiva": resultado_agresivo['tendencia_ponderada'],
        "Solo Mediana": resultado_mediana['tendencia_ponderada'],
        "Finanzas": resultado_finanzas['tendencia_ponderada'],
        "Media Simple": datos.mean(),
        "Mediana Simple": datos.median()
    }
    
    for nombre, valor in configuraciones.items():
        if valor is not None:
            print(f"   ‚Ä¢ {nombre:<15}: {valor:>10.3f}")
    
    # ========== GR√ÅFICO COMPARATIVO ==========
    print(f"\nüìà CREANDO GR√ÅFICO COMPARATIVO...")
    
    fig, ax = plt.subplots(1, 1, figsize=(12, 8))
    
    # Preparar datos para el gr√°fico
    nombres = []
    valores = []
    colores = ['purple', 'blue', 'red', 'green', 'orange', 'gray', 'black']
    
    for i, (nombre, valor) in enumerate(configuraciones.items()):
        if valor is not None:
            nombres.append(nombre)
            valores.append(valor)
    
    # Crear gr√°fico de barras
    bars = ax.bar(nombres, valores, color=colores[:len(nombres)], alpha=0.7, edgecolor='black')
    
    # Personalizar gr√°fico
    ax.set_title('Comparaci√≥n de Diferentes Configuraciones', fontweight='bold', fontsize=14)
    ax.set_ylabel('Valor de la M√©trica', fontsize=12)
    ax.tick_params(axis='x', rotation=45)
    
    # A√±adir valores en las barras
    for bar, valor in zip(bars, valores):
        height = bar.get_height()
        ax.text(bar.get_x() + bar.get_width()/2., height,
                f'{valor:.2f}', ha='center', va='bottom', fontweight='bold', fontsize=10)
    
    ax.grid(True, alpha=0.3, axis='y')
    plt.tight_layout()
    plt.show()
    
    return {
        'conservador': resultado_conservador,
        'agresivo': resultado_agresivo,
        'mediana': resultado_mediana,
        'finanzas': resultado_finanzas
    }

# ========== VERIFICAR Y EJECUTAR EJEMPLOS AVANZADOS ==========
print("‚öôÔ∏è  VERIFICANDO DATOS PARA USO AVANZADO...")
print("=" * 60)

if 'datos' in locals() and datos is not None:
    nombre_para_avanzado = nombre_datos if 'nombre_datos' in locals() else "datos cargados"
    
    print(f"‚úÖ Datos encontrados: {nombre_para_avanzado}")
    print(f"? Observaciones: {len(datos):,}")
    print("?üöÄ Ejecutando ejemplos de configuraciones avanzadas...")
    print()
    
    resultados_avanzados = uso_avanzado_ejemplos(datos)
    
    print(f"\nüí° CONSEJOS PARA USO AVANZADO:")
    print("-" * 50)
    print("‚Ä¢ Usa configuraci√≥n CONSERVADORA para datos cr√≠ticos o regulatorios")
    print("‚Ä¢ Usa configuraci√≥n AGRESIVA para distribuciones muy asim√©tricas")
    print("‚Ä¢ Usa configuraci√≥n FINANZAS para datos de precios, rendimientos, etc.")
    print("‚Ä¢ Compara siempre diferentes configuraciones para validar resultados")
    print("‚Ä¢ La configuraci√≥n AUTOM√ÅTICA suele ser la mejor opci√≥n general")
    
    print(f"\nüéØ CONFIGURACI√ìN RECOMENDADA PARA TUS DATOS:")
    if 'resultado_final' in locals() and resultado_final is not None:
        diagnostico = resultado_final['diagnostico']
        if diagnostico['nivel_asimetria'] == "alta":
            print("   üî¥ Alta asimetr√≠a ‚Üí Considera la configuraci√≥n AGRESIVA")
        elif diagnostico['nivel_asimetria'] == "moderada":
            print("   üü° Asimetr√≠a moderada ‚Üí La configuraci√≥n AUTOM√ÅTICA es √≥ptima")
        else:
            print("   üü¢ Baja asimetr√≠a ‚Üí La configuraci√≥n CONSERVADORA es suficiente")
    
else:
    print("‚ùå No se encontraron datos v√°lidos para el uso avanzado")
    print("üí° Regresa al PASO 1 y carga tus datos correctamente")
    print("üìã O ejecuta primero los pasos anteriores en orden")
    resultados_avanzados = None

## **Paso 5: Resumen y Exportaci√≥n** üìã

### **Resumen de tus resultados**

Si has ejecutado todas las celdas anteriores, ahora tienes:

‚úÖ **An√°lisis autom√°tico completo** de tu distribuci√≥n  
‚úÖ **M√©trica ponderada optimizada** m√°s robusta que la media simple  
‚úÖ **Visualizaciones comprehensivas** para entender los resultados  
‚úÖ **Comparaci√≥n con diferentes configuraciones** (si ejecutaste el uso avanzado)  

### **¬øQu√© hacer con los resultados?**

1. **Usa la m√©trica ponderada** en lugar de la media simple para tus an√°lisis
2. **Documenta la metodolog√≠a** - tienes respaldo matem√°tico s√≥lido
3. **Valida con diferentes configuraciones** si es cr√≠tico
4. **Aplica a otros datasets** similares con confianza

### **Exportar resultados:**

In [None]:
# ========== FUNCI√ìN DE EXPORTACI√ìN Y RESUMEN FINAL ==========

def exportar_resultados(datos, resultado_auto, nombre_archivo="resultados_metrica_ponderada"):
    """
    Exporta los resultados del an√°lisis a diferentes formatos
    """
    if resultado_auto is None:
        print("‚ùå No hay resultados para exportar")
        return
    
    resultado = resultado_auto['resultado']
    diagnostico = resultado_auto['diagnostico']
    
    print("üìã PREPARANDO RESUMEN FINAL Y EXPORTACI√ìN...")
    print("=" * 70)
    
    # ========== CREAR RESUMEN COMPLETO ==========
    resumen = {
        'An√°lisis': {
            'Observaciones': len(datos),
            'Rango_min': float(datos.min()),
            'Rango_max': float(datos.max()),
            'Media_simple': float(datos.mean()),
            'Mediana': float(datos.median()),
            'Desviacion_std': float(datos.std()),
            'Asimetria_momentos': float(datos.skew()),
            'Curtosis_momentos': float(datos.kurtosis())
        },
        'Diagnostico_automatico': {
            'Nivel_asimetria': diagnostico['nivel_asimetria'],
            'Asimetria_Bowley': float(diagnostico['bowley_asimetria']),
            'Sesgo_normalizado': float(diagnostico['sesgo_normalizado']),
            'Exceso_curtosis': float(diagnostico['exceso_curtosis']),
            'Curtosis_significativa': diagnostico['curtosis_significativa'],
            'Usar_moda': diagnostico['usar_moda'],
            'Moda_robusta': diagnostico.get('moda_robusta', False)
        },
        'Configuracion_elegida': diagnostico['parametros_elegidos'],
        'Resultados_finales': {
            'Media_aritmetica': float(resultado['media']),
            'Mediana': float(resultado['mediana']),
            'Moda_KDE': float(resultado['moda']) if not pd.isna(resultado['moda']) else None,
            'Metrica_ponderada': float(resultado['tendencia_ponderada']),
            'Peso_media': float(resultado['peso_media']),
            'Peso_mediana': float(resultado['peso_mediana']),
            'Peso_moda': float(resultado['peso_moda']),
            'MADN': float(resultado['MADN']),
            'Diferencia_vs_media': float(abs(resultado['tendencia_ponderada'] - resultado['media'])),
            'Diferencia_relativa_pct': float(abs(resultado['tendencia_ponderada'] - resultado['media']) / resultado['media'] * 100)
        }
    }
    
    # ========== MOSTRAR RESUMEN EN PANTALLA ==========
    print("üìä RESUMEN FINAL DE RESULTADOS:")
    print("-" * 50)
    print(f"üéØ M√âTRICA PONDERADA RECOMENDADA: {resultado['tendencia_ponderada']:,.3f}")
    print(f"üìà vs Media simple: {resultado['media']:,.3f}")
    print(f"üí∞ Diferencia absoluta: {abs(resultado['tendencia_ponderada'] - resultado['media']):,.3f}")
    print(f"üìä Diferencia relativa: {abs(resultado['tendencia_ponderada'] - resultado['media']) / resultado['media'] * 100:.2f}%")
    
    print(f"\n‚öôÔ∏è  CONFIGURACI√ìN AUTOM√ÅTICA ELEGIDA:")
    print(f"   ‚Ä¢ Nivel de asimetr√≠a: {diagnostico['nivel_asimetria'].upper()}")
    print(f"   ‚Ä¢ M√©todo: {diagnostico['parametros_elegidos']['method'].upper()}")
    print(f"   ‚Ä¢ Ponderaci√≥n: {diagnostico['parametros_elegidos']['weight_method'].upper()}")
    
    print(f"\n‚öñÔ∏è  DISTRIBUCI√ìN DE PESOS:")
    print(f"   ‚Ä¢ Media: {resultado['peso_media']:.1%}")
    print(f"   ‚Ä¢ Mediana: {resultado['peso_mediana']:.1%}")
    if resultado['peso_moda'] > 0:
        print(f"   ‚Ä¢ Moda: {resultado['peso_moda']:.1%}")
    
    # ========== GUARDAR EN DIFERENTES FORMATOS ==========
    try:
        # 1. Guardar como JSON
        import json
        with open(f"{nombre_archivo}.json", 'w', encoding='utf-8') as f:
            json.dump(resumen, f, indent=4, ensure_ascii=False)
        print(f"\n‚úÖ Resultados guardados en: {nombre_archivo}.json")
        
        # 2. Guardar como CSV (solo resultados principales)
        resultados_csv = pd.DataFrame({
            'Metrica': ['Media_simple', 'Mediana', 'Metrica_ponderada'],
            'Valor': [resultado['media'], resultado['mediana'], resultado['tendencia_ponderada']],
            'Peso': [resultado['peso_media'], resultado['peso_mediana'], 1.0]  # Para la media simple, peso = 1
        })
        resultados_csv.to_csv(f"{nombre_archivo}.csv", index=False, encoding='utf-8')
        print(f"‚úÖ Tabla de resultados guardada en: {nombre_archivo}.csv")
        
        # 3. Crear reporte en texto
        with open(f"{nombre_archivo}_reporte.txt", 'w', encoding='utf-8') as f:
            f.write("REPORTE DE AN√ÅLISIS - M√âTRICA PONDERADA PARA DISTRIBUCIONES ASIM√âTRICAS\n")
            f.write("=" * 80 + "\n\n")
            f.write(f"Fecha de an√°lisis: {pd.Timestamp.now().strftime('%Y-%m-%d %H:%M:%S')}\n")
            f.write(f"Observaciones analizadas: {len(datos):,}\n\n")
            
            f.write("RESULTADOS PRINCIPALES:\n")
            f.write("-" * 30 + "\n")
            f.write(f"Media aritm√©tica simple: {resultado['media']:,.3f}\n")
            f.write(f"Mediana: {resultado['mediana']:,.3f}\n")
            f.write(f"M√©trica ponderada (recomendada): {resultado['tendencia_ponderada']:,.3f}\n\n")
            
            f.write("DIAGN√ìSTICO AUTOM√ÅTICO:\n")
            f.write("-" * 30 + "\n")
            f.write(f"Nivel de asimetr√≠a: {diagnostico['nivel_asimetria']}\n")
            f.write(f"Asimetr√≠a de Bowley: {diagnostico['bowley_asimetria']:.4f}\n")
            f.write(f"M√©todo elegido: {diagnostico['parametros_elegidos']['method']}\n")
            f.write(f"Ponderaci√≥n elegida: {diagnostico['parametros_elegidos']['weight_method']}\n\n")
            
            f.write("RECOMENDACI√ìN:\n")
            f.write("-" * 30 + "\n")
            if diagnostico['nivel_asimetria'] == "alta":
                f.write("La distribuci√≥n presenta ALTA asimetr√≠a. Se recomienda fuertemente usar la m√©trica ponderada.\n")
            elif diagnostico['nivel_asimetria'] == "moderada":
                f.write("La distribuci√≥n presenta asimetr√≠a MODERADA. La m√©trica ponderada mejora la representatividad.\n")
            else:
                f.write("La distribuci√≥n es relativamente SIM√âTRICA. Ambas m√©tricas son v√°lidas.\n")
        
        print(f"‚úÖ Reporte completo guardado en: {nombre_archivo}_reporte.txt")
        
    except Exception as e:
        print(f"‚ö†Ô∏è  Error al guardar archivos: {e}")
        print("üí° Los resultados siguen disponibles en memoria")
    
    # ========== INSTRUCCIONES FINALES ==========
    print(f"\nüéØ PR√ìXIMOS PASOS RECOMENDADOS:")
    print("-" * 50)
    print("1. Usa la m√©trica ponderada en tus an√°lisis futuros")
    print("2. Documenta la metodolog√≠a en tus reportes")
    print("3. Aplica la misma herramienta a datasets similares")
    print("4. Comparte los archivos generados con tu equipo")
    
    if abs(resultado['tendencia_ponderada'] - resultado['media']) / resultado['media'] * 100 > 5:
        print("\nüî¥ NOTA IMPORTANTE:")
        print("   La diferencia entre la m√©trica ponderada y la media simple es significativa.")
        print("   Considera usar la m√©trica ponderada para decisiones importantes.")
    
    return resumen

# ========== FUNCI√ìN DE AYUDA R√ÅPIDA ==========
def ayuda_rapida():
    """
    Muestra un resumen r√°pido de c√≥mo usar la herramienta
    """
    print("üöÄ GU√çA R√ÅPIDA DE USO:")
    print("=" * 50)
    print("1. CARGAR DATOS:")
    print("   ‚Ä¢ datos, df = cargar_desde_archivo('archivo.csv', 'columna')")
    print("   ‚Ä¢ datos = cargar_desde_lista([1,2,3,4,5], 'mi_variable')")
    print("   ‚Ä¢ datos = generar_datos_ejemplo('ingresos')")
    print()
    print("2. AN√ÅLISIS AUTOM√ÅTICO:")
    print("   ‚Ä¢ resultado = analizar_datos_completo(datos)")
    print()
    print("3. VISUALIZAR:")
    print("   ‚Ä¢ crear_visualizaciones(datos, resultado)")
    print()
    print("4. EXPORTAR:")
    print("   ‚Ä¢ exportar_resultados(datos, resultado, 'mi_analisis')")
    print()
    print("üí° Para uso avanzado, consulta la documentaci√≥n de metrica_ponderada()")

# ========== VERIFICAR Y EJECUTAR EXPORTACI√ìN ==========
print("üìã VERIFICANDO DATOS Y RESULTADOS PARA EXPORTACI√ìN...")
print("=" * 70)

if 'resultado_final' in locals() and resultado_final is not None and 'datos' in locals() and datos is not None:
    # Determinar nombre del archivo bas√°ndose en el origen de los datos
    if 'datos_origen' in locals():
        if datos_origen == "archivo_usuario":
            nombre_archivo_base = "analisis_archivo_usuario"
        elif datos_origen == "lista_usuario":
            nombre_archivo_base = "analisis_lista_usuario"
        else:
            nombre_archivo_base = "analisis_datos_ejemplo"
    else:
        nombre_archivo_base = "analisis_metrica_ponderada"
    
    nombre_para_export = nombre_datos if 'nombre_datos' in locals() else "datos analizados"
    
    print(f"‚úÖ Datos y resultados encontrados")
    print(f"üìä Datos analizados: {nombre_para_export}")
    print(f"üìÅ Nombre base de archivos: {nombre_archivo_base}")
    print("üìã Generando resumen final y archivos de exportaci√≥n...")
    print()
    
    resumen_final = exportar_resultados(datos, resultado_final, nombre_archivo_base)
    
    print(f"\n" + "=" * 80)
    print("üéâ ¬°AN√ÅLISIS COMPLETADO CON √âXITO!")
    print("üìÅ Archivos generados y listos para usar")
    print("üìä M√©trica ponderada calculada y validada")
    print(f"üéØ Datos analizados: {nombre_para_export}")
    print("=" * 80)
    
elif 'datos' not in locals() or datos is None:
    print("‚ùå No se encontraron datos v√°lidos para exportar")
    print("üí° Regresa al PASO 1 y carga tus datos correctamente")
    
elif 'resultado_final' not in locals() or resultado_final is None:
    print("‚ùå No se encontraron resultados de an√°lisis para exportar")
    print("üí° Ejecuta primero el PASO 2 (An√°lisis Autom√°tico)")
    
else:
    print("‚ùå Error inesperado al preparar exportaci√≥n")
    print("üí° Verifica que hayas ejecutado correctamente todos los pasos anteriores")

print(f"\nüìö PARA VER LA GU√çA R√ÅPIDA DE USO:")
print("   ayuda_rapida()")

## **Documentaci√≥n y Referencias** üìö

### **¬øQu√© acabas de usar?**

Has utilizado un **sistema avanzado de an√°lisis estad√≠stico** que implementa:

- **üìä Estimaci√≥n robusta de la moda** mediante Kernel Density Estimation (KDE)
- **üìà Medidas de asimetr√≠a robustas** (Bowley skewness)  
- **‚öñÔ∏è Ponderaci√≥n adaptativa** con m√∫ltiples m√©todos (softmax, convex weights)
- **ü§ñ Sistema de decisi√≥n autom√°tica** basado en caracter√≠sticas de la distribuci√≥n
- **üõ°Ô∏è Validaci√≥n de robustez** ante valores extremos

### **Fundamentos matem√°ticos:**

1. **MADN (Median Absolute Deviation Normalized)**: `1.4826 √ó median(|x - median(x)|)`
2. **Asimetr√≠a de Bowley**: `(Q‚ÇÉ + Q‚ÇÅ - 2Q‚ÇÇ) / (Q‚ÇÉ - Q‚ÇÅ)`
3. **Ponderaci√≥n softmax**: `w·µ¢ = exp(-d·µ¢/T) / Œ£exp(-d‚±º/T)`
4. **Mapeo log√≠stico**: `w = 1 / (1 + (s/s‚ÇÄ)·µñ)`

### **Casos de uso recomendados:**

‚úÖ **Datos de ingresos** y salarios  
‚úÖ **Precios** y variables financieras  
‚úÖ **Tiempos** de espera o respuesta  
‚úÖ **Cualquier distribuci√≥n asim√©trica** con valores extremos  
‚úÖ **An√°lisis de pol√≠ticas p√∫blicas**  
‚úÖ **Investigaci√≥n acad√©mica**  

### **Referencias acad√©micas:**

- Bowley, A.L. (1920). *Elements of Statistics*
- Rousseeuw, P.J. & Croux, C. (1993). "Alternatives to the median absolute deviation"
- Silverman, B.W. (1986). *Density Estimation for Statistics and Data Analysis*
- Maronna, R.A. et al. (2019). *Robust Statistics: Theory and Methods*

### **Soporte y contacto:**

Para preguntas t√©cnicas o mejoras, contacta al desarrollador del sistema: https://github.com/AGAYON

---

**¬°Gracias por usar la herramienta de M√©trica Ponderada para Representatividad Distributiva!** üéâ