# 5. Exploraci√≥n de Reportes y Visualizaciones

Este notebook explora los reportes y visualizaciones generados por el pipeline de reportes, incluyendo:
- Reportes de calidad de datos
- Visualizaciones de features temporales
- Reporte final consolidado
- An√°lisis de par√°metros de reportes


In [None]:
# Inicializar Kedro
import sys
sys.path.append('src')

from kedro.framework.session import KedroSession
from kedro.framework.startup import bootstrap_project

# Bootstrap del proyecto
bootstrap_project('proyecto-ml')

# Crear sesi√≥n
session = KedroSession.create('proyecto-ml')
context = session.load_context()
catalog = context.catalog
params = context.params

print("‚úÖ Kedro inicializado correctamente")
print(f"üìä Par√°metros cargados: {len(params)} secciones")
print(f"üìÅ Cat√°logo disponible: {len(catalog.list())} datasets")


In [None]:
# Cargar reporte de calidad de datos
try:
    reporte_calidad = catalog.load('reporte_calidad_datos')
    print("‚úÖ Reporte de calidad cargado exitosamente")
    print(f"üìä Estructura del reporte: {list(reporte_calidad.keys())}")
    
    # Mostrar resumen del reporte
    print("\nüìà RESUMEN DEL REPORTE DE CALIDAD:")
    for key, value in reporte_calidad.items():
        if isinstance(value, dict):
            print(f"  {key}:")
            for subkey, subvalue in value.items():
                print(f"    {subkey}: {subvalue}")
        else:
            print(f"  {key}: {value}")
except Exception as e:
    print(f"‚ùå Error cargando reporte de calidad: {e}")
    reporte_calidad = None


In [None]:
# Cargar reporte de features temporales
try:
    reporte_features = catalog.load('reporte_features_temporales')
    print("‚úÖ Reporte de features temporales cargado exitosamente")
    print(f"üìä Estructura del reporte: {list(reporte_features.keys())}")
    
    # Mostrar resumen del reporte
    print("\nüìà RESUMEN DEL REPORTE DE FEATURES:")
    for key, value in reporte_features.items():
        if isinstance(value, dict):
            print(f"  {key}:")
            for subkey, subvalue in value.items():
                print(f"    {subkey}: {subvalue}")
        else:
            print(f"  {key}: {value}")
except Exception as e:
    print(f"‚ùå Error cargando reporte de features: {e}")
    reporte_features = None


In [None]:
# Cargar visualizaciones de calidad
try:
    visualizaciones_calidad = catalog.load('visualizaciones_calidad')
    print("‚úÖ Visualizaciones de calidad cargadas exitosamente")
    print(f"üìä Archivos generados: {list(visualizaciones_calidad.keys())}")
    
    # Mostrar informaci√≥n de las visualizaciones
    print("\nüìà INFORMACI√ìN DE VISUALIZACIONES:")
    for nombre, info in visualizaciones_calidad.items():
        print(f"  {nombre}:")
        if isinstance(info, dict):
            for key, value in info.items():
                print(f"    {key}: {value}")
        else:
            print(f"    Info: {info}")
except Exception as e:
    print(f"‚ùå Error cargando visualizaciones de calidad: {e}")
    visualizaciones_calidad = None


In [None]:
# Cargar visualizaciones de features
try:
    visualizaciones_features = catalog.load('visualizaciones_features')
    print("‚úÖ Visualizaciones de features cargadas exitosamente")
    print(f"üìä Archivos generados: {list(visualizaciones_features.keys())}")
    
    # Mostrar informaci√≥n de las visualizaciones
    print("\nüìà INFORMACI√ìN DE VISUALIZACIONES DE FEATURES:")
    for nombre, info in visualizaciones_features.items():
        print(f"  {nombre}:")
        if isinstance(info, dict):
            for key, value in info.items():
                print(f"    {key}: {value}")
        else:
            print(f"    Info: {info}")
except Exception as e:
    print(f"‚ùå Error cargando visualizaciones de features: {e}")
    visualizaciones_features = None


In [None]:
# Cargar reporte final consolidado
try:
    reporte_final = catalog.load('reporte_final_consolidado')
    print("‚úÖ Reporte final consolidado cargado exitosamente")
    print(f"üìä Estructura del reporte: {list(reporte_final.keys())}")
    
    # Mostrar resumen del reporte final
    print("\nüìà RESUMEN DEL REPORTE FINAL:")
    for key, value in reporte_final.items():
        if isinstance(value, dict):
            print(f"  {key}:")
            for subkey, subvalue in value.items():
                print(f"    {subkey}: {subvalue}")
        else:
            print(f"  {key}: {value}")
except Exception as e:
    print(f"‚ùå Error cargando reporte final: {e}")
    reporte_final = None


In [None]:
# An√°lisis de par√°metros de reportes
print("‚öôÔ∏è PAR√ÅMETROS DE REPORTES UTILIZADOS")
print("\nüìä Par√°metros de reportes:")
if 'reportes' in params:
    for key, value in params['reportes'].items():
        print(f"  {key}: {value}")

print("\nüìä Par√°metros de validaci√≥n:")
if 'validacion' in params:
    for key, value in params['validacion'].items():
        print(f"  {key}: {value}")

print("\nüìä Par√°metros de performance:")
if 'performance' in params:
    for key, value in params['performance'].items():
        print(f"  {key}: {value}")


In [None]:
# Verificar archivos de visualizaciones generados
import os

print("üìÅ VERIFICACI√ìN DE ARCHIVOS GENERADOS")
print("\nüîç Directorio de reportes:")
directorio_reportes = "data/08_reporting"
if os.path.exists(directorio_reportes):
    archivos = os.listdir(directorio_reportes)
    print(f"  Archivos encontrados: {len(archivos)}")
    for archivo in archivos:
        ruta_completa = os.path.join(directorio_reportes, archivo)
        tama√±o = os.path.getsize(ruta_completa)
        print(f"    {archivo}: {tama√±o} bytes")
else:
    print(f"  ‚ùå Directorio {directorio_reportes} no existe")

print("\nüîç Directorio de datos intermedios:")
directorio_intermedios = "data/02_intermediate"
if os.path.exists(directorio_intermedios):
    archivos = os.listdir(directorio_intermedios)
    print(f"  Archivos encontrados: {len(archivos)}")
    for archivo in archivos:
        ruta_completa = os.path.join(directorio_intermedios, archivo)
        tama√±o = os.path.getsize(ruta_completa)
        print(f"    {archivo}: {tama√±o} bytes")
else:
    print(f"  ‚ùå Directorio {directorio_intermedios} no existe")


In [None]:
# Resumen final de reportes
print("üéØ RESUMEN FINAL DE REPORTES Y VISUALIZACIONES")
print("\n‚úÖ Reportes generados:")
if reporte_calidad:
    print(f"  Reporte de calidad: ‚úÖ")
if reporte_features:
    print(f"  Reporte de features: ‚úÖ")
if reporte_final:
    print(f"  Reporte final: ‚úÖ")

print("\n‚úÖ Visualizaciones generadas:")
if visualizaciones_calidad:
    print(f"  Visualizaciones de calidad: {len(visualizaciones_calidad)} archivos")
if visualizaciones_features:
    print(f"  Visualizaciones de features: {len(visualizaciones_features)} archivos")

print("\n‚úÖ Par√°metros utilizados:")
if 'reportes' in params:
    print(f"  Configuraci√≥n de reportes: ‚úÖ")
if 'validacion' in params:
    print(f"  Configuraci√≥n de validaci√≥n: ‚úÖ")
if 'performance' in params:
    print(f"  Configuraci√≥n de performance: ‚úÖ")

print("\nüéâ Exploraci√≥n de reportes completada exitosamente!")
print("\nüìã PR√ìXIMOS PASOS:")
print("  1. Revisar los archivos de visualizaciones en data/08_reporting/")
print("  2. Analizar los reportes generados para insights de calidad")
print("  3. Usar los datasets finales para modelado de ML")
print("  4. Ajustar par√°metros en parameters.yml si es necesario")
