In [None]:
import pandas as pd
import matplotlib.pyplot as plt
import numpy as np
import glob
import os
import time
from datetime import datetime
import sys

print("\nüî•üî•üî• VISUALIZADOR DEBUG FINAL INICIADO üî•üî•üî•\n")

# =======================================
# 1. CONTEXTO DE EJECUCI√ìN
# =======================================

CURRENT_DIR = os.getcwd()
print(f"üìç Directorio actual de ejecuci√≥n (cwd):")
print(f"   {CURRENT_DIR}\n")

# =======================================
# 2. CONFIGURACI√ìN
# =======================================

AGGREGATED_OUTPUT_PATH = "output_realtime_analysis/aggregated_data"
ABS_AGG_PATH = os.path.abspath(AGGREGATED_OUTPUT_PATH)

print("üìÇ Carpeta configurada para lectura:")
print(f"   Relativa : {AGGREGATED_OUTPUT_PATH}")
print(f"   Absoluta : {ABS_AGG_PATH}\n")

REFRESH_INTERVAL = 5
TOP_N = 10

plt.ion()
fig, ax = plt.subplots(figsize=(12, 6))

# =======================================
# 3. FUNCIONES DE DEBUG
# =======================================

def listar_contenido_directorio(path):
    print(f"\nüìÅ Contenido de: {path}")
    if not os.path.exists(path):
        print("‚ùå LA CARPETA NO EXISTE")
        return

    for root, dirs, files in os.walk(path):
        nivel = root.replace(path, "").count(os.sep)
        indent = " " * 4 * nivel
        print(f"{indent}{os.path.basename(root)}/")
        for f in files:
            print(f"{indent}    üìÑ {f}")


def find_all_csv_files():
    pattern = f"{ABS_AGG_PATH}/**/*.csv"
    files = glob.glob(pattern, recursive=True)

    valid_files = [
        f for f in files
        if f.endswith(".csv")
        and "_SUCCESS" not in f
        and "_temporary" not in f
    ]

    print(f"\nüîç Buscando CSV con patr√≥n:")
    print(f"   {pattern}")
    print(f"üìÑ CSV encontrados: {len(valid_files)}")

    for f in valid_files[:5]:
        print(f"   - {f}")

    if len(valid_files) > 5:
        print("   ...")

    return valid_files


def load_all_data():
    sales_by_zone = {}

    files = find_all_csv_files()

    if not files:
        print("‚ö†Ô∏è NO SE ENCONTRARON CSV PARA LEER\n")
        return sales_by_zone

    print("\nüì• Leyendo CSV y acumulando datos...\n")

    for file in files:
        try:
            df = pd.read_csv(file)

            if df.empty:
                print(f"‚ö†Ô∏è CSV vac√≠o: {file}")
                continue

            df.columns = [c.lower() for c in df.columns]

            if "pickup_zone" not in df.columns or "total_sales_zone" not in df.columns:
                print(f"‚ùå Columnas esperadas NO encontradas en: {file}")
                print(f"   Columnas reales: {df.columns.tolist()}")
                continue

            for _, row in df.iterrows():
                zone = row.get("pickup_zone", "UNKNOWN")
                sales = row.get("total_sales_zone", 0)

                if pd.notna(sales):
                    sales_by_zone[zone] = sales_by_zone.get(zone, 0) + float(sales)

        except Exception as e:
            print(f"‚ùå Error leyendo {file}: {e}")

    print(f"\nüìä Zonas acumuladas: {len(sales_by_zone)}\n")
    return sales_by_zone


def update_plot(sales_by_zone):
    ax.clear()

    if not sales_by_zone:
        ax.text(
            0.5, 0.5,
            "‚è≥ Esperando datos del Consumer...",
            ha="center", va="center", fontsize=14
        )
        ax.set_title("Visualizador en Tiempo Real (DEBUG)")
        plt.draw()
        plt.pause(0.1)
        return

    sorted_data = sorted(
        sales_by_zone.items(),
        key=lambda x: x[1],
        reverse=True
    )[:TOP_N]

    zones = [z for z, _ in sorted_data]
    values = [v for _, v in sorted_data]

    y = np.arange(len(zones))

    ax.barh(y, values)
    ax.set_yticks(y)
    ax.set_yticklabels(zones)
    ax.invert_yaxis()

    ax.set_title(
        f"Top {TOP_N} Zonas por Ventas Uber | {datetime.now().strftime('%H:%M:%S')}"
    )
    ax.set_xlabel("Ventas Acumuladas ($)")
    ax.grid(axis="x", linestyle="--", alpha=0.6)

    plt.tight_layout()
    plt.draw()
    plt.pause(0.1)

# =======================================
# 4. MAIN LOOP
# =======================================

if __name__ == "__main__":

    print("üß™ VALIDACI√ìN INICIAL DE DIRECTORIOS")
    listar_contenido_directorio(os.path.dirname(ABS_AGG_PATH))
    listar_contenido_directorio(ABS_AGG_PATH)

    if not os.path.isdir(ABS_AGG_PATH):
        print("\n‚ùå ERROR CR√çTICO: La carpeta de agregados NO EXISTE")
        sys.exit(1)

    print("\nüöÄ Iniciando bucle de monitoreo...\n")

    try:
        while True:
            sales_by_zone = load_all_data()

            print(
                f"[{datetime.now().strftime('%H:%M:%S')}] "
                f"Zonas detectadas: {len(sales_by_zone)}"
            )

            update_plot(sales_by_zone)
            time.sleep(REFRESH_INTERVAL)

    except KeyboardInterrupt:
        print("\nüõë Visualizador detenido por el usuario")
        plt.close()



üî•üî•üî• VISUALIZADOR DEBUG FINAL INICIADO üî•üî•üî•

üìç Directorio actual de ejecuci√≥n (cwd):
   /home/admin/Proyectos/ProyectoFInal

üìÇ Carpeta configurada para lectura:
   Relativa : output_realtime_analysis/aggregated_data
   Absoluta : /home/admin/Proyectos/ProyectoFInal/output_realtime_analysis/aggregated_data

üìä Monitor Kafka ‚Äî seguimiento de eventos y latencia

‚ö†Ô∏è A√∫n no existe el archivo CSV. Esperando datos...
‚ö†Ô∏è A√∫n no existe el archivo CSV. Esperando datos...
‚ö†Ô∏è A√∫n no existe el archivo CSV. Esperando datos...
‚ö†Ô∏è A√∫n no existe el archivo CSV. Esperando datos...
‚ö†Ô∏è A√∫n no existe el archivo CSV. Esperando datos...
‚ö†Ô∏è A√∫n no existe el archivo CSV. Esperando datos...
‚ö†Ô∏è A√∫n no existe el archivo CSV. Esperando datos...
‚ö†Ô∏è A√∫n no existe el archivo CSV. Esperando datos...
‚ö†Ô∏è A√∫n no existe el archivo CSV. Esperando datos...
‚ö†Ô∏è A√∫n no existe el archivo CSV. Esperando datos...
