In [1]:
"""
Black Friday – GlowBeauty
Objetivo: leer un CSV “a mano”, calcular:
• Nº de registros en la categoría Beauty
• Promedio global de Total Amount

"""

from pathlib import Path
from typing import Generator, Tuple

CSV_PATH = Path(
    "/content/0.y2nvtoqglsp0.1ydeken3zmvretail_sales_dataset.csv"
)

if not CSV_PATH.exists():
    raise FileNotFoundError(
        f"No se encontró el archivo en {CSV_PATH}. "
        "Verifica que esté subido a la sesión de Colab."
    )


In [2]:
def iter_rows(path: Path) -> Generator[list[str], None, None]:
    """
    Itera sobre cada línea del archivo (excepto cabecera) y
    devuelve una lista de columnas ya limpiadas.

    Args:
        path: Ruta al archivo CSV.

    Yields:
        List[str]: columnas de la fila actual.
    """
    with path.open(encoding="utf-8") as file:
        next(file)          # Saltar cabecera
        for raw_line in file:
            stripped = raw_line.strip()
            if not stripped:
                continue     # Ignorar líneas vacías

            cols = [c.strip() for c in stripped.split(",")]

            # Validación mínima (dataset original = 9 columnas)
            if len(cols) != 9:
                continue

            yield cols


def parse_sales(path: Path) -> Tuple[int, int, float]:
    """
    Procesa el CSV completo.

    Returns:
        total_rows      – Número total de registros válidos
        beauty_rows     – Registros con categoría 'Beauty'
        mean_total_amt  – Promedio global de Total Amount
    """
    total_rows = 0
    beauty_rows = 0
    sum_total_amount = 0.0

    for cols in iter_rows(path):
        category = cols[5].lower()       # Product Category
        total_amt = float(cols[8])       # Total Amount

        if category == "beauty":
            beauty_rows += 1

        sum_total_amount += total_amt
        total_rows += 1

    mean_total_amt = (
        sum_total_amount / total_rows if total_rows else 0.0
    )
    return total_rows, beauty_rows, mean_total_amt


In [4]:
def print_report(total: int, beauty: int, mean_amt: float) -> None:
    """Imprime un informe con formato claro."""
    print("\n" + "-" * 46)
    print("  Reporte Black Friday – GlowBeauty")
    print("-" * 46)
    print(f"Número de registros analizados .......... {total:>7}")
    print(f"Registros en la categoría «Beauty» ...... {beauty:>7}")
    print(
        "Promedio global de «Total Amount» .... "
        f"${mean_amt:,.2f}"
    )
    print("-" * 46 + "\n")


In [5]:
if __name__ == "__main__":
    total, beauty, mean_amt = parse_sales(CSV_PATH)
    print_report(total, beauty, mean_amt)



----------------------------------------------
  Reporte Black Friday – GlowBeauty
----------------------------------------------
Número de registros analizados ..........    1000
Registros en la categoría «Beauty» ......     307
Promedio global de «Total Amount» .... $456.00
----------------------------------------------

