In [10]:
import numpy as np

def cargar_datos(ruta_archivo):
    # Cargar todos los datos como texto, incluyendo encabezado
    datos = np.genfromtxt(ruta_archivo, delimiter=',', dtype=str, encoding='utf-8')
    return datos

def procesar_datos(datos):
    # Separar encabezado y datos
    nombres_columnas = datos[0]  # Encabezado
    datos = datos[1:]  # Excluir la primera fila (encabezado)

    # Extraer columnas de interés: categoría, cantidad y total de ventas
    categorias = datos[:, 5]  # Columna "Product Category"
    cantidad_texto = datos[:, 6]  # Columna "Quantity"
    total_texto = datos[:, 8]  # Columna "Total Amount"

    # Convertir las columnas de cantidad y total a numérico
    cantidad = np.array([int(x) if x.isdigit() else 0 for x in cantidad_texto])
    total = np.array([float(x) if x.replace('.', '', 1).isdigit() else 0.0 for x in total_texto])

    # Obtener categorías únicas
    categorias_unicas = np.unique(categorias)
    
    return categorias, cantidad, total, categorias_unicas

def calcular_estadisticas(categorias, cantidad, total, categorias_unicas):
    # Inicializar diccionarios para almacenar los resultados
    total_por_categoria = {}
    promedio_por_categoria = {}

    # Calcular el total y el promedio de ventas por categoría
    for cat in categorias_unicas:
        ventas_cat = total[categorias == cat]
        total_ventas = ventas_cat.sum()
        promedio_ventas_diarias = ventas_cat.mean()

        total_por_categoria[cat] = total_ventas
        promedio_por_categoria[cat] = promedio_ventas_diarias

    # Identificar las categorías con mayores y menores ventas
    categoria_mayor_ventas = max(total_por_categoria, key=total_por_categoria.get)
    categoria_menor_ventas = min(total_por_categoria, key=total_por_categoria.get)
    
    return total_por_categoria, promedio_por_categoria, categoria_mayor_ventas, categoria_menor_ventas

def main():
    ruta_archivo = r'C:\SOFTWARE DEVELOPMENT\CodingDojo-Tareas\Clonado de GitHub\Datasets\retail_sales_dataset.csv'
    datos = cargar_datos(ruta_archivo)
    categorias, cantidad, total, categorias_unicas = procesar_datos(datos)
    total_por_categoria, promedio_por_categoria, categoria_mayor_ventas, categoria_menor_ventas = calcular_estadisticas(
        categorias, cantidad, total, categorias_unicas
    )

    # Imprimir los resultados
    print("Total de ventas por categoría:")
    for cat, total in total_por_categoria.items():
        print(f"{cat}: {total}")

    print("\nPromedio de ventas diarias por categoría:")
    for cat, promedio in promedio_por_categoria.items():
        # Formatear el promedio a dos decimales
        print(f"{cat}: {promedio:.2f}")

    print(f"\nCategoría con mayores ventas: {categoria_mayor_ventas} ({total_por_categoria[categoria_mayor_ventas]})")
    print(f"Categoría con menores ventas: {categoria_menor_ventas} ({total_por_categoria[categoria_menor_ventas]})")

# Ejecutar el script principal
if __name__ == "__main__":
    main()


Total de ventas por categoría:
Beauty: 143515.0
Clothing: 155580.0
Electronics: 156905.0

Promedio de ventas diarias por categoría:
Beauty: 467.48
Clothing: 443.25
Electronics: 458.79

Categoría con mayores ventas: Electronics (156905.0)
Categoría con menores ventas: Beauty (143515.0)
