In [19]:
import numpy as np

def cargar_datos(ruta_archivo):

    data = np.genfromtxt(ruta_archivo, delimiter=',', names=True, dtype=None, encoding='utf-8')
    return data

if __name__ == "__main__":
    ruta_archivo = '../data/retail_sales_dataset.csv'
    data = cargar_datos(ruta_archivo)
    # print(data)


# Corroborar datos
if data.ndim == 0:
    print("No se han cargado datos desde el archivo o el archivo está vacío.")
else:
    print("\n--- Información de los Datos ---")
    print(f"Número de filas: {data.shape[0]}")
    print(f"Número de columnas: {len(data.dtype.names)}")
    print("Nombres de columnas:", data.dtype.names)

    # Preprocesamiento básico: Verificar si hay datos faltantes
if np.any(np.isnan(data['Total_Amount'])):
    print("Se encontraron datos faltantes en la columna 'Total'.")
else:
    print("No se encontraron datos faltantes.")

# Calcular el total de ventas por categoría de producto
categorias_unicas = np.unique(data['Product_Category'])
totales_por_categoria = {categoria: np.sum(data['Total_Amount'][data['Product_Category'] == categoria]) for categoria in categorias_unicas}

print("\n--- Total de Ventas por Categoría de Producto ---")
for categoria, total in totales_por_categoria.items():
    print(f"{categoria}: {total}")

# Calcular el promedio de ventas diarias por categoría de producto
promedios_diarios = {categoria: np.mean(data['Total_Amount'][data['Product_Category'] == categoria]) for categoria in categorias_unicas}

print("\n--- Promedio de Ventas Diarias por Categoría de Producto ---")
for categoria, promedio in promedios_diarios.items():
    print(f"{categoria}: {promedio:.2f}")

# Identificar las categorías de productos con mayores y menores ventas
categoria_mayor_ventas = max(totales_por_categoria, key=totales_por_categoria.get)
categoria_menor_ventas = min(totales_por_categoria, key=totales_por_categoria.get)

print("\n--- Categorías de Productos ---")
print(f"Mayor ventas: {categoria_mayor_ventas} con total {totales_por_categoria[categoria_mayor_ventas]}")
print(f"Menor ventas: {categoria_menor_ventas} con total {totales_por_categoria[categoria_menor_ventas]}")

# Filtrar datos para mostrar solo las ventas de una categoría de producto específica
categoria_especifica = 'Beauty'
datos_filtrados = data[data['Product_Category'] == categoria_especifica]

# Resumen de la categoría específica
total_ventas = np.sum(datos_filtrados['Total_Amount'])
cantidad_total = np.sum(datos_filtrados['Quantity'])
num_transacciones = len(datos_filtrados)

print(f"\n--- Resumen de Ventas para la categoría '{categoria_especifica}' ---")
print(f"Total Ventas: {total_ventas}")
print(f"Cantidad Total Vendida: {cantidad_total}")
print(f"Número de Transacciones: {num_transacciones}")
print(f"Promedio de Ventas por Transacción: {total_ventas / num_transacciones if num_transacciones > 0 else 0:.2f}")


# Operaciones adicionales
print("\n--- Estadísticas Adicionales de Ventas ---")
if num_transacciones > 0:
# Resta: Total de ventas menos la cantidad total vendida
    diferencia = total_ventas - cantidad_total
    print(f"Diferencia entre Total Ventas y Cantidad Total Vendida: {diferencia}")

# Multiplicación: Precio promedio por unidad vendida
    precio_promedio = total_ventas / cantidad_total if cantidad_total > 0 else 0
    print(f"Precio Promedio por Unidad Vendida: {precio_promedio:.2f}")

# División: Total de ventas dividido por el número de transacciones
    promedio_ventas_por_transaccion = total_ventas / num_transacciones if num_transacciones > 0 else 0
    print(f"Promedio de Ventas por Transacción: {promedio_ventas_por_transaccion:.2f}")


--- Información de los Datos ---
Número de filas: 1000
Número de columnas: 9
Nombres de columnas: ('Transaction_ID', 'Date', 'Customer_ID', 'Gender', 'Age', 'Product_Category', 'Quantity', 'Price_per_Unit', 'Total_Amount')
No se encontraron datos faltantes.

--- Total de Ventas por Categoría de Producto ---
Beauty: 143515
Clothing: 155580
Electronics: 156905

--- Promedio de Ventas Diarias por Categoría de Producto ---
Beauty: 467.48
Clothing: 443.25
Electronics: 458.79

--- Categorías de Productos ---
Mayor ventas: Electronics con total 156905
Menor ventas: Beauty con total 143515

--- Resumen de Ventas para la categoría 'Beauty' ---
Total Ventas: 143515
Cantidad Total Vendida: 771
Número de Transacciones: 307
Promedio de Ventas por Transacción: 467.48

--- Estadísticas Adicionales de Ventas ---
Diferencia entre Total Ventas y Cantidad Total Vendida: 142744
Precio Promedio por Unidad Vendida: 186.14
Promedio de Ventas por Transacción: 467.48
