In [36]:
from google.colab import drive
drive.mount('/content/drive')

Drive already mounted at /content/drive; to attempt to forcibly remount, call drive.mount("/content/drive", force_remount=True).


In [40]:
import numpy as np

#Ignacio Antillanca

# cargar el archivo csv con encabezados formato tabla
datos = np.genfromtxt('/content/retail_sales_dataset.csv', delimiter=',', dtype=None, encoding='utf-8', names=True)

# filtrar NaN de campos numericos
datos_limpios = datos[~np.isnan(datos['Quantity']) & ~np.isnan(datos['Price_per_Unit']) & ~np.isnan(datos['Total_Amount'])]

# calcula el total de ventas por categoría de producto.
categorias = np.unique(datos_limpios['Product_Category'])
print("Total de ventas por categoria: $")

for cat in categorias:
    total = np.sum(datos_limpios['Total_Amount'][datos_limpios['Product_Category'] == cat])
    print(f"  {cat}: ${total:.2f}")

# calcula el promedio de ventas diarias por categoría de producto.
print("Promedio diario por categoria: $")

for cat in categorias:
    promedio = np.mean(datos_limpios['Total_Amount'][datos_limpios['Product_Category'] == cat])
    print(f"  {cat}: ${promedio:.2f}")

# identifica las categorías de productos con mayores y menores ventas.
totales = np.array([np.sum(datos_limpios['Total_Amount'][datos_limpios['Product_Category'] == cat]) for cat in categorias])

max = categorias[np.argmax(totales)]
min = categorias[np.argmin(totales)]

print(f"Mayor venta: {max} con ${np.max(totales):.2f}")
print(f"Menor venta: {min} con ${np.min(totales):.2f}")

# Filtra los datos para mostrar solo las ventas de una categoría de producto específica. (Beauty, Clothing, Electronics)
filtro = datos_limpios[datos_limpios['Product_Category'] == 'Electronics']
print(f"Primera fila de Electronics: {filtro[:1]}")

# Realiza operaciones de suma, resta, multiplicación y división en los datos para obtener estadísticas adicionales.
ventas = filtro['Total_Amount']
print("Operaciones sobre Electronics:")
print(f"Suma total: {np.sum(ventas):.2f}")
print(f"Resta 50: {ventas[:3] - 50}")
print(f"Multiplicación por 2: {ventas[:3] * 2}")
print(f"División por 2: {ventas[:3] / 2}")


Total de ventas por categoria: $
  Beauty: $143515.00
  Clothing: $155580.00
  Electronics: $156905.00
Promedio diario por categoria: $
  Beauty: $467.48
  Clothing: $443.25
  Electronics: $458.79
Mayor venta: Electronics con $156905.00
Menor venta: Beauty con $143515.00
Primeras filas de Electronics: [(3, '2023-01-13', 'CUST003', 'Male', 50, 'Electronics', 1, 30, 30)]
Operaciones sobre Electronics:
Suma total: 156905.00
Resta 50: [-20  50 550]
Multiplicación por 2: [  60  200 1200]
División por 2: [ 15.  50. 300.]
