### Carga y Preprocesamiento de Datos

In [2]:
import numpy as np

In [None]:
# Carga los datos del archivo CSV utilizando NumPy
def consumo_datos(archivo):
    datos = np.genfromtxt(archivo, delimiter=',', skip_header=1,dtype=str)
    return datos

if __name__ == '__main__':
    archivo = 'csv/retail_sales_dataset.csv'
    datos = consumo_datos(archivo)
print(datos)

[['1' '2023-11-24' 'CUST001' ... '3' '50' '150']
 ['2' '2023-02-27' 'CUST002' ... '2' '500' '1000']
 ['3' '2023-01-13' 'CUST003' ... '1' '30' '30']
 ...
 ['998' '2023-10-29' 'CUST998' ... '4' '25' '100']
 ['999' '2023-12-05' 'CUST999' ... '3' '50' '150']
 ['1000' '2023-04-12' 'CUST1000' ... '4' '30' '120']]


In [None]:
# Imprime las dimensiones
print(datos.shape)
print(datos.size)
print(datos.ndim)

(1000, 9)
9000
2


### Exploración de Datos

In [None]:
# Imprime la lista de atributos
categorias = datos[:,5]
categorias_unicas = np.unique(categorias)
print(categorias_unicas)

['Beauty' 'Clothing' 'Electronics']


In [None]:
# Calcula el total de ventas por categoría
ventas = datos[:,8].astype(int)
totales_ventas = np.zeros(categorias_unicas.shape)

[0. 0. 0.]


In [None]:
# Calcula el total de ventas por categoría
for i, categoria in enumerate(categorias_unicas):
    totales_ventas[i] = np.sum(ventas[categorias == categoria])

In [None]:
# Imprime el total de ventas por categoría
for categoria, total in zip(categorias_unicas, totales_ventas):
    print(f'Total de ventas para categoría {categoria}: {total}')

Total de ventas para categoría Beauty: 143515.0
Total de ventas para categoría Clothing: 155580.0
Total de ventas para categoría Electronics: 156905.0


In [None]:
# Calcula el promedio de ventas diarias para cada categoría
fechas = datos[:,1]
ventas_por_categoria_fecha = {}
for categoria, fecha, venta in zip(categorias, fechas, ventas):
    if (categoria, fecha) not in ventas_por_categoria_fecha:
        ventas_por_categoria_fecha[(categoria, fecha)] = 0
    ventas_por_categoria_fecha[(categoria, fecha)] += venta

In [None]:
# Calcula el promedio de ventas diarias para cada categoría
promedios_ventas = {}
for (categoria, fecha), total_venta in ventas_por_categoria_fecha.items():
    if categoria not in promedios_ventas:
        promedios_ventas[categoria] = {'total': 0, 'count': 0}
    promedios_ventas[categoria]['total'] += total_venta
    promedios_ventas[categoria]['count'] += 1

In [None]:
# Imprime el promedio de ventas diarias para cada categoría
for categoria, datos in promedios_ventas.items():
    promedio = datos['total'] / datos['count']  # Calcular promedio
    print(f'Promedio de ventas diarias para categoría {categoria}: {promedio:.2f}')

Promedio de ventas diarias para categoría Beauty: 703.50
Promedio de ventas diarias para categoría Clothing: 670.60
Promedio de ventas diarias para categoría Electronics: 716.46


In [None]:
# Calcula el total de ventas por categoría
ventas_totales_por_categoria = {}
for categoria in categorias_unicas:
    ventas_totales_por_categoria[categoria] = np.sum(ventas[categorias == categoria])

In [None]:
# Calcula el total de ventas por categoría
categoria_mayor_venta = max(ventas_totales_por_categoria, key=ventas_totales_por_categoria.get)
categoria_menor_venta = min(ventas_totales_por_categoria, key=ventas_totales_por_categoria.get)
print(f'Categoría con mayores ventas: {categoria_mayor_venta} con un total de {ventas_totales_por_categoria[categoria_mayor_venta]}')
print(f'Categoría con menores ventas: {categoria_menor_venta} con un total de {ventas_totales_por_categoria[categoria_menor_venta]}')

Categoría con mayores ventas: Electronics con un total de 156905
Categoría con menores ventas: Beauty con un total de 143515


### Manipulación de Datos

In [None]:
# Crea un arreglo con las ventas para la categoría especificada
categoria_especifica = "Electronics"
ventas_categoria_especifica = datos[datos[:,5] == categoria_especifica]
print(f'Ventas para la categoría {categoria_especifica}:')
print(ventas_categoria_especifica)

Ventas para la categoría Electronics:
[['3' '2023-01-13' 'CUST003' ... '1' '30' '30']
 ['8' '2023-02-22' 'CUST008' ... '4' '25' '100']
 ['9' '2023-12-13' 'CUST009' ... '2' '300' '600']
 ...
 ['993' '2023-02-06' 'CUST993' ... '3' '50' '150']
 ['999' '2023-12-05' 'CUST999' ... '3' '50' '150']
 ['1000' '2023-04-12' 'CUST1000' ... '4' '30' '120']]
