# Análisis y Predicción de Ventas en una Tienda de Retail (Core)

## **Juan Jose Gini Becker**

### Carga y Preprocesamiento de Datos:
* Carga los datos del archivo CSV utilizando NumPy.
* Realiza un preprocesamiento básico para asegurarte de que los datos estén limpios y listos para su análisis.

In [35]:
import numpy as np

def cargar_datos(ruta_archivo, dtype):
    # Carga los datos del archivo CSV con Numpy
    datos = np.genfromtxt(ruta_archivo, delimiter=',', skip_header=1, dtype=dtype)
    return datos

# Ruta del archivo CSV que contiene los datos a ser analizados
ruta_archivo = '../data/retail_sales_dataset.csv'

# Crear un dtype personalizado para almacenar los datos
transaction_dtype = np.dtype([
    ('transaction_id', 'i4'),          # 32-bit integer
    ('date', 'U10'),                   # String (YYYY-MM-DD)
    ('customer_id', 'U10'),            # String (up to 10 characters)
    ('gender', 'U6'),                  # String (Male, Female)
    ('age', 'i4'),                     # 32-bit integer for Age
    ('product_category', 'U15'),       # String (up to 15 characters)
    ('quantity', 'i4'),                # 32-bit integer
    ('price_per_unit', 'f4'),          # 32-bit float for Price per Unit
    ('total_amount', 'f4')             # 32-bit float for Total Amount
])

datos = cargar_datos(ruta_archivo, transaction_dtype)

np.unique(datos['product_category'])


array(['Beauty', 'Clothing', 'Electronics'], dtype='<U15')

### Exploración de Datos:
* Calcula el total de ventas por producto y por tienda.
* Calcula el promedio de ventas diarias por producto y por tienda.
* Identifica los productos y tiendas con mayores y menores ventas.

In [41]:
# Total de ventas por producto

# Crear array con la lista de productos unicos
productos = np.unique(datos['product_category'])

print('TOTAL DE VENTAS POR PRODUCTO')
# iterar
for producto in productos:
    condicion = datos['product_category'] == producto
    suma_producto = np.sum(datos['total_amount'][condicion])
    print(f'{producto.title()}: {suma_producto:,}')

TOTAL DE VENTAS POR PRODUCTO
Beauty: 143,515.0
Clothing: 155,580.0
Electronics: 156,905.0


In [62]:
# Promedio de ventas diarias por producto

fechas = np.unique(datos['date'])

print('PROMEDIO DE VENTAS DIARIAS POR PRODUCTO')
for fecha in fechas:
    print(f'Fecha: {fecha}')
    for producto in productos:
        condicion = (datos['date'] == fecha) & (datos['product_category'] == producto)
        datos_filtrados = datos['total_amount'][condicion]
        
        if datos_filtrados.size > 0:
            promedio_ventas = np.mean(datos_filtrados)
        else:
            promedio_ventas = 0
            
        print(f'{producto}: {promedio_ventas}')
    print('\n')

PROMEDIO DE VENTAS DIARIAS POR PRODUCTO
Fecha: 2023-01-01
Beauty: 1500.0
Clothing: 1050.0
Electronics: 0


Fecha: 2023-01-02
Beauty: 25.0
Clothing: 825.0
Electronics: 90.0


Fecha: 2023-01-03
Beauty: 600.0
Clothing: 0
Electronics: 0


Fecha: 2023-01-04
Beauty: 545.0
Clothing: 150.0
Electronics: 0


Fecha: 2023-01-05
Beauty: 50.0
Clothing: 0
Electronics: 525.0


Fecha: 2023-01-06
Beauty: 0
Clothing: 500.0
Electronics: 120.0


Fecha: 2023-01-07
Beauty: 0
Clothing: 75.0
Electronics: 75.0


Fecha: 2023-01-08
Beauty: 0
Clothing: 600.0
Electronics: 25.0


Fecha: 2023-01-09
Beauty: 0
Clothing: 200.0
Electronics: 0


Fecha: 2023-01-10
Beauty: 0
Clothing: 30.0
Electronics: 200.0


Fecha: 2023-01-11
Beauty: 95.0
Clothing: 90.0
Electronics: 0


Fecha: 2023-01-13
Beauty: 0
Clothing: 1200.0
Electronics: 243.3333282470703


Fecha: 2023-01-14
Beauty: 387.5
Clothing: 0
Electronics: 0


Fecha: 2023-01-15
Beauty: 60.0
Clothing: 500.0
Electronics: 100.0


Fecha: 2023-01-16
Beauty: 2000.0
Clothing: 0
Elec