In [10]:
import pandas as pd
import matplotlib.pyplot as plt

# 1. Cargar el archivo CSV
df_inv = pd.read_csv("data/inventories.csv")
df_sales = pd.read_csv("data/sales.csv")
df_sat = pd.read_csv("data/satisfaction.csv")



# 2. Ver las primeras filas para confirmar la carga
print(df_inv.head())
print(df_sales.head())
print(df_sat.head())


   ID_Tienda    Producto  Stock_Disponible Fecha_Actualizaci√≥n
0          1  Producto A                50          2023-01-05
1          1  Producto B                40          2023-01-06
2          2  Producto A                60          2023-01-07
3          2  Producto C                45          2023-01-08
4          3  Producto A                30          2023-01-09
   ID_Tienda    Producto  Cantidad_Vendida  Precio_Unitario Fecha_Venta
0          1  Producto A                20              100  2023-01-05
1          1  Producto B                15              200  2023-01-06
2          2  Producto A                30              100  2023-01-07
3          2  Producto C                25              300  2023-01-08
4          3  Producto A                10              100  2023-01-09
   ID_Tienda  Satisfacci√≥n_Promedio Fecha_Evaluaci√≥n
0          1                     85       2023-01-15
1          2                     90       2023-01-15
2          3                

In [5]:
# ---------------------------
# Paso 2: Limpieza inicial - eliminar filas con nulos
# ---------------------------
print("\n[Limpieza] Eliminando filas con valores nulos (dropna)...")
df_sales_clean = df_sales.dropna(how="any").reset_index(drop=True)
df_inv_clean = df_inv.dropna(how="any").reset_index(drop=True)
df_sat_clean = df_sat.dropna(how="any").reset_index(drop=True)

print(f" - Sales: {df_sales.shape[0]} -> {df_sales_clean.shape[0]} filas")
print(f" - Inventories: {df_inv.shape[0]} -> {df_inv_clean.shape[0]} filas")
print(f" - Satisfaction: {df_sat.shape[0]} -> {df_sat_clean.shape[0]} filas")


[Limpieza] Eliminando filas con valores nulos (dropna)...
 - Sales: 10 -> 10 filas
 - Inventories: 10 -> 10 filas
 - Satisfaction: 5 -> 5 filas


In [6]:
import sys
import os
import numpy as np


In [11]:
# Para mostrar tablas m√°s amenas en Jupyter
pd.set_option("display.max_columns", 50)
pd.set_option("display.width", 120)

In [13]:
print("\nShapes despu√©s dropna:")
print(" sales:", df_sales.shape)
print(" inventories:", df_inv.shape)
print(" satisfaction:", df_sat.shape)


Shapes despu√©s dropna:
 sales: (10, 5)
 inventories: (10, 4)
 satisfaction: (5, 3)


In [14]:
# Ventas totales por producto
ventas_por_producto = df_sales.groupby("Producto")["Cantidad_Vendida"].sum().reset_index()

print("Ventas totales por producto:")
print(ventas_por_producto)

# Ventas totales por tienda
ventas_por_tienda = df_sales.groupby("ID_Tienda")["Cantidad_Vendida"].sum().reset_index()

print("Ventas totales por tienda:")
print(ventas_por_tienda)



Ventas totales por producto:
     Producto  Cantidad_Vendida
0  Producto A                85
1  Producto B                75
2  Producto C                90
Ventas totales por tienda:
   ID_Tienda  Cantidad_Vendida
0          1                35
1          2                55
2          3                50
3          4                60
4          5                50


In [17]:
# Resumen estad√≠stico b√°sico con describe()
resumen_ventas = df_sales["Cantidad_Vendida"].describe()

print("Resumen estad√≠stico b√°sico de las ventas:")
print(resumen_ventas)

# M√©tricas adicionales
mediana_ventas = df_sales["Cantidad_Vendida"].median()
varianza_ventas = df_sales["Cantidad_Vendida"].var()
desviacion_std = df_sales["Cantidad_Vendida"].std()
total_ventas = df_sales["Cantidad_Vendida"].sum()

print("\nM√©tricas adicionales:")
print(f"Mediana de las ventas: {mediana_ventas}")
print(f"Varianza de las ventas: {varianza_ventas}")
print(f"Desviaci√≥n est√°ndar de las ventas: {desviacion_std}")
print(f"Total de ventas registradas: {total_ventas}")

Resumen estad√≠stico b√°sico de las ventas:
count    10.000000
mean     25.000000
std       9.128709
min      10.000000
25%      20.000000
50%      25.000000
75%      30.000000
max      40.000000
Name: Cantidad_Vendida, dtype: float64

M√©tricas adicionales:
Mediana de las ventas: 25.0
Varianza de las ventas: 83.33333333333333
Desviaci√≥n est√°ndar de las ventas: 9.128709291752768
Total de ventas registradas: 250


In [18]:
# Promedio de ventas por tienda y categor√≠a
promedio_ventas_tienda_categoria = (
    df_sales.groupby(["ID_Tienda", "Producto"])["Cantidad_Vendida"]
    .mean()
    .reset_index()
)

print("Promedio de ventas por tienda y categor√≠a de producto:")
print(promedio_ventas_tienda_categoria)

Promedio de ventas por tienda y categor√≠a de producto:
   ID_Tienda    Producto  Cantidad_Vendida
0          1  Producto A              20.0
1          1  Producto B              15.0
2          2  Producto A              30.0
3          2  Producto C              25.0
4          3  Producto A              10.0
5          3  Producto B              40.0
6          4  Producto A              25.0
7          4  Producto C              35.0
8          5  Producto B              20.0
9          5  Producto C              30.0


In [16]:
# Crear columna de ventas totales por fila
sales["Total_Venta"] = sales["Cantidad_Vendida"] * sales["Precio_Unitario"]

# Ventas totales por tienda
ventas_por_tienda = (
    sales.groupby("ID_Tienda")["Total_Venta"]
    .sum()
    .reset_index()
    .sort_values(by="Total_Venta", ascending=False)
)

print("Ventas totales por tienda:")
print(ventas_por_tienda)


Ventas totales por tienda:
   ID_Tienda  Total_Venta
3          4        13000
4          5        13000
1          2        10500
2          3         9000
0          1         5000


In [19]:
# Crear columna de ventas totales por fila
df_sales["Total_Venta"] = df_sales["Cantidad_Vendida"] * df_sales["Precio_Unitario"]

# Ventas totales por tienda
ventas_por_producto = (
    df_sales.groupby("Producto")["Total_Venta"]
    .sum()
    .reset_index()
    .sort_values(by="Total_Venta", ascending=False)
)

print("Ventas totales por producto:")
print(ventas_por_producto)

Ventas totales por producto:
     Producto  Total_Venta
2  Producto C        27000
1  Producto B        15000
0  Producto A         8500


In [21]:
import pandas as pd

# 1. Crear columna de ventas totales en df_sales
df_sales["Total_Venta"] = df_sales["Cantidad_Vendida"] * df_sales["Precio_Unitario"]

# 2. Agrupar ventas por Tienda y Producto
ventas_agrupadas = (
    df_sales.groupby(["ID_Tienda", "Producto"])["Total_Venta"]
    .sum()
    .reset_index()
)

# 3. Combinar con inventarios
df_rotacion = pd.merge(
    ventas_agrupadas,
    df_inv[["ID_Tienda", "Producto", "Stock_Disponible"]],
    on=["ID_Tienda", "Producto"],
    how="inner"
)

# 4. Calcular rotaci√≥n de inventarios
df_rotacion["Rotacion_Inventario"] = df_rotacion["Total_Venta"] / df_rotacion["Stock_Disponible"]

print("Rotaci√≥n de inventarios por tienda y producto:")
print(df_rotacion.head())


Rotaci√≥n de inventarios por tienda y producto:
   ID_Tienda    Producto  Total_Venta  Stock_Disponible  Rotacion_Inventario
0          1  Producto A         2000                50            40.000000
1          1  Producto B         3000                40            75.000000
2          2  Producto A         3000                60            50.000000
3          2  Producto C         7500                45           166.666667
4          3  Producto A         1000                30            33.333333


In [26]:
# 1. Crear columna de ventas totales en df_sales
df_sales["Total_Venta"] = df_sales["Cantidad_Vendida"] * df_sales["Precio_Unitario"]

# 2. Agrupar ventas por tienda y producto
ventas_agrupadas = (
    df_sales.groupby(["ID_Tienda", "Producto"])["Total_Venta"]
    .sum()
    .reset_index()
)

# 3. Unir ventas con inventarios
df_inv = pd.merge(
    df_inv,
    ventas_agrupadas,
    on=["ID_Tienda", "Producto"],
    how="left"
)

# 4. Calcular rotaci√≥n de inventarios
df_inv["Rotacion_Inventario"] = (
    df_inv["Total_Venta"] / df_inv["Stock_Disponible"]
)

# Reemplazar posibles NaN (productos sin ventas registradas) con 0
df_inv["Rotacion_Inventario"] = df_inv["Rotacion_Inventario"].fillna(0)

print("Inventarios con columna de rotaci√≥n:")
print(df_inv.head())

Inventarios con columna de rotaci√≥n:
   ID_Tienda    Producto  Stock_Disponible Fecha_Actualizaci√≥n  Total_Venta  Rotacion_Inventario
0          1  Producto A                50          2023-01-05         2000            40.000000
1          1  Producto B                40          2023-01-06         3000            75.000000
2          2  Producto A                60          2023-01-07         3000            50.000000
3          2  Producto C                45          2023-01-08         7500           166.666667
4          3  Producto A                30          2023-01-09         1000            33.333333


In [28]:
# 1. Calcular el porcentaje de ventas sobre stock
df_inv["Pct_Ventas_vs_Stock"] = (
    df_inv["Total_Venta"] / df_inv["Stock_Disponible"]
)

# 2. Filtrar inventarios cr√≠ticos (<10%)
inventarios_criticos = df_inv[df_inv["Pct_Ventas_vs_Stock"] < 0.1]

print("Inventarios cr√≠ticos (<10% en ventas respecto al stock disponible):")
print(inventarios_criticos)

Inventarios cr√≠ticos (<10% en ventas respecto al stock disponible):
Empty DataFrame
Columns: [ID_Tienda, Producto, Stock_Disponible, Fecha_Actualizaci√≥n, Total_Venta, Rotacion_Inventario, Pct_Ventas_vs_Stock]
Index: []


In [31]:
# 1. Calcular la satisfacci√≥n promedio por tienda
satisfaccion_promedio = df_sat.groupby("ID_Tienda")["Satisfacci√≥n_Promedio"].mean().reset_index()

print("‚úÖ Satisfacci√≥n promedio por tienda:")
print(satisfaccion_promedio)

# 2. Filtrar tiendas con satisfacci√≥n < 60%
tiendas_baja_satisfaccion = satisfaccion_promedio[satisfaccion_promedio["Satisfacci√≥n_Promedio"] < 60]

print("\n‚ö†Ô∏è Tiendas con satisfacci√≥n menor al 60%:")
print(tiendas_baja_satisfaccion)



‚úÖ Satisfacci√≥n promedio por tienda:
   ID_Tienda  Satisfacci√≥n_Promedio
0          1                   85.0
1          2                   90.0
2          3                   70.0
3          4                   65.0
4          5                   55.0

‚ö†Ô∏è Tiendas con satisfacci√≥n menor al 60%:
   ID_Tienda  Satisfacci√≥n_Promedio
4          5                   55.0


In [32]:
# 1. Ventas totales por tienda
ventas_por_tienda = df_sales.groupby("ID_Tienda")["Cantidad_Vendida"].sum().reset_index()
ventas_por_tienda.rename(columns={"Cantidad_Vendida": "Ventas_Totales"}, inplace=True)

# 2. Satisfacci√≥n promedio por tienda
satisfaccion_promedio = df_sat.groupby("ID_Tienda")["Satisfacci√≥n_Promedio"].mean().reset_index()

# 3. Unir ambos DataFrames
analisis = pd.merge(ventas_por_tienda, satisfaccion_promedio, on="ID_Tienda")

print("‚úÖ An√°lisis combinado de ventas y satisfacci√≥n:")
print(analisis)

# 4. Filtrar tiendas con satisfacci√≥n < 60%
baja_satisfaccion = analisis[analisis["Satisfacci√≥n_Promedio"] < 60]

print("\n‚ö†Ô∏è Tiendas con satisfacci√≥n menor al 60%:")
print(baja_satisfaccion)

# 5. Recomendaciones autom√°ticas simples
for _, row in baja_satisfaccion.iterrows():
    if row["Ventas_Totales"] > analisis["Ventas_Totales"].mean():
        print(f"üëâ Tienda {row['ID_Tienda']} tiene ventas altas pero baja satisfacci√≥n ({row['Satisfacci√≥n_Promedio']}%). Recomendaci√≥n: mejorar la experiencia del cliente (tiempos de espera, atenci√≥n, postventa).")
    else:
        print(f"üëâ Tienda {row['ID_Tienda']} tiene bajas ventas y baja satisfacci√≥n ({row['Satisfacci√≥n_Promedio']}%). Recomendaci√≥n: revisar calidad de producto, promociones y fidelizaci√≥n.")


‚úÖ An√°lisis combinado de ventas y satisfacci√≥n:
   ID_Tienda  Ventas_Totales  Satisfacci√≥n_Promedio
0          1              35                   85.0
1          2              55                   90.0
2          3              50                   70.0
3          4              60                   65.0
4          5              50                   55.0

‚ö†Ô∏è Tiendas con satisfacci√≥n menor al 60%:
   ID_Tienda  Ventas_Totales  Satisfacci√≥n_Promedio
4          5              50                   55.0
üëâ Tienda 5.0 tiene bajas ventas y baja satisfacci√≥n (55.0%). Recomendaci√≥n: revisar calidad de producto, promociones y fidelizaci√≥n.


In [33]:
import numpy as np

# 1. Calcular las ventas totales por tienda
ventas_por_tienda = df_sales.groupby("ID_Tienda")["Cantidad_Vendida"].sum().reset_index()
ventas_por_tienda.rename(columns={"Cantidad_Vendida": "Ventas_Totales"}, inplace=True)

# 2. Convertir la columna Ventas_Totales en un array de NumPy
ventas_array = ventas_por_tienda["Ventas_Totales"].to_numpy()

# 3. Calcular la mediana con NumPy
mediana_ventas = np.median(ventas_array)

# 4. Calcular la desviaci√≥n est√°ndar con NumPy
desviacion_std_ventas = np.std(ventas_array)

print(f"üìä Mediana de las ventas totales: {mediana_ventas}")
print(f"üìä Desviaci√≥n est√°ndar de las ventas totales: {desviacion_std_ventas}")


üìä Mediana de las ventas totales: 50.0
üìä Desviaci√≥n est√°ndar de las ventas totales: 8.366600265340756


In [34]:
# Establecer semilla para reproducibilidad
np.random.seed(42)

# Par√°metros: media y desviaci√≥n est√°ndar de las ventas actuales
media_ventas = np.mean(ventas_array)
desviacion_ventas = np.std(ventas_array)

# Generar proyecci√≥n de ventas futuras para 12 meses (ejemplo)
proyecciones = np.random.normal(loc=media_ventas, scale=desviacion_ventas, size=12)

print("üìà Proyecciones de ventas futuras (12 meses):")
print(proyecciones.round(2))


üìà Proyecciones de ventas futuras (12 meses):
[54.16 48.84 55.42 62.74 48.04 48.04 63.21 56.42 46.07 54.54 46.12 46.1 ]
