In [None]:
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns


# Cargar archivos CSV
tienda1 = pd.read_csv("./data/tienda_1.csv")
tienda2 = pd.read_csv("./data/tienda_2.csv")
tienda3 = pd.read_csv("./data/tienda_3.csv")
tienda4 = pd.read_csv("./data/tienda_4.csv")  

# Agregar etiquetas de tienda
tienda1["Tienda"] = "Tienda 1"
tienda2["Tienda"] = "Tienda 2"
tienda3["Tienda"] = "Tienda 3"
tienda4["Tienda"] = "Tienda 4"

# Unir todos los DataFrames
tiendas = pd.concat([tienda1, tienda2, tienda3, tienda4], ignore_index=True)

# ---------------------- Análisis ---------------------- #

# 1. Facturación total
facturacion_total = tiendas.groupby("Tienda")["Precio"].sum()

# 2. Categorías más vendidas
ventas_por_categoria = tiendas.groupby(["Tienda", "Categoría del Producto"])["Producto"].count().reset_index()
ventas_por_categoria = ventas_por_categoria.sort_values(["Tienda", "Producto"], ascending=[True, False])

# 3. Calificación promedio
calificacion_promedio = tiendas.groupby("Tienda")["Calificación"].mean()

# 4. Productos más y menos vendidos
productos_mas_vendidos = tiendas.groupby(["Tienda", "Producto"]).size().reset_index(name="Cantidad")
producto_top = productos_mas_vendidos.sort_values(["Tienda", "Cantidad"], ascending=[True, False]).groupby("Tienda").first().reset_index()
producto_bottom = productos_mas_vendidos.sort_values(["Tienda", "Cantidad"], ascending=[True, True]).groupby("Tienda").first().reset_index()

# 5. Costo promedio de envío
envio_promedio = tiendas.groupby("Tienda")["Costo de envío"].mean()

# ---------------------- Visualizaciones ---------------------- #

sns.set(style="whitegrid")
plt.rcParams["figure.figsize"] = (10, 6)

# 1. Facturación total
facturacion_total.plot(kind="bar", title="Facturación Total por Tienda", ylabel="Pesos", color="skyblue")
plt.tight_layout()
plt.show()

# 2. Categorías más populares (Top 5 por tienda)
top_categorias = ventas_por_categoria.groupby("Tienda").head(5)
sns.catplot(data=top_categorias, x="Producto", y="Categoría del Producto", col="Tienda", kind="bar", sharex=False, sharey=False)
plt.suptitle("Top 5 Categorías por Tienda", y=1.05)
plt.show()

# 3. Calificación promedio
calificacion_promedio.plot(kind="bar", title="Calificación Promedio por Tienda", ylabel="Puntaje", color="orange")
plt.tight_layout()
plt.show()

# 4. Producto más vendido
sns.barplot(data=producto_top, x="Tienda", y="Cantidad", hue="Producto")
plt.title("Producto Más Vendido por Tienda")
plt.tight_layout()
plt.show()

# 5. Producto menos vendido
sns.barplot(data=producto_bottom, x="Tienda", y="Cantidad", hue="Producto")
plt.title("Producto Menos Vendido por Tienda")
plt.tight_layout()
plt.show()

# 6. Envío promedio
envio_promedio.plot(kind="bar", title="Costo Promedio de Envío por Tienda", ylabel="Pesos", color="green")
plt.tight_layout()
plt.show()


ModuleNotFoundError: No module named 'pandas'