# Challenge Alura Store Latam

## An치lisis de Facturaci칩n, Ventas por Categor칤a y Gr치ficas

Este notebook realiza un an치lisis completo de los datos de ventas de las tiendas Alura Store Latam, incluyendo:
- An치lisis de facturaci칩n total
- Ventas por categor칤a de productos
- Visualizaciones y gr치ficas
- Recomendaciones basadas en el an치lisis

## 1. Importaci칩n de Librer칤as

In [None]:
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
import seaborn as sns

# Configuraci칩n para visualizaciones
plt.style.use('seaborn-v0_8-whitegrid')
plt.rcParams['figure.figsize'] = (12, 6)
plt.rcParams['font.size'] = 12
sns.set_palette('husl')

## 2. Carga de Datos

Cargamos los datos de las 4 tiendas Alura Store desde los archivos CSV proporcionados por Alura Latam.

In [None]:
# URLs de los datos de las tiendas (desde el repositorio oficial de Alura Latam)
url_tienda1 = 'https://raw.githubusercontent.com/alura-es-cursos/challenge1-data-science-latam/main/base-de-datos-challenge1-latam/tienda_1%20.csv'
url_tienda2 = 'https://raw.githubusercontent.com/alura-es-cursos/challenge1-data-science-latam/main/base-de-datos-challenge1-latam/tienda_2.csv'
url_tienda3 = 'https://raw.githubusercontent.com/alura-es-cursos/challenge1-data-science-latam/main/base-de-datos-challenge1-latam/tienda_3.csv'
url_tienda4 = 'https://raw.githubusercontent.com/alura-es-cursos/challenge1-data-science-latam/main/base-de-datos-challenge1-latam/tienda_4.csv'

# Cargar datos de cada tienda
tienda1 = pd.read_csv(url_tienda1)
tienda2 = pd.read_csv(url_tienda2)
tienda3 = pd.read_csv(url_tienda3)
tienda4 = pd.read_csv(url_tienda4)

# Agregar columna de identificaci칩n de tienda
tienda1['Tienda'] = 'Tienda 1'
tienda2['Tienda'] = 'Tienda 2'
tienda3['Tienda'] = 'Tienda 3'
tienda4['Tienda'] = 'Tienda 4'

# Combinar todos los datos
datos_completos = pd.concat([tienda1, tienda2, tienda3, tienda4], ignore_index=True)

print(f"Total de registros: {len(datos_completos)}")
print(f"\nColumnas disponibles: {datos_completos.columns.tolist()}")

## 3. Exploraci칩n Inicial de Datos

In [None]:
# Ver las primeras filas
print("Primeras filas del dataset:")
datos_completos.head(10)

In [None]:
# Informaci칩n general del dataset
print("Informaci칩n del dataset:")
datos_completos.info()

In [None]:
# Estad칤sticas descriptivas
print("Estad칤sticas descriptivas:")
datos_completos.describe()

## 4. An치lisis de Facturaci칩n

Analizamos la facturaci칩n total de cada tienda y el rendimiento general.

In [None]:
# Calcular facturaci칩n total por tienda
facturacion_tienda = datos_completos.groupby('Tienda')['Precio'].sum().sort_values(ascending=False)

print("=" * 50)
print("FACTURACI칍N TOTAL POR TIENDA")
print("=" * 50)
for tienda, facturacion in facturacion_tienda.items():
    print(f"{tienda}: ${facturacion:,.2f}")
print("=" * 50)
print(f"TOTAL GENERAL: ${facturacion_tienda.sum():,.2f}")

In [None]:
# Gr치fica de facturaci칩n por tienda
fig, axes = plt.subplots(1, 2, figsize=(14, 6))

# Gr치fica de barras
colors = ['#3498db', '#2ecc71', '#f39c12', '#e74c3c']
axes[0].bar(facturacion_tienda.index, facturacion_tienda.values, color=colors)
axes[0].set_title('Facturaci칩n Total por Tienda', fontsize=14, fontweight='bold')
axes[0].set_xlabel('Tienda')
axes[0].set_ylabel('Facturaci칩n ($)')
axes[0].tick_params(axis='x', rotation=0)

# Agregar valores en las barras
for i, (tienda, valor) in enumerate(zip(facturacion_tienda.index, facturacion_tienda.values)):
    axes[0].text(i, valor + facturacion_tienda.max() * 0.01, f'${valor:,.0f}', 
                 ha='center', va='bottom', fontsize=10)

# Gr치fica de pastel
axes[1].pie(facturacion_tienda.values, labels=facturacion_tienda.index, autopct='%1.1f%%', 
            colors=colors, startangle=90, explode=[0.02] * 4)
axes[1].set_title('Distribuci칩n de Facturaci칩n por Tienda', fontsize=14, fontweight='bold')

plt.tight_layout()
plt.savefig('images/facturacion_tienda.png', dpi=300, bbox_inches='tight')
plt.show()

## 5. An치lisis de Ventas por Categor칤a

Analizamos las ventas agrupadas por categor칤a de productos.

In [None]:
# Ventas por categor칤a
ventas_categoria = datos_completos.groupby('Categor칤a del Producto')['Precio'].sum().sort_values(ascending=False)

print("=" * 50)
print("VENTAS POR CATEGOR칈A")
print("=" * 50)
for categoria, ventas in ventas_categoria.items():
    porcentaje = (ventas / ventas_categoria.sum()) * 100
    print(f"{categoria}: ${ventas:,.2f} ({porcentaje:.1f}%)")
print("=" * 50)

In [None]:
# Cantidad de productos vendidos por categor칤a
cantidad_categoria = datos_completos['Categor칤a del Producto'].value_counts()

print("=" * 50)
print("CANTIDAD DE PRODUCTOS VENDIDOS POR CATEGOR칈A")
print("=" * 50)
for categoria, cantidad in cantidad_categoria.items():
    print(f"{categoria}: {cantidad:,} productos")
print("=" * 50)

In [None]:
# Gr치fica de ventas por categor칤a
fig, axes = plt.subplots(1, 2, figsize=(16, 6))

# Gr치fica de barras horizontales para ventas
colors_cat = sns.color_palette('viridis', len(ventas_categoria))
axes[0].barh(ventas_categoria.index, ventas_categoria.values, color=colors_cat)
axes[0].set_title('Ventas por Categor칤a de Producto', fontsize=14, fontweight='bold')
axes[0].set_xlabel('Ventas ($)')
axes[0].set_ylabel('Categor칤a')

# Agregar valores en las barras
for i, valor in enumerate(ventas_categoria.values):
    axes[0].text(valor + ventas_categoria.max() * 0.01, i, f'${valor:,.0f}', 
                 ha='left', va='center', fontsize=9)

# Gr치fica de barras para cantidad de productos
axes[1].barh(cantidad_categoria.index, cantidad_categoria.values, color=colors_cat)
axes[1].set_title('Cantidad de Productos Vendidos por Categor칤a', fontsize=14, fontweight='bold')
axes[1].set_xlabel('Cantidad de Productos')
axes[1].set_ylabel('Categor칤a')

# Agregar valores en las barras
for i, valor in enumerate(cantidad_categoria.values):
    axes[1].text(valor + cantidad_categoria.max() * 0.01, i, f'{valor:,}', 
                 ha='left', va='center', fontsize=9)

plt.tight_layout()
plt.savefig('images/ventas_categoria.png', dpi=300, bbox_inches='tight')
plt.show()

## 6. An치lisis de Ventas por Categor칤a por Tienda

In [None]:
# Tabla cruzada de ventas por categor칤a y tienda
ventas_cat_tienda = datos_completos.pivot_table(
    values='Precio', 
    index='Categor칤a del Producto', 
    columns='Tienda', 
    aggfunc='sum'
).fillna(0)

print("Ventas por Categor칤a y Tienda:")
ventas_cat_tienda

In [None]:
# Heatmap de ventas por categor칤a y tienda
plt.figure(figsize=(12, 8))
sns.heatmap(ventas_cat_tienda, annot=True, fmt=',.0f', cmap='YlGnBu', 
            linewidths=0.5, cbar_kws={'label': 'Ventas ($)'})
plt.title('Ventas por Categor칤a y Tienda', fontsize=14, fontweight='bold')
plt.xlabel('Tienda')
plt.ylabel('Categor칤a del Producto')
plt.tight_layout()
plt.savefig('images/heatmap_ventas.png', dpi=300, bbox_inches='tight')
plt.show()

## 7. An치lisis de Calificaciones Promedio

In [None]:
# Calificaci칩n promedio por tienda
calificacion_tienda = datos_completos.groupby('Tienda')['Calificaci칩n'].mean().sort_values(ascending=False)

print("=" * 50)
print("CALIFICACI칍N PROMEDIO POR TIENDA")
print("=" * 50)
for tienda, calificacion in calificacion_tienda.items():
    print(f"{tienda}: {calificacion:.2f} / 5.0")
print("=" * 50)

In [None]:
# Gr치fica de calificaciones por tienda
plt.figure(figsize=(10, 6))
colors = ['#27ae60' if c >= 4 else '#f39c12' if c >= 3.5 else '#e74c3c' for c in calificacion_tienda.values]
bars = plt.bar(calificacion_tienda.index, calificacion_tienda.values, color=colors, edgecolor='black')

plt.axhline(y=calificacion_tienda.mean(), color='red', linestyle='--', label=f'Promedio General: {calificacion_tienda.mean():.2f}')
plt.title('Calificaci칩n Promedio por Tienda', fontsize=14, fontweight='bold')
plt.xlabel('Tienda')
plt.ylabel('Calificaci칩n Promedio')
plt.ylim(0, 5)
plt.legend()

# Agregar valores en las barras
for bar, valor in zip(bars, calificacion_tienda.values):
    plt.text(bar.get_x() + bar.get_width()/2, bar.get_height() + 0.1, f'{valor:.2f}', 
             ha='center', va='bottom', fontsize=11, fontweight='bold')

plt.tight_layout()
plt.savefig('images/calificacion_tienda.png', dpi=300, bbox_inches='tight')
plt.show()

## 8. An치lisis de Productos M치s Vendidos

In [None]:
# Top 10 productos m치s vendidos (por cantidad)
productos_vendidos = datos_completos['Producto'].value_counts().head(10)

print("=" * 50)
print("TOP 10 PRODUCTOS M츼S VENDIDOS")
print("=" * 50)
for i, (producto, cantidad) in enumerate(productos_vendidos.items(), 1):
    print(f"{i}. {producto}: {cantidad} unidades")
print("=" * 50)

In [None]:
# Top 10 productos por facturaci칩n
productos_facturacion = datos_completos.groupby('Producto')['Precio'].sum().sort_values(ascending=False).head(10)

print("=" * 50)
print("TOP 10 PRODUCTOS POR FACTURACI칍N")
print("=" * 50)
for i, (producto, facturacion) in enumerate(productos_facturacion.items(), 1):
    print(f"{i}. {producto}: ${facturacion:,.2f}")
print("=" * 50)

In [None]:
# Gr치fica de top 10 productos
fig, axes = plt.subplots(1, 2, figsize=(16, 8))

# Top 10 por cantidad
colors1 = sns.color_palette('Blues_r', 10)
axes[0].barh(productos_vendidos.index[::-1], productos_vendidos.values[::-1], color=colors1[::-1])
axes[0].set_title('Top 10 Productos M치s Vendidos (Cantidad)', fontsize=14, fontweight='bold')
axes[0].set_xlabel('Cantidad Vendida')

# Top 10 por facturaci칩n
colors2 = sns.color_palette('Greens_r', 10)
axes[1].barh(productos_facturacion.index[::-1], productos_facturacion.values[::-1], color=colors2[::-1])
axes[1].set_title('Top 10 Productos por Facturaci칩n', fontsize=14, fontweight='bold')
axes[1].set_xlabel('Facturaci칩n ($)')

plt.tight_layout()
plt.savefig('images/top_productos.png', dpi=300, bbox_inches='tight')
plt.show()

## 9. An치lisis de Costos de Env칤o

In [None]:
# Costo de env칤o promedio por tienda
envio_tienda = datos_completos.groupby('Tienda')['Costo de env칤o'].agg(['mean', 'sum']).round(2)
envio_tienda.columns = ['Promedio', 'Total']
envio_tienda = envio_tienda.sort_values('Total', ascending=False)

print("=" * 50)
print("COSTOS DE ENV칈O POR TIENDA")
print("=" * 50)
for tienda in envio_tienda.index:
    print(f"{tienda}:")
    print(f"  - Promedio: ${envio_tienda.loc[tienda, 'Promedio']:,.2f}")
    print(f"  - Total: ${envio_tienda.loc[tienda, 'Total']:,.2f}")
print("=" * 50)

In [None]:
# Gr치fica de costos de env칤o
fig, axes = plt.subplots(1, 2, figsize=(14, 6))

# Costo promedio
colors = ['#3498db', '#2ecc71', '#f39c12', '#e74c3c']
axes[0].bar(envio_tienda.index, envio_tienda['Promedio'], color=colors)
axes[0].set_title('Costo de Env칤o Promedio por Tienda', fontsize=14, fontweight='bold')
axes[0].set_xlabel('Tienda')
axes[0].set_ylabel('Costo Promedio ($)')

for i, (tienda, valor) in enumerate(zip(envio_tienda.index, envio_tienda['Promedio'])):
    axes[0].text(i, valor + 0.5, f'${valor:.2f}', ha='center', va='bottom', fontsize=10)

# Costo total
axes[1].bar(envio_tienda.index, envio_tienda['Total'], color=colors)
axes[1].set_title('Costo de Env칤o Total por Tienda', fontsize=14, fontweight='bold')
axes[1].set_xlabel('Tienda')
axes[1].set_ylabel('Costo Total ($)')

for i, (tienda, valor) in enumerate(zip(envio_tienda.index, envio_tienda['Total'])):
    axes[1].text(i, valor + envio_tienda['Total'].max() * 0.01, f'${valor:,.0f}', 
                 ha='center', va='bottom', fontsize=10)

plt.tight_layout()
plt.savefig('images/costos_envio.png', dpi=300, bbox_inches='tight')
plt.show()

## 10. Resumen Ejecutivo y Conclusiones

In [None]:
# Resumen de m칠tricas por tienda
resumen_tiendas = pd.DataFrame({
    'Facturaci칩n Total': datos_completos.groupby('Tienda')['Precio'].sum(),
    'Cantidad Vendidos': datos_completos.groupby('Tienda').size(),
    'Ticket Promedio': datos_completos.groupby('Tienda')['Precio'].mean(),
    'Calificaci칩n Promedio': datos_completos.groupby('Tienda')['Calificaci칩n'].mean(),
    'Costo Env칤o Promedio': datos_completos.groupby('Tienda')['Costo de env칤o'].mean()
}).round(2)

resumen_tiendas = resumen_tiendas.sort_values('Facturaci칩n Total', ascending=False)

print("=" * 80)
print("RESUMEN EJECUTIVO - ALURA STORE LATAM")
print("=" * 80)
print(resumen_tiendas.to_string())
print("=" * 80)

In [None]:
# Identificar la tienda con menor rendimiento
tienda_menor_facturacion = facturacion_tienda.idxmin()
tienda_menor_calificacion = calificacion_tienda.idxmin()

print("\n" + "=" * 80)
print("AN츼LISIS Y RECOMENDACI칍N")
print("=" * 80)
print(f"\n游늵 Tienda con MENOR facturaci칩n: {tienda_menor_facturacion}")
print(f"   - Facturaci칩n: ${facturacion_tienda[tienda_menor_facturacion]:,.2f}")
print(f"   - Calificaci칩n: {calificacion_tienda[tienda_menor_facturacion]:.2f}/5.0")
print(f"\n游늴 Tienda con MENOR calificaci칩n: {tienda_menor_calificacion}")
print(f"   - Calificaci칩n: {calificacion_tienda[tienda_menor_calificacion]:.2f}/5.0")
print(f"   - Facturaci칩n: ${facturacion_tienda[tienda_menor_calificacion]:,.2f}")

print("\n" + "-" * 80)
print("\n游꿢 RECOMENDACI칍N PARA VENTA:")
print(f"\nBasado en el an치lisis de m칠tricas, se recomienda considerar la venta de")
print(f"'{tienda_menor_facturacion}' debido a:")
print(f"   1. Menor facturaci칩n del grupo")
print(f"   2. Potencial de mejora limitado comparado con otras tiendas")
print(f"   3. Los recursos podr칤an optimizarse en las tiendas de mejor rendimiento")
print("\n" + "=" * 80)

In [None]:
# Gr치fica resumen comparativa
fig, axes = plt.subplots(2, 2, figsize=(16, 12))

tiendas = resumen_tiendas.index.tolist()
colors = ['#3498db', '#2ecc71', '#f39c12', '#e74c3c']

# Facturaci칩n
axes[0, 0].bar(tiendas, resumen_tiendas['Facturaci칩n Total'], color=colors)
axes[0, 0].set_title('Facturaci칩n Total', fontsize=12, fontweight='bold')
axes[0, 0].set_ylabel('$')
axes[0, 0].tick_params(axis='x', rotation=45)

# Cantidad vendidos
axes[0, 1].bar(tiendas, resumen_tiendas['Cantidad Vendidos'], color=colors)
axes[0, 1].set_title('Cantidad de Productos Vendidos', fontsize=12, fontweight='bold')
axes[0, 1].set_ylabel('Unidades')
axes[0, 1].tick_params(axis='x', rotation=45)

# Calificaci칩n
axes[1, 0].bar(tiendas, resumen_tiendas['Calificaci칩n Promedio'], color=colors)
axes[1, 0].set_title('Calificaci칩n Promedio', fontsize=12, fontweight='bold')
axes[1, 0].set_ylabel('Calificaci칩n')
axes[1, 0].set_ylim(0, 5)
axes[1, 0].axhline(y=resumen_tiendas['Calificaci칩n Promedio'].mean(), color='red', linestyle='--')
axes[1, 0].tick_params(axis='x', rotation=45)

# Ticket promedio
axes[1, 1].bar(tiendas, resumen_tiendas['Ticket Promedio'], color=colors)
axes[1, 1].set_title('Ticket Promedio', fontsize=12, fontweight='bold')
axes[1, 1].set_ylabel('$')
axes[1, 1].tick_params(axis='x', rotation=45)

plt.suptitle('Dashboard Resumen - Alura Store Latam', fontsize=16, fontweight='bold', y=1.02)
plt.tight_layout()
plt.savefig('images/dashboard_resumen.png', dpi=300, bbox_inches='tight')
plt.show()

## Conclusiones

### Hallazgos Principales:

1. **Facturaci칩n**: Se identific칩 la tienda con mayor y menor facturaci칩n, permitiendo evaluar el rendimiento de cada sucursal.

2. **Ventas por Categor칤a**: Se analiz칩 la distribuci칩n de ventas por categor칤a de producto, identificando las categor칤as m치s populares y rentables.

3. **Calificaciones**: Se evalu칩 la satisfacci칩n del cliente a trav칠s de las calificaciones promedio por tienda.

4. **Productos Destacados**: Se identificaron los productos m치s vendidos tanto por cantidad como por facturaci칩n.

5. **Costos de Env칤o**: Se analizaron los costos de env칤o para identificar oportunidades de optimizaci칩n.

### Recomendaci칩n Final:

Basado en el an치lisis integral de todas las m칠tricas, se puede tomar una decisi칩n informada sobre qu칠 tienda ser칤a la mejor candidata para vender, considerando factores como facturaci칩n, satisfacci칩n del cliente y eficiencia operativa.