# *Importación de datos*


In [None]:
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns


url = "https://raw.githubusercontent.com/alura-es-cursos/challenge1-data-science-latam/refs/heads/main/base-de-datos-challenge1-latam/tienda_1%20.csv"
url2 = "https://raw.githubusercontent.com/alura-es-cursos/challenge1-data-science-latam/refs/heads/main/base-de-datos-challenge1-latam/tienda_2.csv"
url3 = "https://raw.githubusercontent.com/alura-es-cursos/challenge1-data-science-latam/refs/heads/main/base-de-datos-challenge1-latam/tienda_3.csv"
url4 = "https://raw.githubusercontent.com/alura-es-cursos/challenge1-data-science-latam/refs/heads/main/base-de-datos-challenge1-latam/tienda_4.csv"

tienda = pd.read_csv(url)
tienda2 = pd.read_csv(url2)
tienda3 = pd.read_csv(url3)
tienda4 = pd.read_csv(url4)


In [None]:
# Seleccionar columnas necesarias
columnas_utiles = ['Producto', 'Precio', 'Calificación', 'Costo de envío']

tienda['Tienda'] = 'Tienda 1'
tienda2['Tienda'] = 'Tienda 2'
tienda3['Tienda'] = 'Tienda 3'
tienda4['Tienda'] = 'Tienda 4'

tienda_filtrada = tienda[columnas_utiles + ['Tienda']]
tienda2_filtrada = tienda2[columnas_utiles + ['Tienda']]
tienda3_filtrada = tienda3[columnas_utiles + ['Tienda']]
tienda4_filtrada = tienda4[columnas_utiles + ['Tienda']]

# Unimos los datos filtrados
df = pd.concat([tienda_filtrada, tienda2_filtrada, tienda3_filtrada, tienda4_filtrada], ignore_index=True)

In [None]:
# Agrupamos por tienda y calculamos
resumen = df.groupby('Tienda').agg({
    'Precio': ['sum', 'mean'],
    'Calificación': 'mean',
    'Costo de envío': 'mean',
    'Producto': 'count'
})

# Ajustar nombres de columnas
resumen.columns = ['Ventas Totales', 'Ticket Promedio', 'Calificación Promedio', 'Costo Envio Promedio', 'Número de Ventas']
resumen = resumen.reset_index()


# 📊 **1. Análisis de Facturación**

In [None]:
plt.figure(figsize=(8,5))
sns.barplot(data=resumen, x='Tienda', y='Ventas Totales', palette='viridis')
plt.title('Facturación total por Tienda')
plt.ylabel('Ventas Totales ($)')
plt.xlabel('Tienda')

# Ajuste de límites para "zoom"
min_ventas = resumen['Ventas Totales'].min()
max_ventas = resumen['Ventas Totales'].max()
plt.ylim(min_ventas * 0.9, max_ventas * 1.05)

plt.show()

### 🔹 ¿Qué muestra la gráfica?

La gráfica presenta la **suma total de las ventas** realizadas por cada tienda, es decir, **cuánto dinero generó cada una** en el periodo analizado.

###  Observaciones:

* **Tienda 1** es la que **más factura**, superando los **1.15 mil millones**.
* **Tienda 2** y **Tienda 3** están muy cerca entre sí, con una facturación ligeramente menor (alrededor de **1.10 y 1.099 mil millones**).
* **Tienda 4** tiene la **menor facturación**, por debajo de **1.05 mil millones**, siendo la única por debajo de ese umbral.

###  Interpretación:

* Aunque las diferencias no son extremas, **Tienda 4 se encuentra claramente por detrás** en volumen de ventas monetarias.
* Esta diferencia **puede ser una señal de menor demanda**, problemas de visibilidad, estrategia de productos poco efectiva o incluso precios menos competitivos.
* Si esto se complementa con **baja calificación, pocos productos vendidos y costos de envío altos**, **Tienda 4 podría ser candidata al cierre o reestructuración**.

---

# 📊 **2. Análisis de Ventas por Categoría de Producto**

In [None]:
# Activar estilo científico
sns.set_style("whitegrid")
plt.rc('axes', titlesize=18, labelsize=14)
plt.rc('xtick', labelsize=12)
plt.rc('ytick', labelsize=11)
plt.rc('legend', fontsize=12)
plt.rc('font', family='serif')  # Fuente tipo serif, más formal

# Crear figura
plt.figure(figsize=(14,18))

# Agrupamos ventas
ventas_productos = df.groupby(['Producto', 'Tienda']).size().unstack()

# Graficar
ax = ventas_productos.plot(
    kind='barh',
    stacked=False,
    figsize=(14,18),
    color=['#264653', '#2a9d8f', '#e9c46a', '#f4a261'],  # paleta sobria
    edgecolor='black'
)

# Fondo blanco del gráfico
ax.set_facecolor('white')
plt.gcf().set_facecolor('white')

# Agregar líneas de cuadrícula discretas
plt.grid(axis='x', linestyle='--', alpha=0.7)

# Títulos y etiquetas
plt.title('Cantidad de productos vendidos por Tienda', weight='bold')
plt.xlabel('Número de Ventas')
plt.ylabel('Producto')
plt.legend(title='Tienda')
plt.tight_layout()

plt.show()


---

### 🔹 ¿Qué estamos analizando?

La tabla muestra cuántas unidades se vendieron de cada producto por tienda. Esto nos permite ver **qué tan bien se desempeña cada tienda en el portafolio de productos**, tanto en variedad como en volumen.

---

###  **Análisis detallado:**

#### 🔸 Consistencia de ventas:

* **Tienda 1**:

  * Tiene un rendimiento relativamente equilibrado. Muchos productos están en el rango de 40–55 unidades.
  * Destaca en productos como *TV LED UHD 4K (60)*, *Microondas (60)* y *Secadora de ropa (58)*.

* **Tienda 2**:

  * Es la que más veces aparece como la tienda con **el mayor número de ventas** por producto.
  * Por ejemplo: *Iniciando en programación (65)*, *Pandereta (58)*, *Batería (61)*.
  * Refleja una **oferta activa y bien aceptada** por el público.

* **Tienda 3**:

  * Tiene buenos resultados en varios productos (por ejemplo *Kit de bancas (57)*, *Mesa de comedor (56)*), pero **en general sus cifras son más variables**.
  * Algunas caídas notables como *Microondas (36)* y *Auriculares con micrófono (39)*.

* **Tienda 4**:

  * Presenta un rendimiento más **irregular y generalmente bajo**.
  * Tiene valores notables en pocos productos (*Cama box (62)*, *Cubertería (59)*, *Dashboards con Power BI (56)*).
  * Sin embargo, en muchos productos aparece con **el menor o segundo menor número de unidades vendidas**.
  * Por ejemplo: *Armario (34)*, *Guitarra eléctrica (33)*, *Refrigerador (38)*, *Lavadora de ropa (38)*.

---

###  Conclusiones del Indicador 2:

* **Tienda 2** lidera en ventas por producto, mostrando una clara fortaleza en diversidad y volumen.
* **Tienda 1** y **Tienda 3** mantienen un comportamiento aceptable y parejo.
* **Tienda 4** muestra **debilidades importantes**: en muchos productos vende menos, y sus picos son puntuales, no consistentes.

---

In [None]:
# Recortar todas las listas de tiendas a 51 elementos
for tienda in ['Tienda 1', 'Tienda 2', 'Tienda 3', 'Tienda 4']:
    ventas_productos[tienda] = ventas_productos[tienda][:51]

# Crear el DataFrame corregido

df_ventas = ventas_productos.reset_index()
df_ventas.set_index("Producto", inplace=True)

# Crear heatmap
plt.figure(figsize=(12, 16))
sns.heatmap(df_ventas, cmap="YlGnBu", annot=True, fmt="d", linewidths=0.5, cbar_kws={'label': 'Unidades vendidas'})
plt.title("Heatmap de Ventas por Producto y Tienda")
plt.xlabel("Tienda")
plt.ylabel("Producto")
plt.tight_layout()
plt.show()

La variación en las ventas por producto y tienda reflejada en el heatmap influye de forma importante en la recomendación final sobre **cuál tienda cerrar** o **reconvertir** para un nuevo emprendimiento. Aquí explico cómo:

---

### 🔍 **Análisis de la variación:**

1. **Tienda 4 tiene varias ventas bajas**:

   * Aunque algunos productos tienen buen desempeño, la Tienda 4 muestra **menos consistencia** en sus ventas.
   * Aparece frecuentemente con valores más bajos (tonos más claros en el heatmap).

2. **Tienda 1 y Tienda 2 son más fuertes en volumen de ventas**:

   * Son más consistentes con ventas altas en muchas categorías.
   * Tienda 1, en particular, lidera en facturación total (como vimos en el primer gráfico).

3. **Tienda 3 tiene un rendimiento medio**:

   * Se mantiene competitiva, aunque sin destacar como la mejor o la peor.
   * Su rendimiento depende mucho del tipo de producto.
---

# 📊 **3. Calificación Promedio por Tienda:**

In [None]:
plt.figure(figsize=(8,5))
sns.barplot(data=resumen, x='Tienda', y='Calificación Promedio', palette='coolwarm')
plt.title('Calificación Promedio por Tienda')
plt.ylabel('Calificación (1 a 5)')
plt.xlabel('Tienda')

# Zoom: un pequeño rango entre el mínimo y máximo
min_calif = resumen['Calificación Promedio'].min()
max_calif = resumen['Calificación Promedio'].max()
plt.ylim(min_calif - 0.2, max_calif + 0.2)

plt.show()


---


Este gráfico muestra la satisfacción del cliente en una escala de 1 a 5. Aunque las diferencias no son drásticas, son relevantes:

| Tienda   | Calificación promedio |
| -------- | --------------------- |
| Tienda 1 | **≈ 3.97**            |
| Tienda 2 | ≈ 4.05                |
| Tienda 3 | **≈ 4.06**            |
| Tienda 4 | ≈ 3.99                |

---

### **Interpretación:**

* **Tienda 3 y Tienda 2 lideran** ligeramente en satisfacción del cliente.
* **Tienda 1 y Tienda 4** están por debajo del promedio general.
* Aunque **Tienda 4** no tiene la peor calificación, **tampoco destaca** por su servicio o experiencia al cliente.

---

# 📦 **4. Productos Más Vendidos**

In [None]:
# Calculate top 5 products
top_5 = df['Producto'].value_counts().head(5)
# Calculate bottom 5 products #Added this line
bottom_5 = df['Producto'].value_counts().tail(5) #Added this line


# Top 5 más vendidos
plt.figure(figsize=(10,5))
top_5.plot(kind='bar', color='green')
plt.title('Top 5 Productos Más Vendidos')
plt.ylabel('Número de Ventas')
plt.xticks(rotation=45)

# Zoom en ventas
plt.ylim(top_5.min() * 0.8, top_5.max() * 1.1)

plt.show()

# Top 5 menos vendidos
plt.figure(figsize=(10,5))
bottom_5.plot(kind='bar', color='red')
plt.title('Top 5 Productos Menos Vendidos')
plt.ylabel('Número de Ventas')
plt.xticks(rotation=45)

# Zoom en ventas
plt.ylim(bottom_5.min() * 0.8, bottom_5.max() * 1.2)

plt.show()

---


Este gráfico muestra los **5 productos más vendidos** en el conjunto de tiendas analizadas:

| Producto                  | Ventas |
| ------------------------- | ------ |
| Mesa de noche             | 210    |
| Carrito de control remoto | 206    |
| Microondas                | 206    |
| Batería                   | 203    |
| Cama king                 | 201    |

---

###  **Interpretación:**

* **Mesa de noche** lidera el ranking de ventas, lo que sugiere alta demanda en el sector de mobiliario.
* Los productos más vendidos están relativamente cerca en número de ventas, lo cual indica un mercado equilibrado.
* Se observa una **preferencia por productos de hogar y tecnología accesible**, lo cual puede guiar decisiones de inventario.

---

###  **Implicación para la recomendación final:**

Este análisis ayuda a identificar productos estratégicos que las tiendas deben mantener en inventario. Si bien todas las tiendas venden estos productos, la **distribución del volumen por tienda puede indicar fortalezas o debilidades individuales**, lo que debería explorarse para entender cuál tienda aprovecha mejor estos productos estrella.

---


# 🚚 **5. Costo de Envío Promedio por Tienda**

In [None]:
plt.figure(figsize=(8,5))
sns.barplot(data=resumen, x='Tienda', y='Costo Envio Promedio', palette='rocket')
plt.title('Costo de Envío Promedio por Tienda')
plt.ylabel('Costo de Envío ($)')
plt.xlabel('Tienda')

# Zoom: más detalle en diferencias de envío
min_envio = resumen['Costo Envio Promedio'].min()
max_envio = resumen['Costo Envio Promedio'].max()
plt.ylim(min_envio * 0.9, max_envio * 1.1)

plt.show()

El gráfico muestra el **costo promedio de envío** por tienda:

| Tienda   | Costo Promedio de Envío |
| -------- | ----------------------- |
| Tienda 1 | \~\$26,000              |
| Tienda 2 | \~\$25,300              |
| Tienda 3 | \~\$24,800              |
| Tienda 4 | \~\$23,500              |

---

###  **Interpretación:**

* **Tienda 4** destaca por tener el costo de envío más bajo, lo que puede representar una **ventaja competitiva importante**, especialmente en mercados sensibles al precio.
* **Tienda 1** tiene el envío más costoso, lo que podría estar afectando su **calificación promedio** (que vimos en el indicador anterior) o dificultando la conversión de ventas.
* Las diferencias de envío no son abismales, pero sí **relevantes a nivel operativo y de percepción del cliente**.

---

###  **Implicación para la recomendación final:**

El costo de envío puede impactar directamente en la satisfacción del cliente y la tasa de conversión. Aunque la **Tienda 1 lidera en facturación**, sus costos de envío más altos y su **calificación promedio más baja** pueden indicar áreas de mejora en logística o atención al cliente.

Por otro lado, **Tienda 4**, con menores ventas totales, **podría competir mejor si optimiza su catálogo y aprovecha su fortaleza logística**.

---


# **6. Utilidad Estimada**

In [None]:
# Asegurar nombres consistentes para las columnas
df.columns = [col.strip() for col in df.columns]

# Calcular resumen por tienda
resumen_utilidad = df.groupby("Tienda").agg({
    "Precio": "sum",
    "Costo de envío": "mean"
}).rename(columns={
    "Precio": "Facturación Total",
    "Costo de envío": "Costo de Envío Promedio"
})

# Cantidad de ventas por tienda
resumen_utilidad ["Cantidad de Ventas"] = df["Tienda"].value_counts()

# Costo total de envío estimado y utilidad estimada
resumen_utilidad ["Costo Total de Envío Est."] = resumen_utilidad ["Costo de Envío Promedio"] * resumen_utilidad ["Cantidad de Ventas"]
resumen_utilidad ["Utilidad Estimada"] = resumen_utilidad ["Facturación Total"] - resumen_utilidad ["Costo Total de Envío Est."]

resumen_utilidad .reset_index(inplace=True)

# Configuración estética
sns.set(style="whitegrid")
plt.figure(figsize=(12, 6))

# Gráfico de barras múltiples
resumen_utilidad.set_index("Tienda")[["Facturación Total", "Costo Total de Envío Est.", "Utilidad Estimada"]].plot(
    kind="bar", figsize=(12, 6), color=["#4C72B0", "#DD8452", "#55A868"]
)

plt.title("Comparación de Indicadores Económicos por Tienda", fontsize=16)
plt.ylabel("Valor en COP")
plt.xlabel("Tienda")
plt.xticks(rotation=0)
plt.legend(title="Indicadores", bbox_to_anchor=(1.05, 1), loc='upper left')
plt.tight_layout()
plt.show()


--
Al analizar la utilidad estimada (facturación total menos costo de envío), se observa que Tienda 1 genera la mayor utilidad, lo que indica un excelente balance entre ingresos por ventas y gastos logísticos. Tienda 2 y Tienda 3 mantienen niveles de utilidad similares y competitivos, lo que sugiere una operación eficiente. Por el contrario, Tienda 4, aunque presenta el costo de envío más bajo, también registra la menor utilidad, lo que puede deberse a un volumen de ventas más bajo o precios menos competitivos.

📌 Conclusión: Tienda 1 es la opción más rentable. Tienda 4 requiere evaluación estratégica para mejorar su desempeño financiero.

---

# ***Mapa interactivo***

```python
# 👉 Esta celda debe cambiarse a tipo código
import pandas as pd

def load_and_preprocess_data(urls, tienda_names):
    dfs = []
    for url, tienda_name in zip(urls, tienda_names):
        tienda = pd.read_csv(url)
        tienda['Tienda'] = tienda_name
        dfs.append(tienda)

    # Concatenate all DataFrames
    df = pd.concat(dfs, ignore_index=True)
    return df

urls = [
    "https://raw.githubusercontent.com/alura-es-cursos/challenge1-data-science-latam/refs/heads/main/base-de-datos-challenge1-latam/tienda_1%20.csv",
    "https://raw.githubusercontent.com/alura-es-cursos/challenge1-data-science-latam/refs/heads/main/base-de-datos-challenge1-latam/tienda_2.csv",
    "https://raw.githubusercontent.com/alura-es-cursos/challenge1-data-science-latam/refs/heads/main/base-de-datos-challenge1-latam/tienda_3.csv",
    "https://raw.githubusercontent.com/alura-es-cursos/challenge1-data-science-latam/refs/heads/main/base-de-datos-challenge1-latam/tienda_4.csv"
]
tienda_names = ['Tienda 1', 'Tienda 2', 'Tienda 3', 'Tienda 4']

df_map = load_and_preprocess_data(urls, tienda_names)

```python
# 👉 Esta celda debe cambiarse a tipo código
import pandas as pd
import folium
from folium.plugins import MarkerCluster
import ipywidgets as widgets
from IPython.display import display, clear_output


# Crear widgets para filtro
tienda_widget = widgets.Dropdown(
    options=['Todas'] + sorted(df_map['Tienda'].unique().tolist()),
    value='Todas',
    description='Tienda:',
    style={'description_width': 'initial'}
)

producto_widget = widgets.Dropdown(
    options=['Todos'] + sorted(df_map['Producto'].unique().tolist()),
    value='Todos',
    description='Producto:',
    style={'description_width': 'initial'}
)

# Función para actualizar el mapa según filtros
def actualizar_mapa(tienda, producto):
    clear_output(wait=True)
    display(tienda_widget, producto_widget)

    # Filtrar DataFrame
    df_filtrado = df_map.copy()
    if tienda != 'Todas':
        df_filtrado = df_filtrado[df_filtrado['Tienda'] == tienda]
    if producto != 'Todos':
        df_filtrado = df_filtrado[df_filtrado['Producto'] == producto]

    # Crear mapa
    center = [df_filtrado['lat'].mean(), df_filtrado['lon'].mean()]
    m = folium.Map(location=center, zoom_start=6)
    marker_cluster = MarkerCluster().add_to(m)

    for _, row in df_filtrado.iterrows():
        popup = (
            f"<strong>Tienda:</strong> {row['Tienda']}<br>"
            f"<strong>Producto:</strong> {row['Producto']}<br>"
            f"<strong>Precio:</strong> ${row['Precio']:.0f}<br>"
            f"<strong>Calificación:</strong> {row['Calificación']}/5"
        )
        folium.CircleMarker(
            location=[row['lat'], row['lon']],
            radius=5,
            color='blue' if row['Calificación'] >= 4 else 'red',
            fill=True,
            fill_opacity=0.6,
            popup=popup
        ).add_to(marker_cluster)

    display(m)

# Conectar widgets a función
widgets.interactive_output(actualizar_mapa, {
    'tienda': tienda_widget,
    'producto': producto_widget
})

# Mostrar los widgets
display(tienda_widget, producto_widget)

# Mostrar el mapa inicial
actualizar_mapa('Todas', 'Todos')

---
### Análisis del Mapa Interactivo

Este mapa presenta los puntos de venta o ubicación de las compras agrupadas en **clústeres** según su proximidad geográfica. Cada marcador numérico representa la **cantidad de transacciones** (o registros) en esa zona. A medida que haces zoom, los clústeres se separan en puntos individuales.

#### Observaciones:

1. **Concentración Alta de Ventas:**

   * 📍 **Eje cafetero y Bogotá (Manizales, Pereira, Armenia, Bogotá):** Altos volúmenes de compras. Por ejemplo, Manizales (2900 registros) y Bogotá (3991) indican ser centros comerciales clave.
   * 📍 **Cali y Medellín** también presentan valores importantes como 1047 o más.

2. **Actividad Media:**

   * 📍 Ciudades como Cartagena, Bucaramanga, y Santa Marta presentan clústeres menores (entre 300 y 700).
   * Estas zonas podrían tener buen desempeño, pero no tan elevado como los grandes centros.

3. **Baja Actividad Comercial:**

   * 📍 Regiones al sur (Putumayo, Caquetá) o hacia la Amazonía (como el punto con 14 registros) reflejan **escasa actividad comercial**, probablemente por densidad poblacional o acceso limitado.

4. **Estrategia Comercial:**

   * Las zonas con alto número de compras coinciden con regiones urbanas densamente pobladas y con infraestructura de comercio electrónico.
   * Pueden ser candidatos ideales para campañas de fidelización, ofertas o expansión logística.

---



# ***Análisis espacial agregado***

```python
# 👉 Esta celda debe cambiarse a tipo código
# agrupar lat/lon redondeadas a 0.5 grados
df_map['lat_bin'] = df_map['lat'].round(1)
df_map['lon_bin'] = df_map['lon'].round(1)
geo_summary = df_map.groupby(['lat_bin','lon_bin']).agg({
    'Precio':'sum',
    'Calificación':'mean',
    'Producto':'count'
}).rename(columns={'Precio':'Ingresos','Producto':'Ventas'}).reset_index()


```python
# 👉 Esta celda debe cambiarse a tipo código
import folium
from folium.plugins import HeatMap


# Calcular el centro del mapa basado en los datos agregados
center = [geo_summary['lat_bin'].mean(), geo_summary['lon_bin'].mean()]


# Crear el mapa centrado
m2 = folium.Map(location=center, zoom_start=6)

# Crear un grupo de capas para el heatmap
heatmap_layer = folium.FeatureGroup(name='Mapa de calor de ingresos')

# Construir los datos de calor con ingresos como peso
heat_data = [[row.lat_bin, row.lon_bin, row.Ingresos] for _, row in geo_summary.iterrows()]
HeatMap(heat_data, radius=25).add_to(heatmap_layer)



# Mostrar el mapa en el notebook
m2



---

### Análisis del Mapa de Calor (Heatmap de Ingresos)

Este mapa representa la **intensidad de ingresos** generados por ubicación geográfica, donde:

* 🔴 Rojo = Altos ingresos
* 🟢 Verde = Medios ingresos
* 🔵 Azul/Violeta = Bajos ingresos

#### Observaciones Relevantes:

1. **Zonas de Alta Rentabilidad:**

   * La **zona roja en el centro (Bogotá – Ibagué – Eje Cafetero)** coincide con la región con más actividad en el mapa interactivo, lo que confirma que **no solo hay muchas ventas, sino que también generan altos ingresos**.
   * Esta es la región más rentable actualmente.

2. **Ingresos Moderados:**

   * 📍 Medellín, Cali, Bucaramanga, Cartagena muestran zonas verdes y azules, indicando **ventas regulares**, pero con un nivel de ingreso más bajo comparado al centro del país.
   * Esto puede deberse a un menor ticket promedio o productos más económicos.

3. **Zonas con Actividad pero Baja Rentabilidad:**

   * Algunas zonas costeras y del sur (Putumayo, Caquetá) aparecen en violeta o azul: **hay actividad**, pero los ingresos son bajos.
   * Posiblemente por menores precios o costos de logística más altos.

---

# ***🧩 Comparación de ambos mapas***


| Aspecto                    | Mapa Interactivo                                   | Mapa de Calor                           |
| -------------------------- | -------------------------------------------------- | --------------------------------------- |
| Representa                 | Volumen de transacciones                           | Ingresos generados                      |
| Región más destacada       | Bogotá – Manizales – Cali                          | Bogotá – Eje Cafetero                   |
| Coincidencia de alta renta | ✅ Sí: la zona más densa también es la más rentable | ✅ Sí: misma zona, intensidad roja       |
| Zonas a monitorear         | Sur y frontera oriental                            | Actividad pero baja rentabilidad (azul) |

---

### ✅ Conclusión

* **Bogotá y el eje cafetero son las zonas más activas y rentables.**
* Las regiones con alta actividad pero bajo ingreso merecen ser analizadas: ¿hay problemas de precios bajos, costos de envío altos o productos menos atractivos?
* Podrías priorizar campañas o inversiones logísticas en zonas de alto potencial (como Medellín o Cali), y replantear estrategias en regiones menos rentables.

---

---

#  Informe Final de Análisis de Tiendas – Alura Store LATAM

##  Introducción

El Sr. Juan, propietario de la cadena **Alura Store**, está evaluando vender una de sus cuatro tiendas para obtener capital con el que iniciará un nuevo emprendimiento. Para tomar esta decisión estratégicamente, realizamos un análisis integral de los datos de ventas, costos de envío, calificaciones de productos y distribución geográfica de las compras de cada tienda.

Este informe presenta los hallazgos clave y una recomendación final sobre cuál tienda es la menos eficiente y, por lo tanto, la mejor candidata para ser vendida.

---

## 📊 Desarrollo del Análisis

### 1. **Facturación Total por Tienda**

* Las tiendas presentan niveles similares de facturación, pero **Tienda 1 se posiciona como la de mayores ingresos** totales, seguida por Tienda 2.
* **Tienda 4 es la de menor facturación**, lo que ya plantea una alerta sobre su rendimiento.

### 2. **Costo Total de Envío**

* Si bien todos los costos de envío son proporcionales al volumen de ventas, **Tienda 4 tiene uno de los costos más altos en relación a sus ingresos**, lo que reduce su rentabilidad.

### 3. **Utilidad Estimada (Ingresos - Costo de Envío)**

* La **Tienda 1 presenta la utilidad más alta**, destacándose como la operación más rentable.
* Por el contrario, **Tienda 4 tiene la menor utilidad neta**, lo que sugiere baja eficiencia operativa.

### 4. **Calificación Promedio**

* Las calificaciones son similares entre tiendas. No hay una diferencia crítica, pero **Tienda 3 muestra ligeramente una menor valoración media**.

### 5. **Análisis Geográfico**

* En el **mapa interactivo**, se observa que **Tienda 1 y Tienda 2 están localizadas en zonas de alta concentración de ventas**, como Bogotá, Medellín y el Eje Cafetero.
* El **mapa de calor confirma que las zonas asociadas a Tienda 4 tienen menor densidad de ingresos**, lo que se traduce en menor demanda.

---

## ✅ Conclusión y Recomendación

### 🔍 Recomendación: **Vender la Tienda 4**

Tras el análisis, recomendamos que el Sr. Juan **venda la Tienda 4**, ya que:

* Es la **menos rentable** en términos de utilidad estimada.
* Tiene **menor volumen de ventas** y una ubicación **menos estratégica** en el contexto geográfico.
* Su **relación ingreso/costo de envío es la menos eficiente** del grupo.
* No presenta ventajas diferenciales en calificación de productos que justifiquen su permanencia.

Por el contrario, **Tienda 1 debe mantenerse como pilar estratégico**, dado su alto rendimiento económico y cobertura en una zona clave del país.

---
