# Análisis de Datos: El Café de Barrio

En este ejercicio, analizarás los datos de un pequeño café para extraer información valiosa que ayude a la toma de decisiones.

### 1. Carga de Datos

Primero, vamos a cargar los datos en un DataFrame de Pandas.

In [1]:
import pandas as pd
import io

data = {
    'Mes': ['Ene', 'Feb', 'Mar', 'Abr', 'May'],
    'Ventas ($)': [15000, 22000, 18000, 28000, 25000],
    'Temp (°C)': [18, 25, 22, 28, 30],
    'Publicidad ($)': [800, 1200, 900, 1500, 1300],
    'Personal': [4, 5, 4, 6, 5],
    'Satisfacción': [4.2, 4.5, 4.1, 4.8, 4.6]
}

df = pd.DataFrame(data)
df.set_index('Mes', inplace=True)
print("DataFrame creado:")
df

DataFrame creado:


Unnamed: 0_level_0,Ventas ($),Temp (°C),Publicidad ($),Personal,Satisfacción
Mes,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1,Unnamed: 5_level_1
Ene,15000,18,800,4,4.2
Feb,22000,25,1200,5,4.5
Mar,18000,22,900,4,4.1
Abr,28000,28,1500,6,4.8
May,25000,30,1300,5,4.6


---

### 2. Calcular la correlación entre temperatura y ventas

Encuentra la relación numérica entre la temperatura promedio del mes y las ventas.

**Pista:** Selecciona las dos columnas que te interesan (`'Temp (°C)'` y `'Ventas ($)'`) y utiliza el método `.corr()` para calcular la correlación entre ellas.

In [5]:
# Tu código aquí
ventas_por_temp = df[["Ventas ($)", "Temp (°C)"]]
ventas_por_temp.corr()

Unnamed: 0,Ventas ($),Temp (°C)
Ventas ($),1.0,0.933915
Temp (°C),0.933915,1.0


---

### 3. Identificar el mes con mejor retorno publicitario

Calcula una nueva columna que represente el retorno de la inversión publicitaria (Ventas / Publicidad) y encuentra el mes con el valor más alto.

**Pista:** 
1. Crea una nueva columna, por ejemplo, `'Retorno_Publicitario'`. 
2. Asigna a esta columna el resultado de dividir la columna `'Ventas ($)'` entre la columna `'Publicidad ($)'`.
3. Utiliza el método `.idxmax()` en la nueva columna para obtener el índice (el mes) del valor máximo.

In [9]:
# Tu código aquí
df["Retorno_Publicitario"] = df["Ventas ($)"] / df["Publicidad ($)"]
df["Retorno_Publicitario"].idxmax()

'Mar'

---

### 4. Analizar la relación entre la cantidad de personal y la satisfacción del cliente

Determina si existe una correlación entre el número de empleados trabajando y la puntuación de satisfacción del cliente.

**Pista:** Al igual que en el primer ejercicio, selecciona las columnas `'Personal'` y `'Satisfacción'` y utiliza el método `.corr()`.

In [8]:
# Tu código aquí
personal_satisfaccion = df[["Personal", "Satisfacción"]]
personal_satisfaccion.corr()

Unnamed: 0,Personal,Satisfacción
Personal,1.0,0.974944
Satisfacción,0.974944,1.0


---

### 5. Proponer una estrategia basada en datos

Basándote en los análisis anteriores, ¿qué recomendación le darías al dueño del café?

**Pista:** Esta es una pregunta abierta. Escribe una conclusión en una celda de texto (Markdown). Considera: ¿Qué factores parecen impulsar más las ventas? ¿En qué mes fue más efectiva la publicidad? ¿Contratar más personal mejora la satisfacción? Resume tus hallazgos.

### Análisis y Recomendaciones Estratégicas para el Café

Tras el análisis de los datos operativos de los últimos cinco meses, hemos identificado las siguientes palancas de crecimiento y áreas de mejora. Se recomienda tomar acción en los siguientes puntos para optimizar el rendimiento del negocio:

1. Capitalizar la Demanda Estacional: Existe una fuerte correlación positiva (0.93) entre la temperatura y las ventas.

- *Observación:* Los meses más cálidos impulsan directamente un aumento en los ingresos.
- *Recomendación:* Anticipar la demanda durante los meses de primavera y verano, asegurando tener suficiente inventario y personal para capitalizar este patrón estacional.

2. Mejorar la Experiencia del Cliente a través del Personal: La satisfacción del cliente está directamente ligada a la cantidad de personal (correlación de 0.97).

- *Observación:* Una mayor dotación de personal se traduce en clientes más satisfechos.
- *Recomendación:* Invertir en una adecuada dotación de personal, especialmente durante las horas pico y los meses de alta demanda (ver punto 1), no debe ser visto como un costo, sino como una inversión directa en la calidad del servicio y la lealtad del cliente.

3. Optimizar la Inversión Publicitaria: El mes de marzo presentó el retorno de inversión (ROI) publicitario más alto.

- *Observación:* No toda la inversión en publicidad rinde igual. En marzo, cada dólar invertido generó más ventas que en otros meses.
- *Recomendación:* Analizar las campañas específicas que se realizaron en marzo para replicar su éxito. Se sugiere reevaluar y posiblemente reducir la inversión en periodos de bajo retorno para concentrar el presupuesto en las estrategias más efectivas.

**En resumen, alinear la planificación de personal con las tendencias del clima y enfocar la publicidad en las tácticas de mayor impacto permitirá no solo maximizar los ingresos, sino también construir una base de clientes más sólida y satisfecha.**

RESPUESTA ALTERNATIVA

In [None]:
import pandas as pd

df = pd.DataFrame({
    'Mes': ['Ene', 'Feb', 'Mar', 'Abr', 'May'],
    'Ventas': [15000, 22000, 18000, 28000, 25000],
    'Temp': [18, 25, 22, 28, 30],
    'Publicidad': [800, 1200, 900, 1500, 1300],
    'Personal': [4, 5, 4, 6, 5],
    'Satisfaccion': [4.2, 4.5, 4.1, 4.8, 4.6]
})

# --- CORRECTO ---
print("Correlación ventas-temp:", df['Ventas'].corr(df['Temp']))

# --- CORREGIDO ---
# Primero, calcula el retorno
df['Retorno'] = df['Ventas'] / df['Publicidad']
# Segundo, encuentra el mes con el máximo retorno
mes_mejor_retorno = df.loc[df['Retorno'].idxmax(), 'Mes']
print("Mejor retorno publicitario:", mes_mejor_retorno)

# --- CORRECTO ---
print("Correlación personal-satisfacción:", df['Personal'].corr(df['Satisfaccion']))

Correlación ventas-temp: 0.9339146197235372
Mejor retorno publicitario: Mar
Correlación personal-satisfacción: 0.974944281032901
