# üß© M√≥dulo 7 ‚Äî Pandas: Agrupaciones y `groupby`

En este notebook aprender√°s a hacer an√°lisis avanzado con `groupby`, incluyendo:

- Agrupaciones b√°sicas
- M√∫ltiples agregaciones
- Transformaciones
- Filtrado de grupos
- Tablas din√°micas (`pivot_table`)
- Multi√≠ndice

---

## 1Ô∏è‚É£ Dataset de ejemplo

In [None]:
import pandas as pd
import numpy as np

df = pd.DataFrame({
    'categoria': ['A','A','B','B','B','C','C'],
    'producto': ['p1','p2','p3','p4','p5','p6','p7'],
    'ventas': [100, 150, 200, 50, 120, 80, 60],
    'coste': [60, 90, 120, 30, 70, 40, 20]
})
df

---
## 2Ô∏è‚É£ Agrupaciones b√°sicas

Ventas totales por categor√≠a:

In [None]:
df.groupby('categoria')['ventas'].sum()

Promedio de ventas por categor√≠a:

In [None]:
df.groupby('categoria')['ventas'].mean()

---
## 3Ô∏è‚É£ Agrupaciones m√∫ltiples

Obtener estad√≠sticas combinadas:

In [None]:
df.groupby('categoria').agg({'ventas':['sum','mean'], 'coste':['sum','mean']})

Resumen estad√≠stico por grupo:

In [None]:
df.groupby('categoria')['ventas'].describe()

---
## 4Ô∏è‚É£ Transformaciones (`transform`)

Calcular ventas normalizadas por categor√≠a:

In [None]:
df['ventas_norm'] = df.groupby('categoria')['ventas'].transform(lambda x: (x - x.mean())/x.std())
df[['categoria','producto','ventas','ventas_norm']]

---
## 5Ô∏è‚É£ Filtrado de grupos (`filter`)

Ejemplo: seleccionar solo categor√≠as con ventas totales ‚â• 200:

In [None]:
df.groupby('categoria').filter(lambda g: g['ventas'].sum() >= 200)

---
## 6Ô∏è‚É£ Tablas din√°micas (pivot table)


In [None]:
pd.pivot_table(df, values='ventas', index='categoria', aggfunc='sum')

Pivot table con varias funciones:

In [None]:
pd.pivot_table(df, values=['ventas','coste'], index='categoria', aggfunc=['sum','mean'])

---
## 7Ô∏è‚É£ multi-√≠ndice

Agrupar por categor√≠a y producto:

In [None]:
multi = df.groupby(['categoria','producto'])['ventas'].sum()
multi

Convertir multi-√≠ndice en columnas (reset index):

In [None]:
multi.reset_index()

---
## 8Ô∏è‚É£ Ejercicio pr√°ctico

Usando `df`:

### üß© Objetivos
1. Calcula ventas totales por categor√≠a
2. Calcula el margen como `ventas - coste` y obt√©n media por categor√≠a
3. Normaliza `coste` por categor√≠a usando `transform`
4. Haz un `filter` para quedarte solo con categor√≠as cuyo *promedio de ventas* > 100
5. Construye una `pivot_table` que muestre el total de ventas y coste por categor√≠a

Escribe tu soluci√≥n aqu√≠:

In [None]:
# Tu soluci√≥n aqu√≠


---
## ‚úÖ Soluci√≥n (oculta)
<details>
<summary>Mostrar soluciones</summary>

```python
df.groupby('categoria')['ventas'].sum()
```

```python
df['margen'] = df['ventas'] - df['coste']
df.groupby('categoria')['margen'].mean()
```

```python
df['coste_norm'] = df.groupby('categoria')['coste'].transform(lambda x: (x-x.mean())/x.std())
```

```python
df.groupby('categoria').filter(lambda g: g['ventas'].mean() > 100)
```

```python
pd.pivot_table(df, values=['ventas','coste'], index='categoria', aggfunc='sum')
```
</details>