# Módulo 3B: Sintaxis de Índices - Guía Práctica Completa

## 🎯 Objetivos de Aprendizaje

- Dominar la sintaxis de acceso con índices en Series
- Comprender el acceso bidimensional en DataFrames
- Diferenciar entre `.loc[]`, `.iloc[]`, `.at[]`, `.iat[]`
- Aplicar filtrado booleano con índices
- Modificar datos usando índices
- Trabajar con MultiIndex (índices jerárquicos)

---

## 📚 Introducción

Este módulo es una **guía práctica y completa** sobre cómo usar índices en Pandas. Cubre todos los casos de uso comunes con ejemplos claros y comparaciones directas.

### ¿Por qué este módulo es importante?

Los índices son **la columna vertebral** de Pandas:
- Permiten acceso rápido y eficiente a datos
- Alinean automáticamente datos en operaciones
- Son esenciales para series temporales
- Facilitan agrupaciones y agregaciones

---

## 💡 Conceptos Clave

**En Series:**
- Una Serie tiene UN índice (para identificar cada valor)

**En DataFrames:**
- Un DataFrame tiene DOS índices:
  - `df.index` → índice de FILAS
  - `df.columns` → índice de COLUMNAS (sí, las columnas también son un Index!)

---


In [1]:
import pandas as pd
import numpy as np

# Ejecutar el módulo completo
%run modulo_3b_sintaxis_indices.py


MÓDULO 3B: SINTAXIS DE ÍNDICES - GUÍA PRÁCTICA
ÍNDICES EN PANDAS: CONCEPTOS FUNDAMENTALES

Los ÍNDICES son etiquetas que permiten identificar y acceder a datos:

EN SERIES:
- Una Serie tiene UN índice (para las filas)
- Por defecto: RangeIndex(0, 1, 2, 3, ...)
- Puede ser personalizado con cualquier valor

EN DATAFRAMES:
- Un DataFrame tiene DOS índices:
  1. Index para FILAS (df.index)
  2. Index para COLUMNAS (df.columns)
- Ambos son objetos Index

VENTAJAS DE LOS ÍNDICES:
✓ Acceso rápido por etiqueta
✓ Alineación automática en operaciones
✓ Agrupación y agregación eficiente
✓ Series temporales con fechas
    

SINTAXIS BÁSICA: ÍNDICES EN SERIES

1. ÍNDICE POR DEFECTO (RangeIndex):
0    10
1    20
2    30
3    40
4    50
dtype: int64

Tipo de índice: <class 'pandas.core.indexes.range.RangeIndex'>
Índice: RangeIndex(start=0, stop=5, step=1)

2. ÍNDICE PERSONALIZADO:
a    10
b    20
c    30
d    40
e    50
dtype: int64
Índice: ['a', 'b', 'c', 'd', 'e']

3. FORMAS DE ACCEDER A DATOS:
  

## 📖 Guía Rápida de Referencia

### Métodos de Acceso

| Método | Tipo | Ejemplo | Resultado |
|--------|------|---------|-----------|
| `[]` | Mixto | `serie['a']` | Por etiqueta |
| `.loc[]` | Etiqueta | `df.loc['fila', 'col']` | Por nombre |
| `.iloc[]` | Posición | `df.iloc[0, 1]` | Por número |
| `.at[]` | Etiqueta | `df.at['fila', 'col']` | 1 valor rápido |
| `.iat[]` | Posición | `df.iat[0, 1]` | 1 valor rápido |

### Reglas de Slicing

**Con `.loc[]` (etiquetas):**
```python
df.loc['inicio':'fin']  # INCLUYE 'fin'
```

**Con `.iloc[]` (posiciones):**
```python
df.iloc[0:5]  # EXCLUYE posición 5
```


## Ejemplos Interactivos

Ahora puedes experimentar con los ejemplos. Aquí hay algunos casos de uso comunes:


In [5]:
# Ejemplo 1: Crear y acceder a una Serie con índice personalizado
serie = pd.Series(
    [100, 200, 300, 400, 500],
    index=['ene', 'feb', 'mar', 'abr', 'may'],
    name='ventas'
)

print("Serie:")
print(serie)

# Diferentes formas de acceso
print(f"\nAcceso directo: serie['mar'] = {serie['mar']}")
print(f"Con .loc: serie.loc['mar'] = {serie.loc['mar']}")
print(f"Con .iloc: serie.iloc[2] = {serie.iloc[2]}")

# Slicing
print(f"\nSlicing con etiquetas: serie['feb':'abr']")
print(serie['feb':'abr'])


Serie:
ene    100
feb    200
mar    300
abr    400
may    500
Name: ventas, dtype: int64

Acceso directo: serie['mar'] = 300
Con .loc: serie.loc['mar'] = 300
Con .iloc: serie.iloc[2] = 300

Slicing con etiquetas: serie['feb':'abr']
feb    200
mar    300
abr    400
Name: ventas, dtype: int64


In [6]:
# Ejemplo 2: DataFrame con índice personalizado
df = pd.DataFrame({
    'nombre': ['Ana', 'Luis', 'María', 'Carlos'],
    'edad': [25, 30, 28, 35],
    'salario': [30000, 45000, 38000, 52000]
})

# Establecer una columna como índice
df_indexed = df.set_index('nombre')
print("DataFrame con 'nombre' como índice:")
print(df_indexed)

# Acceder por nombre de persona
print(f"\nDatos de Luis:")
print(df_indexed.loc['Luis'])

# Acceder a dato específico
print(f"\nSalario de María: {df_indexed.loc['María', 'salario']}")


DataFrame con 'nombre' como índice:
        edad  salario
nombre               
Ana       25    30000
Luis      30    45000
María     28    38000
Carlos    35    52000

Datos de Luis:
edad          30
salario    45000
Name: Luis, dtype: int64

Salario de María: 38000


In [7]:
# Ejemplo 3: Acceso bidimensional con .loc[]
df = pd.DataFrame({
    'A': [1, 2, 3, 4],
    'B': [5, 6, 7, 8],
    'C': [9, 10, 11, 12]
}, index=['fila1', 'fila2', 'fila3', 'fila4'])

print("DataFrame:")
print(df)

# Diferentes tipos de acceso con .loc[]
print(f"\nUn valor: df.loc['fila2', 'B'] = {df.loc['fila2', 'B']}")

print(f"\nUna fila completa:")
print(df.loc['fila2'])

print(f"\nUna columna completa:")
print(df.loc[:, 'B'])

print(f"\nSub-DataFrame:")
print(df.loc[['fila1', 'fila3'], ['A', 'C']])


DataFrame:
       A  B   C
fila1  1  5   9
fila2  2  6  10
fila3  3  7  11
fila4  4  8  12

Un valor: df.loc['fila2', 'B'] = 6

Una fila completa:
A     2
B     6
C    10
Name: fila2, dtype: int64

Una columna completa:
fila1    5
fila2    6
fila3    7
fila4    8
Name: B, dtype: int64

Sub-DataFrame:
       A   C
fila1  1   9
fila3  3  11


In [None]:
# Ejemplo 4: Filtrado con índices booleanos
df = pd.DataFrame({
    'producto': ['A', 'B', 'C', 'D', 'E'],
    'precio': [10, 25, 15, 30, 20],
    'stock': [100, 50, 75, 25, 60]
})

print("DataFrame:")
print(df)

# Filtrar productos con precio > 15
print(f"\nProductos con precio > 15:")
print(df[df['precio'] > 15])

# Filtrar con múltiples condiciones
print(f"\nProductos con precio > 15 Y stock > 50:")
print(df[(df['precio'] > 15) & (df['stock'] > 50)])

# Filtrar con .isin()
print(f"\nProductos A, C o E:")
print(df[df['producto'].isin(['A', 'C', 'E'])])


In [None]:
# Ejemplo 5: Modificar datos con índices
df = pd.DataFrame({
    'producto': ['A', 'B', 'C'],
    'precio': [10, 20, 15],
    'stock': [100, 50, 75]
}, index=['P1', 'P2', 'P3'])

print("DataFrame original:")
print(df)

# Modificar un valor específico
df.loc['P2', 'precio'] = 25
print(f"\nDespués de cambiar precio de P2 a 25:")
print(df)

# Modificar con condición
df.loc[df['stock'] < 60, 'stock'] = 100
print(f"\nDespués de poner stock=100 donde stock < 60:")
print(df)

# Agregar nueva columna calculada
df['total'] = df['precio'] * df['stock']
print(f"\nCon columna 'total' agregada:")
print(df)


In [None]:
# Ejemplo 6: Comparación directa loc vs iloc
df = pd.DataFrame({
    'A': [10, 20, 30],
    'B': [40, 50, 60],
    'C': [70, 80, 90]
}, index=['x', 'y', 'z'])

print("DataFrame:")
print(df)

print("\n=== COMPARACIÓN .loc[] vs .iloc[] ===")

print("\nCon .loc[] (por ETIQUETA):")
print(f"df.loc['y', 'B'] = {df.loc['y', 'B']}")
print(f"df.loc['x':'y', 'A':'B']:")
print(df.loc['x':'y', 'A':'B'])
print("  ↑ INCLUYE 'y' y 'B'")

print("\nCon .iloc[] (por POSICIÓN):")
print(f"df.iloc[1, 1] = {df.iloc[1, 1]}")
print(f"df.iloc[0:2, 0:2]:")
print(df.iloc[0:2, 0:2])
print("  ↑ EXCLUYE posición 2")


## 📚 Resumen y Buenas Prácticas

### ✅ Cuándo Usar Cada Método

**Usa `[]` cuando:**
- Accedas a columnas: `df['columna']`
- Hagas slicing simple: `df[0:5]`
- Filtres con booleanos: `df[df['edad'] > 25]`

**Usa `.loc[]` cuando:**
- Trabajes con etiquetas personalizadas
- Necesites acceso bidimensional explícito
- Quieras código más legible

**Usa `.iloc[]` cuando:**
- Trabajes con posiciones numéricas
- Necesites los primeros/últimos N elementos
- Iteres con índices numéricos

**Usa `.at[]` / `.iat[]` cuando:**
- Accedas a UN SOLO valor
- Necesites máximo rendimiento
- Hagas muchas operaciones de lectura/escritura

### ⚠️ Errores Comunes

1. **Confundir loc con iloc:**
   ```python
   # ❌ Mal
   df.loc[0:5]  # Esperas posiciones pero usa etiquetas
   
   # ✅ Bien
   df.iloc[0:5]  # Usa iloc para posiciones
   ```

2. **Olvidar que loc incluye el final:**
   ```python
   df.loc['a':'c']  # Incluye 'c'
   df.iloc[0:3]     # NO incluye posición 3
   ```

3. **No usar & y | en filtros:**
   ```python
   # ❌ Mal
   df[df['a'] > 5 and df['b'] < 10]  # Error!
   
   # ✅ Bien
   df[(df['a'] > 5) & (df['b'] < 10)]  # Paréntesis importantes!
   ```

### 💡 Consejos Pro

1. **Usa `.copy()` al modificar subconjuntos:**
   ```python
   subset = df[df['edad'] > 25].copy()
   subset['nueva_col'] = ...  # Evita SettingWithCopyWarning
   ```

2. **Encadena operaciones para claridad:**
   ```python
   resultado = (df
       .query('edad > 25')
       .loc[:, ['nombre', 'salario']]
       .sort_values('salario', ascending=False)
   )
   ```

3. **Usa `.isin()` en lugar de múltiples ORs:**
   ```python
   # ✅ Mejor
   df[df['ciudad'].isin(['Madrid', 'Barcelona', 'Valencia'])]
   
   # ❌ Peor
   df[(df['ciudad'] == 'Madrid') | 
      (df['ciudad'] == 'Barcelona') | 
      (df['ciudad'] == 'Valencia')]
   ```

---

**¡Ahora dominas la sintaxis de índices en Pandas! 🎉**
