# Pandas - Indexación y Selección

Este notebook cubre cómo seleccionar y filtrar datos en Pandas: selección de columnas, filas, y combinaciones usando iloc, loc, at e iat.

## Selección de Columnas


In [1]:
import pandas as pd

df = pd.DataFrame({
    'A': [1, 2, 3, 4],
    'B': [5, 6, 7, 8],
    'C': [9, 10, 11, 12]
}, index=['a', 'b', 'c', 'd'])

# Seleccionar una columna (retorna Series)
df['A']
df.A  # Notación de atributo (solo si nombre es válido)

# Seleccionar múltiples columnas (retorna DataFrame)
df[['A', 'B']]
df[['A']]  # DataFrame con una columna

# IMPORTANTE: Usar [ ] en DataFrames se refiere a columnas
# EXCEPCIÓN: con slice o máscara booleana se refiere a filas
df[:2]      # DataFrame, primeras 2 filas (slice)
df[df['A'] > 2]  # DataFrame, filas donde condición es True (máscara)


Unnamed: 0,A,B,C
c,3,7,11
d,4,8,12


## Selección de Filas


In [2]:
# Por índice (iloc - integer location, similar a listas o arrays NumPy)
df.iloc[0]        # Primera fila (Series)
df.iloc[0:2]      # Primeras 2 filas (DataFrame)
df.iloc[[0, 2]]   # Filas 0 y 2

# Por etiqueta (loc - index labels)
df.loc['a']         # Fila con índice 'a'
df.loc['a':'c']     # Filas de 'a' a 'c' (inclusive)
df.loc[['a', 'c']]  # Filas específicas

# xs - seleccionar filas con label en nivel de MultiIndex
# df.xs(key, level=level_name)  # Para objetos con MultiIndex

# Filtrado booleano (máscaras)
mask = df['A'] > 2
df[mask]                    # Filas donde A > 2
df[df['A'] > 2]             # Forma abreviada
df[(df['A'] > 2) & (df['B'] < 8)]  # Múltiples condiciones (usar &, no and)
df[(df['A'] < 2) | (df['B'] > 7)]  # O lógico (usar |, no or)
df[df['A'].isin([1, 3])]          # Valores en lista (membresía)

# Crear máscaras con isin
mask = df['A'].isin([1, 3])  # Máscara de membresía


## Selección de Filas y Columnas


In [3]:
# iloc - indexación por posición (integer location)
df.iloc[0, 0]           # Elemento (0, 0)
df.iloc[0:2, 0:2]       # Subset de filas y columnas
df.iloc[[0, 2], [0, 1]] # Filas y columnas específicas

# loc - indexación por etiqueta (index labels)
df.loc['a', 'A']          # Elemento por etiqueta
df.loc['a':'c', 'A':'B']  # Rango de filas y columnas (inclusive)
df.loc[['a', 'c'], ['A', 'B']]  # Filas y columnas específicas

# Patrones comunes de indexación
# rows y cols pueden ser valores, listas, Series o máscaras
df.loc['a']              # Algunas filas (todas las columnas en DataFrame)
df.loc[:, ['A', 'B']]    # Todas las filas, algunas columnas
df.loc['a':'b', 'A']     # Subset de filas y columnas
df.loc[mask]             # Máscara booleana de filas (todas las columnas)
df.loc[mask, ['A', 'B']] # Máscara booleana de filas, algunas columnas

# at y iat - acceso rápido a un solo elemento
df.at['a', 'A']          # Más rápido que loc para un elemento
df.iat[0, 0]             # Más rápido que iloc para un elemento

# ADVERTENCIA: NUNCA encadenar corchetes para asignación
# ❌ df[mask]['A'] = 1  # SettingWithCopyWarning
# ✅ df.loc[mask, 'A'] = 1  # Correcto


np.int64(1)