
# Diccionario de Filtros en Pandas

Este notebook contiene un resumen de los filtros más comunes y útiles en pandas, con ejemplos detallados de cada uno.

### Contenido:
1. **Filtrado basado en una condición única**
2. **Filtrado con múltiples condiciones**
3. **Filtrado por valores nulos**
4. **Filtrado usando `isin()`**
5. **Filtrado por índice**
6. **Filtrado con `query()`**
7. **Filtrado basado en valores únicos**
8. **Filtrado usando `.loc[]` y `.iloc[]`**
9. **Filtrado por patrones de texto**



## 1. Filtrado basado en una condición única

El filtrado básico en pandas se realiza usando una condición que devuelve un valor booleano (True o False). Esto permite seleccionar filas que cumplen con esa condición.

**Ejemplo:**

Filtrar un DataFrame para obtener solo las filas donde la columna `A` es mayor que 5.

```python

```


In [None]:
import pandas as pd

data = {'A': [1, 6, 3, 8, 5], 'B': [10, 20, 30, 40, 50]}
df = pd.DataFrame(data)

# Filtrar filas donde la columna A es mayor que 5
filtered_df = df[df['A'] > 5]
print(filtered_df)


## 2. Filtrado con múltiples condiciones

Puedes combinar varias condiciones utilizando los operadores `&` (AND) y `|` (OR). Las condiciones deben estar entre paréntesis.

**Ejemplo:**

Filtrar un DataFrame para obtener solo las filas donde la columna `A` es mayor que 5 **y** la columna `B` es menor que 40.

```python

```


In [None]:
# Filtrar filas donde la columna A es mayor que 5 y la columna B es menor que 40
filtered_df = df[(df['A'] > 5) & (df['B'] < 40)]
print(filtered_df)


## 3. Filtrado por valores nulos

Puedes filtrar filas que contengan valores nulos (`NaN`) utilizando el método `isnull()` o `notnull()`.

**Ejemplo:**

Filtrar un DataFrame para obtener solo las filas donde la columna `A` tiene un valor nulo.

```python

```


In [None]:
import numpy as np

data = {'A': [1, np.nan, 3, np.nan, 5], 'B': [10, 20, 30, 40, 50]}
df = pd.DataFrame(data)

# Filtrar filas donde la columna A tiene valores nulos
filtered_df = df[df['A'].isnull()]
print(filtered_df)


## 4. Filtrado usando `isin()`

El método `isin()` se utiliza para filtrar filas que contienen valores dentro de una lista específica.

**Ejemplo:**

Filtrar un DataFrame para obtener solo las filas donde la columna `B` es igual a 10 o 30.

```python

```


In [None]:
# Filtrar filas donde la columna B tiene valores 10 o 30
filtered_df = df[df['B'].isin([10, 30])]
print(filtered_df)


## 5. Filtrado por índice

Puedes filtrar filas o columnas usando los valores del índice.

**Ejemplo:**

Filtrar un DataFrame para obtener las filas con índices específicos.

```python

```


In [None]:
# Filtrar filas por índice
filtered_df = df.loc[[0, 2]]
print(filtered_df)


## 6. Filtrado con `query()`

El método `query()` permite filtrar un DataFrame usando una expresión similar a SQL.

**Ejemplo:**

Filtrar un DataFrame para obtener solo las filas donde la columna `A` es mayor que 5.

```python

```


In [None]:
# Filtrar usando query
filtered_df = df.query('A > 5')
print(filtered_df)


## 7. Filtrado basado en valores únicos

El método `drop_duplicates()` elimina filas duplicadas, pero también puede usarse para filtrar filas basadas en valores únicos.

**Ejemplo:**

Filtrar un DataFrame para obtener solo las filas con valores únicos en la columna `A`.

```python

```


In [None]:
# Filtrar filas únicas basadas en la columna A
filtered_df = df.drop_duplicates(subset=['A'])
print(filtered_df)


## 8. Filtrado usando `.iloc[]`

Los métodos `.loc[]` y `.iloc[]` permiten acceder a subconjuntos de datos basados en etiquetas o posiciones.

**Ejemplo:**

Filtrar un DataFrame para obtener las filas en las posiciones 1 y 3.

```python

```


In [None]:
# Filtrar filas usando iloc
filtered_df = df.iloc[[1, 3]]
print(filtered_df)


## 9. Filtrado por patrones de texto

Puedes filtrar filas basadas en si una columna contiene un cierto patrón de texto utilizando el método `str.contains()`.

**Ejemplo:**

Filtrar un DataFrame para obtener solo las filas donde la columna `B` contiene el dígito `3`.

```python

```


In [None]:
# Filtrar filas donde la columna B contiene el dígito 3
filtered_df = df[df['B'].astype(str).str.contains('3')]
print(filtered_df)

## 10. Filtrado usando between()
Filtra los valores que están entre un rango específico.

In [None]:
# Filtrar valores entre un rango
filtered_df = df[df['A'].between(3, 8)]


## 16. Filtrado por filas duplicadas con duplicated()
Encuentra y filtra filas duplicadas.

In [None]:
# Filtrar filas duplicadas
filtered_df = df[df.duplicated()]
