# Operaciones de búsqueda y filtrado

## Filtrar

Para filtrar filas en un DataFrame en función de una condición, se utiliza la notación booleana. Por ejemplo, para filtrar un DataFrame ``df`` y obtener solo las filas donde la columna A es mayor que 5, se puede hacer lo siguiente:

In [3]:
import pandas as pd

# Crear un DataFrame de ejemplo
df = pd.DataFrame({
    'A': [1, 2, 6, 4, 5],
    'B': [10, 20, 30, 40, 50]
})

# Filtrar filas donde la columna A es mayor que 5
filtered_df = df[df['A'] > 5]
print(filtered_df)

   A   B
2  6  30


Para buscar valores específicos dentro de una columna, se puede utilizar el método ``isin()``. Este método devuelve un DataFrame con las filas que contienen los valores especificados:

In [9]:
# Filtrar filas donde la columna B contiene valores específicos
values_to_search = [20, 40]
filtered_df = df[df['B'].isin(values_to_search)]
print(filtered_df)

   A   B
1  2  20
3  4  40


La **selección basada en múltiples condiciones** se puede realizar utilizando operadores lógicos (& para "y", | para "o"). Por ejemplo, para filtrar filas donde la columna A es mayor que 2 y la columna B es menor que 50:

In [12]:
# Filtrar filas con múltiples condiciones
filtered_df = df[(df['A'] > 2) & (df['B'] < 50)]
print(filtered_df)

   A   B
2  6  30
3  4  40


Para buscar y filtrar datos basados en patrones de texto, se puede utilizar el método ``str.contains()`` en combinación con la notación booleana. Por ejemplo, para filtrar filas donde la columna C contiene la subcadena 'foo':

In [15]:
import pandas as pd

# Crear un DataFrame de ejemplo con datos de texto
df = pd.DataFrame({
    'A': [1, 2, 6, 4, 5],
    'C': ['foo', 'bar', 'foo', 'baz', 'qux']
})

# Filtrar filas donde la columna C contiene 'foo'
filtered_df = df[df['C'].str.contains('foo')]
print(filtered_df)

   A    C
0  1  foo
2  6  foo


El método ``query()`` proporciona una sintaxis similar a SQL para realizar búsquedas y filtrados de manera más legible. Por ejemplo, para filtrar filas donde la columna A es mayor que 2 y la columna B es menor que 50:

In [18]:
import pandas as pd

# Crear un DataFrame de ejemplo
df = pd.DataFrame({
    'A': [1, 2, 6, 4, 5],
    'B': [10, 20, 30, 40, 50]
})

# Usar el método query para filtrar filas
filtered_df = df.query('A > 2 and B < 50')
print(filtered_df)

   A   B
2  6  30
3  4  40


Para buscar valores nulos o no nulos, se pueden utilizar los métodos ``isna()`` y ``notna()``. Por ejemplo, para filtrar filas donde la columna D tiene valores nulos:

In [21]:
import pandas as pd

# Crear un DataFrame de ejemplo con valores nulos
df = pd.DataFrame({
    'A': [1, 2, 6, 4, 5],
    'D': [None, 20, 30, None, 50]
})

# Filtrar filas donde la columna D tiene valores nulos
filtered_df = df[df['D'].isna()]
print(filtered_df)

   A   D
0  1 NaN
3  4 NaN
