#### Consultas a un dataframe

El primer paso para entender las consultas de dataframe, es entender el proceso de enmascaramiento booleano. Este es la base de la eficiencia tanto en Pandas como en Numpy. Y es analogo al enmascaramiento de bits que se utiliza en otras areas de la informática.

El enmascaramiento booleano en pandas es una técnica que permite filtrar datos de un DataFrame o Serie utilizando condiciones lógicas. Se basa en la creación de una Serie de valores booleanos (True o False), que se utiliza para seleccionar únicamente las filas o columnas que cumplen con una condición específica.

In [None]:
import pandas as pd

dataframe = pd. read_csv("../datasets/Admission_Predict.csv", index_col=0)
dataframe.columns = [x.lower().strip() for x in dataframe.columns]
dataframe.head()

In [None]:
# las mascaras booleanas se crean aplicando operadores directamente al dataframe

# por ejemplo en nuestra dataframe podriamos mostrar solamente los estudiantes con mas de un 
# 0.7 de  probabilidad de ser admitidos
admision_bm = dataframe["chance of admit"] > 0.7
admision_bm

In [None]:
# ahora podemos aplicar la mascara al dataframe para mostrar los valores que han sido marcados
# como True y ocultar los False. Para esto usamos el método where()
dataframe.where(admision_bm)
dataframe.head()

In [None]:
# podemos ver que solo los valores que cumplen la condición son mostrados, mientras que 
# los que no la cumplen han sido sustituidos por NaN

# ahora podemos utilizar la función dropna() para eliminar los valores NaN
dataframe.where(admision_bm).dropna().head()

In [None]:
# podemos obtener el mismo resultado de manera más simple
dataframe[dataframe["chance of admit"] > 0.7].head()

In [None]:
# tambien podemos combinar multiples mascaras booleanas, al igual que multiples criterios
dataframe[(dataframe["chance of admit"] > 0.7) & (dataframe["chance of admit"] < 0.9)].head()

In [None]:
# Pandas cuenta con funciones que darían la misma salida sin utilizar signos de compararación
# .gt() = >
# .lt() = <
dataframe[(dataframe["chance of admit"].gt(0.7)) & (dataframe["chance of admit"].lt(0.9))].head()

In [None]:
# al ser funciones de Pandas podemos concatenarlas sin usar &
dataframe[dataframe["chance of admit"].gt(0.7).lt(0.9)].head()