# Filtering data (conditional selection)
## With or without loc & iloc

In [42]:
import pandas as pd

In [43]:
dict1 ={'Name':['Priyang','Aadhya','Krisha','Vedant','Parshv','Mittal','Archana'],
                'Marks':[98,89,99,87,90,83,82],
                'Grades':['AA','AB','AA','AB','AC','BA','BB']
               }
df1=pd.DataFrame(dict1,index=['stu1','stu2','stu3','stu4','stu5',
                             'stu6','stu7'])
df1

Unnamed: 0,Name,Marks,Grades
stu1,Priyang,98,AA
stu2,Aadhya,89,AB
stu3,Krisha,99,AA
stu4,Vedant,87,AB
stu5,Parshv,90,AC
stu6,Mittal,83,BA
stu7,Archana,82,BB


In [None]:
# Mostrar a los estudiantes con una calificación mayor a 90
# Podemos guardar el resultado en una variable, y luego mandar esa variable al dataframe
x = df1['Marks']>90
df1[x]

Unnamed: 0,Name,Marks,Grades
stu1,Priyang,98,AA
stu3,Krisha,99,AA


In [None]:
# O se puede hacer en una sola línea de esta manera
df1[df1['Marks']>90]

Unnamed: 0,Name,Marks,Grades
stu1,Priyang,98,AA
stu3,Krisha,99,AA


In [None]:
# Mostrar a los estudiantes con nota 'AB'
df1[df1['Grades']=='AB']

Unnamed: 0,Name,Marks,Grades
stu2,Aadhya,89,AB
stu4,Vedant,87,AB


## Si se trabaja con más de 2 condiciones, cada condición tiene que ir en `parentesis`

In [None]:
# Mostrar a las estudiantes que tengan calificaciones mayores a 80 y nota de 'AB'
df1[(df1["Marks"]>80) & (df1['Grades']=='AB')]

Unnamed: 0,Name,Marks,Grades
stu2,Aadhya,89,AB
stu4,Vedant,87,AB


In [None]:
# Mostrar el nombre de los estudiantes que tengan calificación mayor a 90
df1[df1['Marks']>90]['Name']

Unnamed: 0,Name
stu1,Priyang
stu3,Krisha


In [95]:
# Mostrar el nombre de los estudiantes que tengan nota de 'AB'
df1.loc[df1['Grades']=='AB']['Name']

Unnamed: 0,Name
stu2,Aadhya
stu4,Vedant


## Filtering data with loc

In [48]:
# Mostrar a los estudiantes con una calificación mayor a 90 [loc]
df1.loc[df1['Marks']>90]

Unnamed: 0,Name,Marks,Grades
stu1,Priyang,98,AA
stu3,Krisha,99,AA


In [None]:
# Mostrar a las estudiantes que tengan calificaciones mayores a 80 y nota de 'AB' [loc]
df1.loc[(df1['Marks']>80) & (df1['Grades']=='AB')]

Unnamed: 0,Name,Marks,Grades
stu2,Aadhya,89,AB
stu4,Vedant,87,AB


# Filtering data with iloc

In [None]:
# Mostrar a los estudiantes que tengan calificación mayor a 90 [iloc]
df1[df1.iloc[:, 1]>90]

Unnamed: 0,Name,Marks,Grades
stu1,Priyang,98,AA
stu3,Krisha,99,AA


In [45]:
# Mostrar a las estudiantes que tengan calificaciones mayores a 80 y nota de 'AB' [iloc]
df1[(df1.iloc[:, 1]>80) & (df1.iloc[:, 2]=='AB')]

Unnamed: 0,Name,Marks,Grades
stu2,Aadhya,89,AB
stu4,Vedant,87,AB


In [56]:
# Mostrar el nombre de los estudiantes que tengan nota de 'AB' [iloc]
df1[df1.iloc[:, 2]=='AB']['Name']

Unnamed: 0,Name
stu2,Aadhya
stu4,Vedant


## Ejemplos

In [66]:
# Mostrar nombres y notas de los estudiantes con calificación menor a 85
df1.loc[df1['Marks']<85, ['Name', 'Grades']]

Unnamed: 0,Name,Grades
stu6,Mittal,BA
stu7,Archana,BB


In [75]:
# Mostrar a los estudiantes con calificaciones entre 80 y 90
df1.loc[df1['Marks'].between(80,90)]

# Nota: el método between permite buscar valores en un rango
# .between(menor, mayor)

Unnamed: 0,Name,Marks,Grades
stu2,Aadhya,89,AB
stu4,Vedant,87,AB
stu5,Parshv,90,AC
stu6,Mittal,83,BA
stu7,Archana,82,BB


In [80]:
# Mostrar los datos de la lista
lista_alumnos = ['Aadhya', 'Mittal', 'Archana', 'Rafa']

df1.loc[df1['Name'].isin(lista_alumnos)]

# Nota: el método isin permite buscar valores incluidos en una lista de valores
# .isin(lista)

Unnamed: 0,Name,Marks,Grades
stu2,Aadhya,89,AB
stu6,Mittal,83,BA
stu7,Archana,82,BB


In [90]:
# Mostrar alumnos que su nombre incie con A
df1[df1['Name'].str.startswith('A')]

# Nota: accedemos a 'str' y con ellos usamos el método
# startswith(caracteres) para buscar una cadena que empiece con algo

Unnamed: 0,Name,Marks,Grades
stu2,Aadhya,89,AB
stu7,Archana,82,BB


In [89]:
# Mostrar a los alumnos uqe tengan alguna 'i' en su nombre
df1[df1['Name'].str.contains(pat = 'i')]

Unnamed: 0,Name,Marks,Grades
stu1,Priyang,98,AA
stu3,Krisha,99,AA
stu6,Mittal,83,BA


In [97]:
# Mostrar a los alumnos de los cuales su nombre no empieza con 'A'
df1[~df1['Name'].str.startswith('A')]

# El simbolo ~  invierte la sentencia que estemos haciendo

Unnamed: 0,Name,Marks,Grades
stu1,Priyang,98,AA
stu3,Krisha,99,AA
stu4,Vedant,87,AB
stu5,Parshv,90,AC
stu6,Mittal,83,BA
