# Handling missing values

In [1]:
import pandas as pd

In [5]:
data = pd.read_csv('/content/data_#na.csv', na_values= 'not available')
data

Unnamed: 0,Name,Marks,Grades
0,Priyang,98.0,
1,Aadhya,,AB
2,Krisha,99.0,AA
3,Vedant,87.0,
4,Parshv,90.0,AC
5,Mittal,,BA
6,Archana,82.0,


In [6]:
# Con keep_default_na como False desactivamos la localización de valores NaN
# Y los mantenemos con su valor original
data = pd.read_csv('/content/data_#na.csv', keep_default_na = False)
data

# NOTA: keep_default_na es True por default

Unnamed: 0,Name,Marks,Grades
0,Priyang,98.0,
1,Aadhya,,AB
2,Krisha,99.0,AA
3,Vedant,87.0,
4,Parshv,90.0,AC
5,Mittal,,BA
6,Archana,82.0,not available


## `keep_default_na = False `& `na_values specified`

In [8]:
# En este caso, solo aplican los valores especificados de na_values
data = pd.read_csv('/content/data_#na.csv', keep_default_na = False,
                   na_values= 'not available')
data

Unnamed: 0,Name,Marks,Grades
0,Priyang,98.0,
1,Aadhya,,AB
2,Krisha,99.0,AA
3,Vedant,87.0,
4,Parshv,90.0,AC
5,Mittal,,BA
6,Archana,82.0,


## na_filter

In [13]:
# Podemos desactivar el filtro de valores NaN si es que sabemos que
# no existen estos valores en nuestro archivo
# Esto mejora el rendimiento al leer el archivo
data = pd.read_csv('marks.csv', na_filter = False)
data

# NOTA: na_filter es True por default

Unnamed: 0,Name,Marks,Grades
0,Priyang,98,AA
1,Aadhya,89,AB
2,Krisha,99,AA
3,Vedant,87,AB
4,Parshv,90,AC
5,Mittal,83,BA
6,Archana,82,BB


## `keep_default_na = False `& `na_values specified` & na_filter = False

In [15]:
# Poner na_filter en False, hará que se ignoren los filtros de na_values
# keep_default_na
data = pd.read_csv('/content/data_#na.csv', keep_default_na = True,
                   na_values= 'not available',
                   na_filter = False)
data

Unnamed: 0,Name,Marks,Grades
0,Priyang,98.0,
1,Aadhya,,AB
2,Krisha,99.0,AA
3,Vedant,87.0,
4,Parshv,90.0,AC
5,Mittal,,BA
6,Archana,82.0,not available
