### Preenchendo Valores Ausentes em DataFrames

A função fillna0 é usada para preencher os valores ausentes. A função oferece muitas opções. Podemos usar um valor específico, uma função agregada (por exemplo, média) ou o valor anterior ou seguinte.
Para esse exemplo usaremos a moda, a estatística que representa o valor que aparece mais vezes em uma variável.

In [None]:
# Importando a biblioteca
import pandas as pd

In [None]:
#Importando Dataset
df = pd.read_csv("dados/dataset.csv")

In [None]:
# Mostrando as 5 primeiras linhas do dataset
df.head()

In [None]:
# Verificando os valores vazios:
# Para isso vamos utilizar .isna() e sum(), pois a união dos dois eles vão somar o
# numero de valores vazios por coluna e exibir.
df.isna().sum()

#### Fazendo a Interpolação dos Dados

A interpolação é uma técnica essencial em análise de dados para lidar com valores ausentes, mas deve ser aplicada com um entendimento claro do seu significado e das características dos seus dados.

Neste caso, vamos aplicar a moda para ver qual o valor com mais frequência e substituir os valores NaN(ausentes) por o valor com maior frequência.

A moda em Estatística é uma medida de tendência central que representa o valor mais frequente em um conjunto de dados.

A moda é especialmente útil quando queremos saber qual é o valor mais comum ou popular em um conjunto de dados, seja em uma distribuição unimodal (com apenas uma moda) ou em uma distribuição bimodal (com duas modas).

In [None]:
# Extraindo a moda da coluna Quantidade
# Vamos utilizar .valuecounts() para contar quantas vezes cada valor aparece na coluna,
# e com o .index vamos pegar o valor que aparece em destaque
moda = df['Quantidade'].value_counts().index[0]

In [None]:
# Exibindo a moda
print(moda)

In [None]:
# Preenchendo os valores vazios
# Para preencher os valores vazios vamos utilizar o .fillna() que é usado para preencher 
# valores ausentes (NaN) em um DataFrame. Com isso, vamos colocar no parametro value= 
# o valor da variavel moda para fazer a interpolção. O inplace para salvar direto no objeto,
# sem precisar fazer uma cópia para outra variável.
df['Quantidade']= df['Quantidade'].fillna(value=moda)

In [None]:
# Verificando se ainda tem valores vazios
df.isna().sum()

In [None]:
# Exibindo a base atualizada
df.head(5)