# Pré-processamento Série Temporal

## 1. Remover os valores ausentes (se possível)

Quando usar: Quando os valores ausentes são poucos e não impactam significativamente a análise.

Como fazer: Você pode usar funções como dropna() para remover as linhas com valores ausentes.

In [None]:
df.dropna(inplace=True)

## 2. Interpolação

Quando usar: Quando a série temporal é contínua e os valores nulos  podem ser estimados com base nos valores anteriores e posteriores.

Como fazer: Usando o método interpolate(), é possível preencher os valores ausentes de forma linear ou com outros métodos.

Outras opções de interpolação:

method='time' para interpolação baseada em tempo.

method='polynomial' para interpolação polinomial.

In [None]:
df['coluna'].interpolate(method='linear', inplace=True)

## 3. Preencher com o último valor conhecido (forward fill)

Quando usar: Quando o valor ausente pode ser razoavelmente assumido como igual ao último valor disponível.

Como fazer: Utilize o método ffill().

In [None]:
df.fillna(method='ffill', inplace=True)

## 4. Preencher com o próximo valor (backward fill)

Quando usar: Quando o valor ausente pode ser substituído pelo próximo valor disponível.

Como fazer: Utilize o método bfill().

In [None]:
df.fillna(method='bfill', inplace=True)

## 5. Preencher com uma média ou mediana

Quando usar: Quando os valores ausentes são distribuídos aleatoriamente e podem ser representados por uma média ou mediana.

Como fazer: Calcule a média ou mediana e use fillna() para preencher os valores.

In [None]:
media = df['coluna'].mean()
df['coluna'].fillna(media, inplace=True)

## 6. Modelos de predição

Quando usar: Quando os dados ausentes seguem um padrão mais complexo, você pode usar modelos de aprendizado de máquina para prever esses valores.

Como fazer: Treine um modelo com as colunas que têm valores completos e preencha os ausentes com as previsões.

## 7. Marcar valores ausentes como uma categoria
Quando usar: Se a ausência de dados em si é uma informação importante.


Como fazer: Adicione uma nova categoria ou coluna indicando a ausência.

In [None]:
df['coluna_na'] = df['coluna'].isna()