# Métodos de Interpolação

In [2]:
import pandas as pd # noqa E402

In [3]:
data = [0.5, None, None, 0.52, 0.54, None, None, 0.59, 0.6, None, 0.7]
s = pd.Series(data)

In [4]:
s

0     0.50
1      NaN
2      NaN
3     0.52
4     0.54
5      NaN
6      NaN
7     0.59
8     0.60
9      NaN
10    0.70
dtype: float64

In [5]:
s.fillna(0)

0     0.50
1     0.00
2     0.00
3     0.52
4     0.54
5     0.00
6     0.00
7     0.59
8     0.60
9     0.00
10    0.70
dtype: float64

O método `fillna()` pode receber como parâmetro um método, que será utilizado para preencher os valores nulos.

Se passarmos o método `'ffill'`, ele irá preencher os valores nulos com o valor anterior.

In [8]:
s.fillna(method='ffill')

0     0.50
1     0.50
2     0.50
3     0.52
4     0.54
5     0.54
6     0.54
7     0.59
8     0.60
9     0.60
10    0.70
dtype: float64

Se passarmos o método `'bfill'`, ele irá preencher os valores nulos com o valor posterior.

In [7]:
s.fillna(method='bfill')

0     0.50
1     0.52
2     0.52
3     0.52
4     0.54
5     0.59
6     0.59
7     0.59
8     0.60
9     0.70
10    0.70
dtype: float64

Se passarmos o método `mean()` para o método `fillna()`, o valor que substituirá os valores nulos será a média dos valores não nulos.

In [9]:
s.fillna(s.mean())

0     0.500
1     0.575
2     0.575
3     0.520
4     0.540
5     0.575
6     0.575
7     0.590
8     0.600
9     0.575
10    0.700
dtype: float64

O método `fillna()` pode receber o parâmetro `limit`, que indica quantos 
valores **SEGUIDOS** ele vai substituir. Se houver, por exemplo, 3 valores nulos, e o 
`limit` for igual a 1, o `fillna()` vai substituir apenas a primeira ocorrência.

In [11]:
s.fillna(method='ffill', limit=1)

0     0.50
1     0.50
2      NaN
3     0.52
4     0.54
5     0.54
6      NaN
7     0.59
8     0.60
9     0.60
10    0.70
dtype: float64

Podemos usar isso pra intercalar os métodos `ffill` e `bfill`, de forma a evitar
ter um valor repetido artificialmente em demasia.

In [15]:
s

0     0.50
1      NaN
2      NaN
3     0.52
4     0.54
5      NaN
6      NaN
7     0.59
8     0.60
9      NaN
10    0.70
dtype: float64

In [16]:
s1 = s.fillna(method='ffill', limit=1)
s1

0     0.50
1     0.50
2      NaN
3     0.52
4     0.54
5     0.54
6      NaN
7     0.59
8     0.60
9     0.60
10    0.70
dtype: float64

In [17]:
s1 = s1.fillna(method='bfill', limit=1)
s1

0     0.50
1     0.50
2     0.52
3     0.52
4     0.54
5     0.54
6     0.59
7     0.59
8     0.60
9     0.60
10    0.70
dtype: float64