# Reversão da Transformação e Diferenciação
A transformação e a diferenciação altera os valores da série e, quando for para criar previsões ou mostrar valores, será necessário voltar para escala original.

In [20]:
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt

In [21]:
dados = pd.read_csv('AirPassengers.csv')
dados

Unnamed: 0,Month,#Passengers
0,1949-01,112
1,1949-02,118
2,1949-03,132
3,1949-04,129
4,1949-05,121
...,...,...
139,1960-08,606
140,1960-09,508
141,1960-10,461
142,1960-11,390


In [22]:
# Criando a série
serie = pd.Series(dados['#Passengers'].values, index = dados['Month'])
serie

Month
1949-01    112
1949-02    118
1949-03    132
1949-04    129
1949-05    121
          ... 
1960-08    606
1960-09    508
1960-10    461
1960-11    390
1960-12    432
Length: 144, dtype: int64

## Reversão da transformação por logaritmo
Quando colocamos a transformação por log (np.log), é o logaritmo natural, ou seja, o ln, tem base e (e ~ 2,71) (para fazermos a reversão, temo que sabe qual é a sua base).

In [23]:
serie2 = np.log(serie)
serie2

Month
1949-01    4.718499
1949-02    4.770685
1949-03    4.882802
1949-04    4.859812
1949-05    4.795791
             ...   
1960-08    6.406880
1960-09    6.230481
1960-10    6.133398
1960-11    5.966147
1960-12    6.068426
Length: 144, dtype: float64

In [24]:
serie_invertida = np.e**serie2 # e ^ serie2
serie_invertida

Month
1949-01    112.0
1949-02    118.0
1949-03    132.0
1949-04    129.0
1949-05    121.0
           ...  
1960-08    606.0
1960-09    508.0
1960-10    461.0
1960-11    390.0
1960-12    432.0
Length: 144, dtype: float64

E se utilizarmos o logaritmo na base 10?

In [25]:
serie2 = np.log10(serie)
serie2

Month
1949-01    2.049218
1949-02    2.071882
1949-03    2.120574
1949-04    2.110590
1949-05    2.082785
             ...   
1960-08    2.782473
1960-09    2.705864
1960-10    2.663701
1960-11    2.591065
1960-12    2.635484
Length: 144, dtype: float64

In [26]:
serie_revertida = 10**serie2 # 10^serie2
serie_revertida

Month
1949-01    112.0
1949-02    118.0
1949-03    132.0
1949-04    129.0
1949-05    121.0
           ...  
1960-08    606.0
1960-09    508.0
1960-10    461.0
1960-11    390.0
1960-12    432.0
Length: 144, dtype: float64

## Reversão da transformação por raiz cúbica

In [27]:
serie3 = (serie)**(1/3) # Raiz cúbica, útil quando temos valores negativos ou zeros na série
serie3

Month
1949-01    4.820285
1949-02    4.904868
1949-03    5.091643
1949-04    5.052774
1949-05    4.946087
             ...   
1960-08    8.462348
1960-09    7.979112
1960-10    7.725032
1960-11    7.306144
1960-12    7.559526
Length: 144, dtype: float64

In [28]:
serie_revertida = serie3**3 # O inverso da raiz cúbica é o número elevado ao cubo
serie_revertida

Month
1949-01    112.0
1949-02    118.0
1949-03    132.0
1949-04    129.0
1949-05    121.0
           ...  
1960-08    606.0
1960-09    508.0
1960-10    461.0
1960-11    390.0
1960-12    432.0
Length: 144, dtype: float64

# Reversão da Diferenciação

A diferenciação, que é um método de se transformar uma série não estacionária numa estacionária (zt - zt-1).

In [29]:
serie_diferenciada = serie.diff()
serie_diferenciada

Month
1949-01     NaN
1949-02     6.0
1949-03    14.0
1949-04    -3.0
1949-05    -8.0
           ... 
1960-08   -16.0
1960-09   -98.0
1960-10   -47.0
1960-11   -71.0
1960-12    42.0
Length: 144, dtype: float64

Como a diferenciação perdemos o primeiro valor pela fórmula de diferenciação, ficamos sem um antecessor (D(Yt) = Yt - Yt-1)  e perdemos o primeiro dado.

In [30]:
serie_revertida = serie.shift(1) + serie_diferenciada
serie_revertida

Month
1949-01      NaN
1949-02    118.0
1949-03    132.0
1949-04    129.0
1949-05    121.0
           ...  
1960-08    606.0
1960-09    508.0
1960-10    461.0
1960-11    390.0
1960-12    432.0
Length: 144, dtype: float64

## Organizando num DataFrame

E se não quisermos criar necessariamente uma Série no pandas e fizer direto no DataFrame?

In [34]:
dados['valores_diferenciados'] = dados['#Passengers'].diff() # Média e variância constante
dados

Unnamed: 0,Month,#Passengers,valores_diferenciados
0,1949-01,112,
1,1949-02,118,6.0
2,1949-03,132,14.0
3,1949-04,129,-3.0
4,1949-05,121,-8.0
...,...,...,...
139,1960-08,606,-16.0
140,1960-09,508,-98.0
141,1960-10,461,-47.0
142,1960-11,390,-71.0


In [35]:
dados['valores_revertidos'] = dados['#Passengers'].shift(1) + dados['valores_diferenciados']
dados

Unnamed: 0,Month,#Passengers,valores_diferenciados,valores_revertidos
0,1949-01,112,,
1,1949-02,118,6.0,118.0
2,1949-03,132,14.0,132.0
3,1949-04,129,-3.0,129.0
4,1949-05,121,-8.0,121.0
...,...,...,...,...
139,1960-08,606,-16.0,606.0
140,1960-09,508,-98.0,508.0
141,1960-10,461,-47.0,461.0
142,1960-11,390,-71.0,390.0
