<h1  align="center"><b> TRANSFORMAÇÃO E DECOMPOSIÇÃO </b></h1>

`Objetivo Geral:` Importar a série temporal tratada dos dados pluviométricos do município de São Paulo e realizar as transformações (em busca de estacionalidade e normalidade) e decomposição (em tendência, sazonalidade e resíduo)

`Dados:` Os dados foram tratados e extraídos na pasta [Tratamento de Dados do Projeto Chuva](../[2]%20Tratamento%20de%20Dados%20-%20Projeto%20Chuva/). 

In [5]:
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt

from matplotlib.pylab import rcParams
rcParams['figure.figsize'] = 15, 6

<h2 align="center"><b> Importação e Decomposição </b></h2>

In [6]:
série_chuva = pd.read_csv('./Série Tratada - Chuva Mensal.csv', sep = ';', index_col = 0)
série_chuva = pd.Series(série_chuva['0'], index = série_chuva.index, name = 'Chuva(mm)')

In [8]:
from statsmodels.tsa.seasonal import seasonal_decompose
decomposição = seasonal_decompose(série_chuva, model = 'additive', period = 12)

![decomposição](./Gráficos/Decomposição.png)

<h2 align="center"><b> Normalidade </b></h2>

In [9]:
import scipy.stats as stats

In [None]:
stats.probplot(série_chuva, dist = 'norm', plot = plt)
plt.title('Normal QQ Plot')
plt.show()

![Normal QQ Plot](./Gráficos/Normal%20QQ%20Plot.png)

### `Teste Shapiro-Wilk`
&emsp;&emsp; O Teste de Shapiro-Wilk é uma ferramenta estatística utilizada para verificar se uma amostra de dados segue uma distribuição normal. O teste retorna um valor p, se esse valor for maior que o nível de significância (geralmente 0,05), dizemos que a distribuição é normal.

&emsp;&emsp; No caso da série temporal não ser normal, convém tentar realizar uma transformação para que ela se aproxime de uma distribuição normal, pois isso facilita a análise e a modelagem. As transformações mais comuns são a transformação logarítmica e a transformação por raiz cúbica.

In [17]:
def teste_shapiro(série):
    e, p = stats.shapiro(série)
    print(f'Estatística de Teste = {e}')
    print(f'p-valor = {p}')
    print(f'Resultado: {"É Normal" if (p > 0.05) else "Não é Normal"}')

teste_shapiro(série_chuva)

Estatística de teste = 0.9242801666259766
p-valor = 2.1469944013830303e-14
Resultado: Não é Normal


`Transformação Logarítmica:` Não é possível realizar a transformação logarítmica, pois a série possui valores iguais a zero. Caso fosse possível, a transformação logarítmica seria realizada da seguinte forma: 

In [20]:
série_chuva_log = np.log(série_chuva)

`Transformação por Raiz Cúbica:` A transformação por raiz cúbica não vai resolver completamente o problema de normalidade, mas vai melhorar significativamente a distribuição dos dados. Podemos realizar a transformação por raiz cúbica da seguinte forma:

In [22]:
série_chuva_cub = série_chuva ** (1/3)
teste_shapiro(série_chuva_cub)

Estatística de teste = 0.9843666553497314
p-valor = 7.994796033017337e-05
Resultado: Não é Normal


![Normal QQ Plot - Transformação por Raiz Cúbica](./Gráficos/Normal%20QQ%20Plot%20-%20Transformação%20por%20Raiz%20Cúbica.png)