<a href="https://colab.research.google.com/github/fcoliveira-utfpr/chuva_probabilidade_sh/blob/main/analises_anual_chuva.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

##Instalando e importando bibliotecas



In [4]:
#Instalando bibliotecas
!pip install pymannkendall -q

#Importando bibliotecas
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
import datetime
from datetime import datetime
from datetime import timedelta
import math
from scipy import stats
from scipy.stats import (gamma, norm, ks_2samp, beta, weibull_min, expon, lognorm)
from matplotlib.ticker import FuncFormatter
from scipy.stats import ksone
from sklearn.preprocessing import MinMaxScaler
import pymannkendall as mk
from scipy.stats import linregress

##Importando e abrindo planilha

In [5]:
base_url = "https://raw.githubusercontent.com/fcoliveira-utfpr/chuva_probabilidade_sh/refs/heads/main/"
arquivo = "dataset_chuva_sh.csv"
url = base_url + arquivo
df = pd.read_csv(url)
data = df['Data']
df = df.drop(columns=['Data'])
df = df.replace({',': '.'}, regex=True)
df = df.apply(lambda x: pd.to_numeric(x, errors = 'coerce'), axis=1)
df['Data'] = pd.to_datetime(data, format='%d/%m/%Y')
df

Unnamed: 0,Dia,Mês,Ano,Chuva (mm),lat,lon,alt,Data
0,1.0,1.0,1976.0,0.0,-24.887224,-54.30623,238.0,1976-01-01
1,2.0,1.0,1976.0,0.0,-24.887224,-54.30623,238.0,1976-01-02
2,3.0,1.0,1976.0,0.0,-24.887224,-54.30623,238.0,1976-01-03
3,4.0,1.0,1976.0,0.0,-24.887224,-54.30623,238.0,1976-01-04
4,5.0,1.0,1976.0,0.0,-24.887224,-54.30623,238.0,1976-01-05
...,...,...,...,...,...,...,...,...
17527,27.0,12.0,2023.0,0.0,-24.887224,-54.30623,238.0,2023-12-27
17528,28.0,12.0,2023.0,0.0,-24.887224,-54.30623,238.0,2023-12-28
17529,29.0,12.0,2023.0,9.8,-24.887224,-54.30623,238.0,2023-12-29
17530,30.0,12.0,2023.0,0.0,-24.887224,-54.30623,238.0,2023-12-30


##Agrupando chuva anual

In [6]:
#Precipitação pluvial total anual
df_ano = df.groupby(['Ano']).agg({
    'Chuva (mm)': 'sum'
}).reset_index()
df_ano.head()

Unnamed: 0,Ano,Chuva (mm)
0,1976.0,1440.3
1,1977.0,1478.8
2,1978.0,1003.1
3,1979.0,1835.4
4,1980.0,1450.9


##Analisando tendência anual

In [7]:
# Extrai os anos e os valores de chuva
anos = df_ano['Ano']
chuva = df_ano['Chuva (mm)']

# Regressão linear
slope, intercept, r_value, p_value, std_err = linregress(anos, chuva)

# Teste de Mann-Kendall
mk_result = mk.original_test(chuva)

# Armazena os resultados
result = {
    'Slope': slope,
    'Intercept': intercept,
    'p-value Regressão': p_value,
    'R²': r_value**2,
    'Mann-Kendall S': mk_result.s,
    'Mann-Kendall p-value': mk_result.p,
    'Mann-Kendall Tendência': mk_result.trend
}

# Cria um DataFrame com os resultados para exibição
df_results = pd.DataFrame([result])

# Exibi os resultados
df_results

Unnamed: 0,Slope,Intercept,p-value Regressão,R²,Mann-Kendall S,Mann-Kendall p-value,Mann-Kendall Tendência
0,1.678713,-1608.806575,0.656408,0.00434,64.0,0.575516,no trend


##Encontrando FDP e FDA

In [8]:
#pegando uma série da chuva anual
chuva_anual = df_ano['Chuva (mm)']

#Transformando os dados
for i in chuva_anual:
  i + 1000

# Cria um intervalo de valores para a precipitação
x = np.linspace(0, max(chuva_anual), 1000)

# Distribuição Normal
mu, std = stats.norm.fit(chuva_anual)
pdf_normal = stats.norm.pdf(x, mu, std)
D_normal, p_value_normal = stats.kstest(chuva_anual, 'norm', args=(mu, std))
cdf_normal = stats.norm.cdf(x, mu, std)

# Distribuição Exponencial
loc_exp, scale_exp = stats.expon.fit(chuva_anual)
pdf_exp = stats.expon.pdf(x, loc=loc_exp, scale=scale_exp)
D_exp, p_value_exp = stats.kstest(chuva_anual, 'expon', args=(loc_exp, scale_exp))
cdf_exp = stats.expon.cdf(x, loc=loc_exp, scale=scale_exp)

# Distribuição Gama
shape_gama, loc_gama, scale_gama = stats.gamma.fit(chuva_anual)
pdf_gama = stats.gamma.pdf(x, a=shape_gama, loc=loc_gama, scale=scale_gama)
D_gama, p_value_gama = stats.kstest(chuva_anual, 'gamma', args=(shape_gama, loc_gama, scale_gama))
cdf_gama = stats.gamma.cdf(x, a=shape_gama, loc=loc_gama, scale=scale_gama)

# Distribuição Log-Normal
shape_ln, loc_ln, scale_ln = stats.lognorm.fit(chuva_anual)
pdf_ln = stats.lognorm.pdf(x, s=shape_ln, loc=loc_ln, scale=scale_ln)
D_ln, p_value_ln = stats.kstest(chuva_anual, 'lognorm', args=(shape_ln, loc_ln, scale_ln))
cdf_ln = stats.lognorm.cdf(x, s=shape_ln, loc=loc_ln, scale=scale_ln)

n = len(chuva_anual)
alpha = 0.05  # Nível de significância
D_critical = ksone.ppf(1 - alpha / 2, n)

# Cria um dicionário com os dados
data = {
    "Distribuição": ["Normal", "Exponencial", "Gama", "Log-Normal"],
    "P-valor": [p_value_normal, p_value_exp, p_value_gama, p_value_ln],
    "Dsup": [D_normal, D_exp, D_gama, D_ln],
    "Dcrítico": [D_critical, D_critical, D_critical, D_critical], # Valor de D calculado (Dsup) tem que ser menor que D crítico.
    "Coeficientes": [
            f"mu={mu:.1f}, std={std:.1f}" if not np.isnan(mu) and not np.isnan(std) else "-",
            f"loc={loc_exp:.1f}, scale={scale_exp:.1f}" if not np.isnan(loc_exp) and not np.isnan(scale_exp) else "-",
            f"shape={shape_gama:.1f}, loc={loc_gama:.1f}, scale={scale_gama:.1f}" if not np.isnan(shape_gama) and not np.isnan(loc_gama) and not np.isnan(scale_gama) else "-",
            f"shape={shape_ln:.1f}, loc={loc_ln:.1f}, scale={scale_ln:.1f}" if not np.isnan(shape_ln) and not np.isnan(loc_ln) and not np.isnan(scale_ln) else "-",
        ]
}

# Cria o DataFrame
result = pd.DataFrame(data)

# Determine o melhor ajuste com base no nível de significância
result["Melhor Ajuste"] = "Não siguinificativo"  # Começa com "Inadequado" e é atualizado se um ajuste for adequado

result.loc[result["P-valor"] > alpha, "Melhor Ajuste"] = result.loc[result["P-valor"] > alpha, "Distribuição"]

# Exiba o DataFrame result
result = result.sort_values(by='Dsup').reset_index()
result = result[['Melhor Ajuste', 'P-valor', 'Dsup', 'Dcrítico','Coeficientes']]

for i in chuva_anual:
  i - 1000

result

Unnamed: 0,Melhor Ajuste,P-valor,Dsup,Dcrítico,Coeficientes
0,Log-Normal,0.998938,0.051253,0.192208,"shape=0.0, loc=-9185.7, scale=10927.8"
1,Gama,0.998917,0.051318,0.192208,"shape=459.9, loc=-5822.6, scale=16.5"
2,Normal,0.995547,0.056672,0.192208,"mu=1747.8, std=353.0"
3,Não siguinificativo,0.001564,0.267909,0.192208,"loc=1003.1, scale=744.7"


##Determiando precipitação provável



In [9]:
nivel_probabilidade = [0.9, 0.8, 0.75, 0.5, 0.25, 0.20, 0.10]
precipitacao_provavel = []

for probabilidade in nivel_probabilidade:
  shape_ln, loc_ln, scale_ln = stats.lognorm.fit(chuva_anual) #usando log normal
  x = np.linspace(0, max(chuva_anual), 1000)
  precipitacao_provavel_anual = max(0, stats.lognorm.ppf(probabilidade, shape_ln, loc_ln, scale_ln))
  precipitacao_provavel.append(precipitacao_provavel_anual)
  # valor de precipitação que é provável de ser igualado ou superado com a probabilidade especificada

# Cria um DataFrame com os resultados
colunas = ["10%", "20%", "25%", "50%", "75%", "80%","90%"]
precipitacao_provavel
df_resultados = pd.DataFrame({
    "Probabilidade": colunas,
    "Chuva provável (mm)": precipitacao_provavel
})
df_resultados

Unnamed: 0,Probabilidade,Chuva provável (mm)
0,10%,2203.662736
1,20%,2043.055098
2,25%,1982.634928
3,50%,1742.083834
4,75%,1506.713881
5,80%,1449.179673
6,90%,1299.211393
