# Predição: Análise local de extremos
## Universidade Federal de Alagoas - UFAL
## Centro de Tecnologia - CTEC
## Programa de Pós-Graduação Recursos Hídricos e Saneamento - PPGRHS
Disciplina de Estatística
Clebson Farias

Predição: Obtenção de valores da variável hidrológica associados a certas probabilidades de excedência;

Local: Única série de registros;

Podem ser realizada a partir das séries de anual ou de duração parcial;

Séries Anuais: Um único valor para cada ano de observações(Hidrológico, Civil, );

As séries de duração parcial consistem das observações independentes de magnitude superior (ou inferior) a certo valor limiar de referência.

![](event_pac.png)


As séries constituídas devem ser representativas, não apresentando erros de observação e falhas, possuir um número suficiente de elementos.

Os dados sejam homogêneos e independentes;

Homogeneidade: Extraídas de uma única população; 

Independência: Não exista dependência serial entre os elementos;

A **análise de freqüência** pode ser:

- **Modo analítico**:  função paramétrica descreva o comportamento probabilístico da variável hidrológica;

- **Modo empírico**:  o analista grafa as observações ordenadas contra uma escala de probabilidades e utiliza seu melhor julgamento para determinar a associação entre as magnitudes de ocorrências passadas;

De modo resumido, as etapas para análise de freqüência local são as seguintes:

- Optar pela utilização de séries anuais ou séries de duração parcial.
- Avaliar os dados das séries, quanto aos atributos de homogeneidade, independência e representatividade.

- Propor uma ou algumas distribuições teóricas de probabilidade, com a estimativa de seus respectivos parâmetros, quantis e intervalos de confiança, seguida da verificação de aderência à distribuição empírica.

- Realizar a identificação e tratamento de eventuais pontos atípicos, com possível repetição de algumas etapas precedentes.

- Selecionar o modelo distributivo mais apropriado


In [1]:
import pandas as pd
import numpy as np
import plotly as py

from files.ons import Ons
from files.ana import Ana
from series.flow import Flow
from series.chuva import Chuva

In [2]:
file = "dados_com_evap_manso.csv"
dados = pd.read_csv(file, index_col=0, parse_dates=True)
#Convetendo obj pandas para Series Flow
dados = Flow(pd.DataFrame(dados["MANSO"]))
fig, data = dados.plot_hydrogram()
py.offline.plot(fig, filename='gráficos/histo.html')

'gráficos/histo.html'

![](hidrograma_manso.png)

# Máximas Anuais

In [3]:
peaks_max = dados.maximum(station="MANSO")
peaks_max.peaks.head()

Unnamed: 0,peaks
1982-02-03,1126.0
1983-01-19,1193.0
1983-12-02,1118.0
1985-01-08,1157.0
1986-02-21,1088.0


In [4]:
fig, data = peaks_max.plot_hydrogram()
py.offline.plot(fig, filename='gráficos/histo_max.html')

'gráficos/histo_max.html'

![](maximas_anuais.png)

## Máxima Verossimilhança

In [5]:
peaks_max.mvs()
peaks_max.fit

(-5.721987476983145, 149.63189576303387, 2.1852412410130952)

In [6]:
estimador = 'mvs'
title = 'Manso Nat'
type_function = 'cumulative'
fig, data = peaks_max.plot_distribution(title, estimador, type_function)
py.offline.plot(fig, filename='gráficos/distrib_anual_mvs.html')

'gráficos/distrib_anual_mvs.html'

![](cdf_manso_mvs.png)

In [8]:
estimador = 'mvs'
title = 'Manso Nat'
type_function = 'density'
fig, data = peaks_max.plot_distribution(title, estimador, type_function)
py.offline.plot(fig, filename='gráficos/distrib_D_anual_mvs.html')

'gráficos/distrib_D_anual_mvs.html'

![](pdf_manso_mvs.png)

In [9]:
period_return = 5
mag = peaks_max.magnitude(period_return, estimador)
mag

150.013760014353

In [10]:
period_return = 10
mag = peaks_max.magnitude(period_return, estimador)
mag

150.01379752442776

# Momentos L

In [11]:
peaks_max.mml()
peaks_max.fit

[0.20638553042392516, 1003.1174140035938, 333.9667588766301]

In [12]:
estimador = 'mml'
title = 'Manso Nat'
type_function = 'cumulative'
fig, data = peaks_max.plot_distribution(title, estimador, type_function)
py.offline.plot(fig, filename='gráficos/distrib_anual_mml.html')

'gráficos/distrib_anual_mml.html'

![](cdf_manso_mml.png)

In [15]:
estimador = 'mml'
title = 'Manso Nat'
type_function = 'density'
fig, data = peaks_max.plot_distribution(title, estimador, type_function)
py.offline.plot(fig, filename='gráficos/distrib_d_anual_mml.html')

'gráficos/distrib_d_anual_mml.html'

![](pdf_manso_mml.png)

In [16]:
period_return = 15
mag = peaks_max.magnitude(period_return, estimador)
mag

2214.7249828256026

In [17]:
period_return = 5
mag = peaks_max.magnitude(period_return, estimador)
mag

1640.64771862514

In [18]:
period_return = 2
mag = peaks_max.magnitude(period_return, estimador)
mag

1251.9819896874033

# Séries de Durações Parciais

In [19]:
station = "MANSO"
#'stationary' or 'events_by_year'
type_threshold = 'stationary' 
#'flood' or 'drought'
type_event = 'flood'
#'media', 'mediana' or 'autocorrelation' 
type_criterion = 'median'
#Peaks or percentil
value_threshold = 0.75

peaks_sdp = dados.parcial(station, type_threshold, type_event, type_criterion, value_threshold)
peaks_sdp.peaks.head()

Unnamed: 0,Duration,Start,End,peaks
1982-02-03,114,1982-01-01,1982-04-25,1126.0
1983-01-19,120,1982-12-15,1983-04-14,1193.0
1983-12-02,195,1983-11-02,1984-05-15,1118.0
1984-11-23,4,1984-11-21,1984-11-25,418.0
1985-01-08,130,1984-11-29,1985-04-08,1157.0


In [20]:
fig, data = peaks_sdp.plot_hydrogram(title='SDP-Manso')
py.offline.plot(fig, filename='gráficos/histo_sdp.html')

'gráficos/histo_sdp.html'

![](sdp_hidro.png)

![](sdp_hidro_zoom.png)

## Máxima Verossimilhança

In [22]:
peaks_sdp.mvs()
peaks_sdp.fit


divide by zero encountered in true_divide


invalid value encountered in subtract


invalid value encountered in double_scalars



(-0.2160562934977424, 217.99585474281037, 638.0504071922765)

In [23]:
title = 'Manso Nat'
type_function = 'cumulative'
fig, data = peaks_sdp.plot_distribution(title, type_function)
py.offline.plot(fig, filename='gráficos/distrib_sdp_mvs.html')

'gráficos/distrib_sdp_mvs.html'

![](cdf_sdp_manso_mvs.png)

In [24]:
period_return = 5
mag = peaks_sdp.magnitude(period_return)
mag

1085.3703015123128

In [25]:
period_return = 10
mag = peaks_sdp.magnitude(period_return)
mag

1375.4715763026747

In [26]:
period_return = 15
mag = peaks_sdp.magnitude(period_return)
mag

1526.086579216705