# Aplicação de Python na Agrometeorologia

Este Jupyter Notebook é parte integrande do curso de Python ministrado durante XXII Congresso Brasiliero de Agrometeorologia realizado nos dias 3, 4 e 5 de outubro de 2023 na cidade Natal/RN.

# Importação de bibliotecas

In [None]:
import pandas as pd

# Abertura do arquivo csv

Tratamento da coluna 'Dia' do DataFrame como DateTime e depois converte em index.

In [None]:
# Documentação:
# https://pandas.pydata.org/docs/reference/api/pandas.read_csv.html

df = pd.read_csv(
    '../output/chuva_diaria_cpc_19910901_20221231.csv',
    index_col='Dia', 
    parse_dates=True  
)

In [None]:
#Outra possibilidade de tratar a coluna 'Dia' como DateTime e depois converter em index:
# df['Dia'] = pd.to_datetime(df['Dia'])
# df.set_index('Dia', inplace=True)

Inspeção do DataFrame.

In [None]:
df

Plot básico do DataFrame.

In [None]:
df['Chuva'].plot() # Outra possibilidade: df.Chuva.plot()

# Algumas transformações no DataFrame

## Compartimentalização (binning) - Histograma

Como saber qual é o máximo valor de bins a serem utilizados? Basta usar o **describe()**.

In [None]:
df.describe()

In [None]:
# Documentação:
# https://pandas.pydata.org/docs/reference/api/pandas.cut.html

# Intervalos de interesse em mm/dia.
bins1 = [0, 2.5, 7.6, 15, 30, 50, 75, 100]

# Cria o histograma.
chuva1 = pd.cut(
    df['Chuva'], 
    bins1
)

In [None]:
chuva1

Contagem das categorias

In [None]:
pd.value_counts(chuva1)

Plot do histograma com suas classes.

In [None]:
pd.value_counts(chuva1).plot.bar(figsize=(15,5))

Cria a coluna **bin** e adiciona os intervalos do histograma no DataFrame.

In [None]:
# Cria a coluna 'bin' no DataFrame 'df1' que receberá os valores de 'chuva1'.
df['bin'] = chuva1

df

Adicionando rótulos (nomes) nas classes do histograma.

In [None]:
# Bins.
bins2 = [0, 2.5, 7.6, 15, 30, 50, 75, 100]

# Observação: A quantidade de rótulos (classificacao) tem que ser uma unidade menor que a 
# quantidade de classes (bins2).
# Exemplo: são utilizados 8 bins, logo a quantidade de rótulos deverá ser de 8-1=7 rótulos.

# Rótulos.
classificacao = [
    'Muito Fraca', 
    'Fraca', 
    'Moderada', 
    'Moderadamente Forte', 
    'Forte', 
    'Muito Forte', 
    'Extremamente Forte'
]

# Cria o histograma.
chuva2 = pd.cut(
    df['Chuva'], 
    bins2, 
    labels=classificacao
)

chuva2

Contabiliza a quantidade de valores para cada rótulo (classificacao).

In [None]:
pd.value_counts(chuva2)

Plot básico do histograma com rótulos.

In [None]:
pd.value_counts(chuva2).plot.bar(figsize=(15,5))

In [None]:
# Cria a coluna 'Classificacao' no DataFrame 'df1' que recebe o valor da variável chuva2.
df['Classificacao'] = chuva2

In [None]:
df

In [None]:
# Remove a coluna 'bin' do DataFrame.
df.drop(columns=['bin', 'Classificacao'], inplace=True)

In [None]:
df