# Aplicação de Python na Agrometeorologia

Este Jupyter Notebook é parte integrande do curso de Python ministrado durante XXII Congresso Brasiliero de Agrometeorologia realizado nos dias 3, 4 e 5 de outubro de 2023 na cidade Natal/RN.

## Importação de biblioteca

In [None]:
import pandas as pd

## Leitura do arquivo

In [None]:
# Leitura do arquivo.
df = pd.read_csv('../input/csv/BRASILIA_A001.csv', sep=';')

# Define a coluna 'Data' do arquivo como datetime.
df['Data'] = pd.to_datetime(df['Data'], format='%d/%m/%Y')

# Define a coluna 'Data' como index.
df.set_index('Data', inplace=True)

In [None]:
# Visualização do DataFrame.
df

## Verificação de dados ausentes

In [None]:
# NA = Not Available (indisponível).

df.isnull()

In [None]:
df.isnull().astype(int)

In [None]:
# Contabiliza a quantidade de valores ausentes.

df.isnull().sum()

In [None]:
numero_linhas, _ = df.shape

numero_linhas

In [None]:
# Valor percentual de NAN para a coluna temperatura.

total_NAN = df['Temperatura'].isnull().sum()

porcentagem_temp = (total_NAN / numero_linhas) * 100

print(f'Porcentagem de valores NAN: {porcentagem_temp}%')

## Método dropna

O método dropna descarta **qualquer linha** contendo um valore ausente. **Por padrão, remove linhas**.

Lembrando que:
* eixo 0 (index) representam as linhas. **Elimina as linhas** que possuem valores ausentes.
* eixo 1 (columns) representam as colunas. **Elimina as colunas** que possuem valores ausentes.
* Apenas um único eixo é permitido.

* Documentação: https://pandas.pydata.org/docs/reference/api/pandas.DataFrame.dropna.html

In [None]:
df

In [None]:
df.dropna()

## Método fillna

O método fillna **preenche os valores ausentes** com algum valor ou utilizando um **método de interpolação**.

* Método de interpolação: **'ffill'** ou **'bfill'**.
* Documentação: https://pandas.pydata.org/docs/reference/api/pandas.DataFrame.fillna.html

In [None]:
df

### Preenche os valores NaN com um valor específico

* Preencher os valores NaN com -999.

In [None]:
df.fillna(-999)

### Preenchimento de valores NaN avançado

In [None]:
df.fillna(method='ffill')

### Preenchimento de valores NaN atrasado

In [None]:
df.fillna(method='bfill')

In [None]:
df

### Limitar a quantidade de valores NaN a serem preenchidos

O parâmetro **limit** é o número máximo de valores NaN consecutivos para preenchimento para frente ('ffill') ou para trás ('bfill').

In [None]:
df.fillna(method='ffill', limit=2)

In [None]:
df

### Preencher valores NaN com algum cálculo

* É possível preencher os valores NaN, por exemplo, com a média ou mediana de cada coluna.
* O cálculo dependerá do usuário.

**Preencher com a média**

In [None]:
df.fillna(df.mean())

**Preencher com a mediana**

In [None]:
df.fillna(df.median())