## Preenchendo Dados com o Método de Interpolação Linear (Linear Interpolation)
Os datasets utilizados foram os de vazão da data 10/06/2023 da rotas pa-ba e pr-am. 

In [13]:
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt

### Preenchendo os dados faltantes

In [14]:
def preencher_interp(df):
    #Evitando alterações no database original
    df_copy = df.copy()

    # Conversão de datas para usar o método de interpolação
    df_copy['Data'] = pd.to_datetime(df_copy['Data'], dayfirst=True)

    df_copy.set_index('Data', inplace=True)

    # Criar uma coluna 'Sintético' preenchido com 1 para quando for sintético e 0 pra quuando não for
    #df['Sintético'] = np.where(df['Vazao'] == -1, '1', '0')
    
    df_copy['Vazao'] = df_copy['Vazao'].replace(-1, np.nan).interpolate(method="nearest", limit_direction='backward', order=1, replace=True)

    
    return df_copy

### Gerando datasets com dados preenchidos

In [15]:
def gerar_dataset_preenchido(df, caminho):
    df_preenchido = preencher_interp(df)
    df_preenchido.to_csv(caminho, index=False)

    print("Dataset preenchido salvo com sucesso em: ", caminho)

### PLot gráfico simples

In [16]:
def plot_vazao(df):
    valid_vazao = df[df['Vazao'] != -1]['Vazao']
    plt.scatter(valid_vazao.index, valid_vazao, color='blue', label='Vazao')

def plot_vazao_sintetica(df):
    df['Vazao_Sintetica'] = np.where(df['Sintético'] == '1', df['Vazao'], np.nan)
    valid_vazao_sintetica = df[df['Vazao_Sintetica'].notnull()]['Vazao_Sintetica']
    plt.scatter(valid_vazao_sintetica.index, valid_vazao_sintetica, color='magenta', label='Vazao_Sintetica')

def plot_grafico(df):
    plt.figure(figsize=(22, 9))
    plot_vazao(df)
    plot_vazao_sintetica(df)
    plt.xlabel('Data')
    plt.ylabel('Vazão')
    plt.title('Gráfico de Pontos: Vazão vs. Tempo')
    plt.legend()
    plt.show()

### Recebendo e copiando os datasets

In [17]:
vazao_pa_ba = pd.read_csv('../../../datasets/vazao/10-06-2023/tratado/bbr/tratado bbr esmond data pa-ba 06-10-2023.csv')
vazao_pr_am = pd.read_csv('../../../datasets/vazao/10-06-2023/tratado/bbr/tratado bbr esmond data pr-am 06-10-2023.csv')

cubic_vazao_pa_ba = pd.read_csv('../../../datasets/vazao/10-06-2023/tratado/cubic/tratado cubic esmond data pa-ba 06-10-2023.csv')
cubic_vazao_pr_am = pd.read_csv('../../../datasets/vazao/10-06-2023/tratado/cubic/tratado cubic esmond data pr-am 06-10-2023.csv')
#vazao_pa_ba.to_csv("../../../datasets/vazao/10-06-2023/preenchido/bbr/interpolacao/linear/preenchido bbr esmond data pa-ba 06-10-2023.csv", index=False)
#vazao_pr_am.to_csv("../../../datasets/vazao/10-06-2023/preenchido/bbr/interpolacao/linear/preenchido bbr esmond data pr-am 06-10-2023.csv", index=False)

### Testando o preenchimento

In [18]:
# vazao_pa_ba_preenchida = preencher_interp_linear(vazao_pa_ba)
#plot_scatter_vazao_tempo(vazao_pa_ba_preenchida, 'Vazao Pa-Ba Preenchida')
#plot_grafico(vazao_pa_ba_preenchida)

# gerar_dataset_preenchido(vazao_pa_ba, "../../../datasets/vazao/10-06-2023/preenchido/bbr/interpolacao/vizinho-mais-proximo/preenchido bbr esmond data pa-ba 06-10-2023.csv")
# gerar_dataset_preenchido(vazao_pr_am, "../../../datasets/vazao/10-06-2023/preenchido/bbr/interpolacao/vizinho-mais-proximo/preenchido bbr esmond data pr-am 06-10-2023.csv")

# gerar_dataset_preenchido(cubic_vazao_pa_ba, "../../../datasets/vazao/10-06-2023/preenchido/cubic/interpolacao/vizinho-mais-proximo/preenchido cubic esmond data pa-ba 06-10-2023.csv")
#gerar_dataset_preenchido(cubic_vazao_pr_am, "../../../datasets/vazao/10-06-2023/preenchido/cubic/interpolacao/vizinho-mais-proximo/preenchido cubic esmond data pr-am 06-10-2023.csv")

preencher_interp(vazao_pa_ba)

Unnamed: 0_level_0,Intervalo,Vazao
Data,Unnamed: 1_level_1,Unnamed: 2_level_1
2022-12-12,00:00:00 a 06:00:00,928568937.0
2022-12-12,06:00:00 a 12:00:00,928568937.0
2022-12-12,12:00:00 a 18:00:00,928568937.0
2022-12-12,18:00:00 a 23:59:59,928568937.0
2022-12-13,00:00:00 a 06:00:00,862089089.0
...,...,...
2023-06-09,18:00:00 a 23:59:59,892211527.0
2023-06-10,00:00:00 a 06:00:00,902694338.0
2023-06-10,06:00:00 a 12:00:00,902694338.0
2023-06-10,12:00:00 a 18:00:00,
