## Preenchendo Dados com o Método de Interpolação Ponderada no Tempo
Os datasets utilizados foram os de vazão da data 10/06/2023 da rotas pa-ba e pr-am. 

In [2]:
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt

### Preenchendo os dados faltantes

In [47]:
def preencher_interp_linear(df):
    # Evitando alterações no database original
    df_copy = df['Vazao']
    
    # # Conversão de datas para usar o método de interpolação
    # df_copy['Data'] = pd.to_datetime(df_copy['Data'], dayfirst=True)
    # df_copy.set_index('Data', inplace=True)
    
    # # Preenchendo os valores -1 com NaN e realizando a interpolação linear por tempo
    df_copy= df_copy.replace(-1, np.nan)
    df_copy = df_copy.interpolate(method='polynomial', limit_direction='backward', axis=0, order=2)

    return df_copy

df = pd.read_csv('../../../datasets/vazao/10-06-2023/tratado/bbr/tratado bbr esmond data pa-ba 06-10-2023.csv')
df = preencher_interp_linear(df)
final_df = pd.read_csv('../../../datasets/vazao/10-06-2023/tratado/bbr/tratado bbr esmond data pa-ba 06-10-2023.csv')
final_df['Vazao'] = df
final_df

ValueError: time-weighted interpolation only works on Series or DataFrames with a DatetimeIndex

In [7]:
def preencher_interp_linear(df):
    # Evitando alterações no database original
    df_copy = df.copy()

    # # Conversão de datas para usar o método de interpolação
    df_copy['Data'] = pd.to_datetime(df_copy['Data'], dayfirst=True)
    df_copy.set_index('Data', inplace=True)
    
    # # Preenchendo os valores -1 com NaN e realizando a interpolação linear por tempo
    df_copy= df_copy.replace(-1, np.nan)
    df_copy = df_copy.interpolate(method='time', limit_direction='backward', axis=0, order=2)

    return df_copy



bbr_vazao_pa_ba = '../../../datasets/vazao/10-06-2023/tratado/bbr/tratado bbr esmond data pa-ba 06-10-2023.csv'
bbr_vazao_pr_am = '../../../datasets/vazao/10-06-2023/tratado/bbr/tratado bbr esmond data pr-am 06-10-2023.csv'
cubic_vazao_pa_ba = '../../../datasets/vazao/10-06-2023/tratado/cubic/tratado cubic esmond data pa-ba 06-10-2023.csv'
cubic_vazao_pr_am = '../../../datasets/vazao/10-06-2023/tratado/cubic/tratado cubic esmond data pr-am 06-10-2023.csv'

bbr_vazao_pa_ba_preenchido = "../../../datasets/dados-vazao-imputados/interpolacao-poderada-no-tempo/preenchido bbr esmond data pa-ba 06-10-2023.csv"
bbr_vazao_pr_am_preenchido = "../../../datasets/dados-vazao-imputados/interpolacao-poderada-no-tempo/preenchido bbr esmond data pr-am 06-10-2023.csv"
cubic_vazao_pa_ba_preenchido = "../../../datasets/dados-vazao-imputados/interpolacao-poderada-no-tempo/preenchido cubic esmond data pa-ba 06-10-2023.csv"
cubic_vazao_pr_am_preenchido = "../../../datasets/dados-vazao-imputados/interpolacao-poderada-no-tempo/preenchido cubic esmond data pr-am 06-10-2023.csv"

df = pd.read_csv(cubic_vazao_pr_am)
df = preencher_interp_linear(df)

df.to_csv(cubic_vazao_pr_am_preenchido)

Unnamed: 0,Data,Intervalo,Vazao
0,2022-12-12,00:00:00 a 06:00:00,-1.0
1,2022-12-12,06:00:00 a 12:00:00,-1.0
2,2022-12-12,12:00:00 a 18:00:00,-1.0
3,2022-12-12,18:00:00 a 23:59:59,928568937.0
4,2022-12-13,00:00:00 a 06:00:00,862089089.0
...,...,...,...
703,2023-06-09,18:00:00 a 23:59:59,892211527.0
704,2023-06-10,00:00:00 a 06:00:00,-1.0
705,2023-06-10,06:00:00 a 12:00:00,902694338.0
706,2023-06-10,12:00:00 a 18:00:00,-1.0


### Gerando datasets com dados preenchidos

In [3]:
def gerar_dataset_preenchido(df, caminho):
    df_preenchido = preencher_interp_linear(df)
    df_preenchido.to_csv(caminho, index=False)

    print("Dataset preenchido salvo com sucesso em: ", caminho)

### PLot gráfico simples

In [4]:
def plot_vazao(df):
    valid_vazao = df[df['Vazao'] != -1]['Vazao']
    plt.scatter(valid_vazao.index, valid_vazao, color='blue', label='Vazao')

def plot_vazao_sintetica(df):
    df['Vazao_Sintetica'] = np.where(df['Sintético'] == '1', df['Vazao'], np.nan)
    valid_vazao_sintetica = df[df['Vazao_Sintetica'].notnull()]['Vazao_Sintetica']
    plt.scatter(valid_vazao_sintetica.index, valid_vazao_sintetica, color='magenta', label='Vazao_Sintetica')

def plot_grafico(df):
    plt.figure(figsize=(22, 9))
    plot_vazao(df)
    plot_vazao_sintetica(df)
    plt.xlabel('Data')
    plt.ylabel('Vazão')
    plt.title('Gráfico de Pontos: Vazão vs. Tempo')
    plt.legend()
    plt.show()

### Recebendo e copiando os datasets

In [5]:
vazao_pa_ba = pd.read_csv('../../../datasets/vazao/10-06-2023/tratado/bbr/tratado bbr esmond data pa-ba 06-10-2023.csv')
vazao_pr_am = pd.read_csv('../../../datasets/vazao/10-06-2023/tratado/bbr/tratado bbr esmond data pr-am 06-10-2023.csv')

cubic_vazao_pa_ba = pd.read_csv('../../../datasets/vazao/10-06-2023/tratado/cubic/tratado cubic esmond data pa-ba 06-10-2023.csv')
cubic_vazao_pr_am = pd.read_csv('../../../datasets/vazao/10-06-2023/tratado/cubic/tratado cubic esmond data pr-am 06-10-2023.csv')
#vazao_pa_ba.to_csv("../../../datasets/vazao/10-06-2023/preenchido/bbr/interpolacao/linear/preenchido bbr esmond data pa-ba 06-10-2023.csv", index=False)
#vazao_pr_am.to_csv("../../../datasets/vazao/10-06-2023/preenchido/bbr/interpolacao/linear/preenchido bbr esmond data pr-am 06-10-2023.csv", index=False)

### Testando o preenchimento

In [6]:
vazao_pa_ba_preenchida = preencher_interp_linear(vazao_pa_ba)
#plot_scatter_vazao_tempo(vazao_pa_ba_preenchida, 'Vazao Pa-Ba Preenchida')
#plot_grafico(vazao_pa_ba_preenchida)

gerar_dataset_preenchido(vazao_pa_ba, "../../../datasets/vazao/10-06-2023/preenchido/bbr/interpolacao/ponderada-no-tempo/preenchido bbr esmond data pa-ba 06-10-2023.csv")
gerar_dataset_preenchido(vazao_pr_am, "../../../datasets/vazao/10-06-2023/preenchido/bbr/interpolacao/ponderada-no-tempo/preenchido bbr esmond data pr-am 06-10-2023.csv")

gerar_dataset_preenchido(cubic_vazao_pa_ba, "../../../datasets/vazao/10-06-2023/preenchido/cubic/interpolacao/ponderada-no-tempo/preenchido cubic esmond data pa-ba 06-10-2023.csv")
gerar_dataset_preenchido(cubic_vazao_pr_am, "../../../datasets/vazao/10-06-2023/preenchido/cubic/interpolacao/ponderada-no-tempo/preenchido cubic esmond data pr-am 06-10-2023.csv")

Dataset preenchido salvo com sucesso em:  ../../../datasets/vazao/10-06-2023/preenchido/bbr/interpolacao/ponderada-no-tempo/preenchido bbr esmond data pa-ba 06-10-2023.csv
Dataset preenchido salvo com sucesso em:  ../../../datasets/vazao/10-06-2023/preenchido/bbr/interpolacao/ponderada-no-tempo/preenchido bbr esmond data pr-am 06-10-2023.csv
Dataset preenchido salvo com sucesso em:  ../../../datasets/vazao/10-06-2023/preenchido/cubic/interpolacao/ponderada-no-tempo/preenchido cubic esmond data pa-ba 06-10-2023.csv
Dataset preenchido salvo com sucesso em:  ../../../datasets/vazao/10-06-2023/preenchido/cubic/interpolacao/ponderada-no-tempo/preenchido cubic esmond data pr-am 06-10-2023.csv
