## Dataset

In [1]:
import tensorflow as tf
import pandas as pd
from sklearn.preprocessing import StandardScaler
import numpy as np
import math
import os

2025-07-18 11:56:23.773966: I external/local_xla/xla/tsl/cuda/cudart_stub.cc:32] Could not find cuda drivers on your machine, GPU will not be used.
2025-07-18 11:56:23.777318: I external/local_xla/xla/tsl/cuda/cudart_stub.cc:32] Could not find cuda drivers on your machine, GPU will not be used.
2025-07-18 11:56:23.786777: E external/local_xla/xla/stream_executor/cuda/cuda_fft.cc:467] Unable to register cuFFT factory: Attempting to register factory for plugin cuFFT when one has already been registered
E0000 00:00:1752850583.801558   22086 cuda_dnn.cc:8579] Unable to register cuDNN factory: Attempting to register factory for plugin cuDNN when one has already been registered
E0000 00:00:1752850583.805647   22086 cuda_blas.cc:1407] Unable to register cuBLAS factory: Attempting to register factory for plugin cuBLAS when one has already been registered
W0000 00:00:1752850583.816581   22086 computation_placer.cc:177] computation placer already registered. Please check linkage and avoid linkin

In [2]:
# Função para carregar e preprocessar os dados
def load_and_preprocess_data(csv_file, time_steps, scaler):
    # Carregar o dataset com cabeçalho
    data = pd.read_csv(csv_file)
    
    # Converter a coluna de timestamp para o formato datetime
    data['timestamp'] = pd.to_datetime(data['timestamp'], format='%Y-%m-%d %H:%M:%S')
    data.set_index('timestamp', inplace=True)

    # A variável de entrada (X) será a coluna 'activity'
    X = data[['activity']].values  # Usando 'activity' como feature
    # A variável alvo (y) será a coluna 'activity'
    y = data['activity'].values  # 'activity' como alvo
    
    # Normalizar as variáveis de entrada
    X = scaler.fit_transform(X)
    y = scaler.transform(y.reshape(-1, 1))
    # Criar sequências para o modelo LSTM
    X_seq, y_seq = create_sequences(X, y, time_steps)
    return X_seq, y_seq

In [3]:
def load_and_preprocess_data_test(csv_file, time_steps, scaler):
    # Carregar o dataset com cabeçalho
    
    data = pd.read_csv(csv_file)
    concat_file = csv_file[:-8] + '_nov.csv'

    concat_data = pd.read_csv(concat_file)
    
    data = pd.concat([concat_data.tail(time_steps), data])
    # Converter a coluna de timestamp para o formato datetime
    data['timestamp'] = pd.to_datetime(data['timestamp'], format='%Y-%m-%d %H:%M:%S')
    data.set_index('timestamp', inplace=True)
    # A variável de entrada (X) será a coluna 'activity'
    X = data[['activity']].values  # Usando 'activity' como feature
    # A variável alvo (y) será a coluna 'activity'
    y = data['activity'].values  # 'activity' como alvo
    
    # Normalizar as variáveis de entrada
    X = scaler.fit_transform(X)
    y = scaler.transform(y.reshape(-1, 1))
    # Criar sequências para o modelo LSTM
    X_seq, y_seq = create_sequences(X, y, time_steps)
    # print(data.head(31))
    # print(scaler.inverse_transform(y_seq[0].reshape(-1, 1)))
    return X_seq, y_seq

In [4]:
# Função para criar sequências temporais
def create_sequences(X, y, time_steps):
    sequences = []
    targets = []
    for i in range(len(X) - time_steps):
        # print(X[i:i + time_steps], y[i + time_steps])
        sequences.append(X[i:i + time_steps])  # Sequência de time_steps
        targets.append(y[i + time_steps])  # Alvo correspondente ao final da sequência
    return np.array(sequences), np.array(targets)

In [5]:
def calculate_metrics(y_true, y_pred):
    ae = (y_pred - y_true)
    mse = np.mean((y_true - y_pred) ** 2)
    mae = np.mean(np.abs(y_true - y_pred))
    rmse = np.sqrt(mse)

In [6]:
def gerar_dados_para_river(X_train, y_train):
    for i in range(len(X_train)):
        # Convertendo a amostra para um dicionário { 'feature_0': valor, 'feature_1': valor, ... }
        x_dict = {f'feature_{j}': X_train[i][j][0] for j in range(X_train.shape[1])}
        
        # Extraindo o valor escalar de y
        y_value = y_train[i][0]
        
        yield x_dict, y_value  # Gerador de pares (x, y)

## Modelos

In [7]:
from river import datasets
from river import evaluate
from river import forest
from river import metrics
from river import preprocessing

In [8]:
import tensorflow as tf
import pandas as pd
from sklearn.preprocessing import StandardScaler
import numpy as np
import math
from river import forest, metrics, tree, ensemble, linear_model, preprocessing, optim
from hyperopt import fmin, tpe, hp, Trials

In [9]:
from pympler import asizeof
import time

In [10]:
# Criar a pasta 'resultados' se não existir
os.makedirs("resultados", exist_ok=True)

### AMFRegressor

In [11]:
AMFRegressor = []

In [12]:
for i in range(0,5):
    train_csv = 'data/clstr_0_nov.csv'
    test_csv = f'data/clstr_{i}_dec.csv'    
    chunk_size = 20
    scaler = StandardScaler()
    test_scaler = StandardScaler()
    X_train, y_train = load_and_preprocess_data(train_csv, chunk_size, scaler)
    X_test, y_test = load_and_preprocess_data_test(test_csv, chunk_size, test_scaler)

    model = forest.AMFRegressor(seed=42)

    mse_metric = metrics.MSE()
    mae_metric = metrics.MAE()
    rmse_metric = metrics.RMSE()

    # Criando o gerador de dados
    dados_river = gerar_dados_para_river(X_train, y_train)
 
    for xi, yi in dados_river:            
                # Treinar o modelo com o dado atual
                model.learn_one(xi, yi)

    data = gerar_dados_para_river(X_test, y_test)

    # Listas para armazenar previsões e valores reais
    predictions = []
    target = []
    resultados = []

    tempo_inferencias = [] 
    tempo_aprendiazagem = []

    for xi, yi in data:
        t0 = time.perf_counter()
        y_pred = model.predict_one(xi)
        t1 = time.perf_counter()
        tempo_inferencias.append(t1 - t0)
        predictions.append(y_pred if y_pred is not None else np.nan)
        target.append(yi)
                    
        # Escrever a previsão no arquivo
        yi_unnorm = test_scaler.inverse_transform(yi.reshape(-1, 1)).item()
        y_pred_unnorm = test_scaler.inverse_transform(np.array(y_pred).reshape(-1, 1)).item()

        # Atualizar a métrica com a predição
        if y_pred is not None:
            mse_metric.update(yi_unnorm, y_pred_unnorm)
            mae_metric.update(yi_unnorm, y_pred_unnorm)
            rmse_metric.update(yi_unnorm, y_pred_unnorm)
            
        # Guardar os resultados na lista
        resultados.append({
            "Real": yi_unnorm,
            "Previsto": y_pred_unnorm,
            "Erro Absoluto": abs(y_pred_unnorm - yi_unnorm),
            "MAE Atual": mae_metric.get(),
            "MSE Atual": mse_metric.get(),
            "RMSE Atual": rmse_metric.get()
        })

        # Treinar o modelo com o dado atual
        ti = time.perf_counter()
        model.learn_one(xi, yi)
        tf = time.perf_counter()
        tempo_aprendiazagem.append(tf - ti) 

    # >>> Medir o uso de memória
    tamanho_memoria = asizeof.asizeof(model) / 1024  # em KB

    # Converter para DataFrame e exibir
    df_resultados = pd.DataFrame(resultados)

    # Salvar o DataFrame em um arquivo CSV
    df_resultados_csv = pd.DataFrame({
    "Real_Requests": df_resultados["Real"].round().astype(int),
    "Predicted_Requests": df_resultados["Previsto"].round().astype(int)
    })

    df_resultados_csv.to_csv(f'resultados/AMF_{i}.csv', index=False)

    AMFRegressor.append({
    "Cluster": i,
    "MAE": mae_metric.get(),
    "RMSE": rmse_metric.get(),
    "Tempo Médio de Inferência (ms)": round(np.mean(tempo_inferencias) * 1000, 4),  # >>> em milissegundos
    "Tempo Aprendizagem (ms)": round(np.mean(tempo_aprendiazagem) * 1000, 4),
    "Tamanho do Modelo (KB)": round(tamanho_memoria, 2)
})

### ARFRegressor

In [13]:
ARFRegressor = []

In [14]:
for i in range(0,5):
    train_csv = 'data/clstr_0_nov.csv'
    test_csv = f'data/clstr_{i}_dec.csv'  
    chunk_size = 20  # Tamanho dos lotes temporais
    scaler = StandardScaler()
    test_scaler = StandardScaler()
    X_train, y_train = load_and_preprocess_data(train_csv, chunk_size, scaler)
    X_test, y_test = load_and_preprocess_data_test(test_csv, chunk_size, test_scaler)

    model = (
                forest.ARFRegressor(seed=42)
            )

    mse_metric = metrics.MSE()
    mae_metric = metrics.MAE()
    rmse_metric = metrics.RMSE()

    # Criando o gerador de dados
    dados_river = gerar_dados_para_river(X_train, y_train)

 
    for xi, yi in dados_river:            
                # Treinar o modelo com o dado atual
                model.learn_one(xi, yi)
  

    data = gerar_dados_para_river(X_test, y_test)

    # Listas para armazenar previsões e valores reais
    predictions = []
    target = []
    resultados = []

    tempo_inferencias = []
    tempo_aprendiazagem = []

    for xi, yi in data:
        t0 = time.perf_counter()
        y_pred = model.predict_one(xi)
        t1 = time.perf_counter()
        tempo_inferencias.append(t1 - t0)
        predictions.append(y_pred if y_pred is not None else np.nan)
        target.append(yi)
                    
        # Escrever a previsão no arquivo
        yi_unnorm = test_scaler.inverse_transform(yi.reshape(-1, 1)).item()
        y_pred_unnorm = test_scaler.inverse_transform(np.array(y_pred).reshape(-1, 1)).item()

        # Atualizar a métrica com a predição
        if y_pred is not None:
            mse_metric.update(yi_unnorm, y_pred_unnorm)
            mae_metric.update(yi_unnorm, y_pred_unnorm)
            rmse_metric.update(yi_unnorm, y_pred_unnorm)
            
        # Guardar os resultados na lista
        resultados.append({
            "Real": yi_unnorm,
            "Previsto": y_pred_unnorm,
            "Erro Absoluto": abs(y_pred_unnorm - yi_unnorm),
            "MAE Atual": mae_metric.get(),
            "MSE Atual": mse_metric.get(),
            "RMSE Atual": rmse_metric.get()
        })

        # Treinar o modelo com o dado atual
        ti = time.perf_counter()
        model.learn_one(xi, yi)
        tf = time.perf_counter()
        tempo_aprendiazagem.append(tf - ti) 

    # >>> Medir o uso de memória
    tamanho_memoria = asizeof.asizeof(model) / 1024  # em KB

    # Converter para DataFrame e exibir
    df_resultados = pd.DataFrame(resultados)

    # Salvar o DataFrame em um arquivo CSV
    df_resultados_csv = pd.DataFrame({
    "Real_Requests": df_resultados["Real"].round().astype(int),
    "Predicted_Requests": df_resultados["Previsto"].round().astype(int)
    })

    df_resultados_csv.to_csv(f'resultados/ARF_{i}.csv', index=False)

    ARFRegressor.append({
    "Cluster": i,
    "MAE": mae_metric.get(),
    "RMSE": rmse_metric.get(),
    "Tempo Médio de Inferência (ms)": round(np.mean(tempo_inferencias) * 1000, 4),  # >>> em milissegundos
    "Tempo Aprendizagem (ms)": round(np.mean(tempo_aprendiazagem) * 1000, 4),
    "Tamanho do Modelo (KB)": round(tamanho_memoria, 2)
    })

### OXTRegressor

In [15]:
OXTRegressor = []

In [16]:
for i in range(0,5):
    train_csv = 'data/clstr_0_nov.csv'
    test_csv = f'data/clstr_{i}_dec.csv'    
    chunk_size = 20
    scaler = StandardScaler()
    test_scaler = StandardScaler()
    X_train, y_train = load_and_preprocess_data(train_csv, chunk_size, scaler)
    X_test, y_test = load_and_preprocess_data_test(test_csv, chunk_size, test_scaler)

    model = forest.OXTRegressor(seed=42)

    mse_metric = metrics.MSE()
    mae_metric = metrics.MAE()
    rmse_metric = metrics.RMSE()

    # Criando o gerador de dados
    dados_river = gerar_dados_para_river(X_train, y_train)

 
    for xi, yi in dados_river:            
                # Treinar o modelo com o dado atual
                model.learn_one(xi, yi)
  

    data = gerar_dados_para_river(X_test, y_test)

    # Listas para armazenar previsões e valores reais
    predictions = []
    target = []
    resultados = []

    tempo_inferencias = []
    tempo_aprendiazagem = []

    for xi, yi in data:
        t0 = time.perf_counter()
        y_pred = model.predict_one(xi)
        t1 = time.perf_counter()
        tempo_inferencias.append(t1 - t0)
        predictions.append(y_pred if y_pred is not None else np.nan)
        target.append(yi)
                    
        # Escrever a previsão no arquivo
        yi_unnorm = test_scaler.inverse_transform(yi.reshape(-1, 1)).item()
        y_pred_unnorm = test_scaler.inverse_transform(np.array(y_pred).reshape(-1, 1)).item()

        # Atualizar a métrica com a predição
        if y_pred is not None:
            mse_metric.update(yi_unnorm, y_pred_unnorm)
            mae_metric.update(yi_unnorm, y_pred_unnorm)
            rmse_metric.update(yi_unnorm, y_pred_unnorm)
            
        # Guardar os resultados na lista
        resultados.append({
            "Real": yi_unnorm,
            "Previsto": y_pred_unnorm,
            "Erro Absoluto": abs(y_pred_unnorm - yi_unnorm),
            "MAE Atual": mae_metric.get(),
            "MSE Atual": mse_metric.get(),
            "RMSE Atual": rmse_metric.get()
        })

        # Treinar o modelo com o dado atual
        ti = time.perf_counter()
        model.learn_one(xi, yi)
        tf = time.perf_counter()
        tempo_aprendiazagem.append(tf - ti) 

    tamanho_memoria = asizeof.asizeof(model) / 1024  # em KB    

    # Converter para DataFrame e exibir
    df_resultados = pd.DataFrame(resultados)

    # Salvar o DataFrame em um arquivo CSV
    df_resultados_csv = pd.DataFrame({
    "Real_Requests": df_resultados["Real"].round().astype(int),
    "Predicted_Requests": df_resultados["Previsto"].round().astype(int)
    })

    df_resultados_csv.to_csv(f'resultados/OTX_{i}.csv', index=False)

    OXTRegressor.append({
    "Cluster": i,
    "MAE": mae_metric.get(),
    "RMSE": rmse_metric.get(),
    "Tempo Médio de Inferência (ms)": round(np.mean(tempo_inferencias) * 1000, 4),  # >>> em milissegundos
    "Tempo Aprendizagem (ms)": round(np.mean(tempo_aprendiazagem) * 1000, 4),
    "Tamanho do Modelo (KB)": round(tamanho_memoria, 2)
    })

### BaggingRegressor

In [17]:
from river import datasets
from river import ensemble
from river import evaluate
from river import linear_model
from river import metrics
from river import optim
from river import preprocessing

In [18]:
BaggingRegressor = []

In [19]:
for i in range(0,5):
    train_csv = 'data/clstr_0_nov.csv'
    test_csv = f'data/clstr_{i}_dec.csv'  
    chunk_size = 20
    scaler = StandardScaler()
    test_scaler = StandardScaler()
    X_train, y_train = load_and_preprocess_data(train_csv, chunk_size, scaler)
    X_test, y_test = load_and_preprocess_data_test(test_csv, chunk_size, test_scaler)

    model = preprocessing.StandardScaler()
    model |= ensemble.BaggingRegressor(
        model=linear_model.LinearRegression(intercept_lr=0.1),
        seed=42
    )

    mse_metric = metrics.MSE()
    mae_metric = metrics.MAE()
    rmse_metric = metrics.RMSE()

    # Criando o gerador de dados
    dados_river = gerar_dados_para_river(X_train, y_train)

 
    for xi, yi in dados_river:            
                # Treinar o modelo com o dado atual
                model.learn_one(xi, yi)
  

    data = gerar_dados_para_river(X_test, y_test)

    # Listas para armazenar previsões e valores reais
    predictions = []
    target = []
    resultados = []

    tempo_inferencias = []
    tempo_aprendiazagem = []

    for xi, yi in data:
        t0 = time.perf_counter()
        y_pred = model.predict_one(xi)
        t1 = time.perf_counter()
        tempo_inferencias.append(t1 - t0)
        predictions.append(y_pred if y_pred is not None else np.nan)
        target.append(yi)
                    
        # Escrever a previsão no arquivo
        yi_unnorm = test_scaler.inverse_transform(yi.reshape(-1, 1)).item()
        y_pred_unnorm = test_scaler.inverse_transform(np.array(y_pred).reshape(-1, 1)).item()

        # Atualizar a métrica com a predição
        if y_pred is not None:
            mse_metric.update(yi_unnorm, y_pred_unnorm)
            mae_metric.update(yi_unnorm, y_pred_unnorm)
            rmse_metric.update(yi_unnorm, y_pred_unnorm)
            
        # Guardar os resultados na lista
        resultados.append({
            "Real": yi_unnorm,
            "Previsto": y_pred_unnorm,
            "Erro Absoluto": abs(y_pred_unnorm - yi_unnorm),
            "MAE Atual": mae_metric.get(),
            "MSE Atual": mse_metric.get(),
            "RMSE Atual": rmse_metric.get()
        })

        # Treinar o modelo com o dado atual
        ti = time.perf_counter()
        model.learn_one(xi, yi)
        tf = time.perf_counter()
        tempo_aprendiazagem.append(tf - ti) 

    # >>> Medir o uso de memória
    tamanho_memoria = asizeof.asizeof(model) / 1024  # em KB
    
    # Converter para DataFrame e exibir
    df_resultados = pd.DataFrame(resultados)

    # Salvar o DataFrame em um arquivo CSV
    df_resultados_csv = pd.DataFrame({
    "Real_Requests": df_resultados["Real"].round().astype(int),
    "Predicted_Requests": df_resultados["Previsto"].round().astype(int)
    })

    df_resultados_csv.to_csv(f'resultados/BaR_{i}.csv', index=False)

    BaggingRegressor.append({
    "Cluster": i,
    "MAE": mae_metric.get(),
    "RMSE": rmse_metric.get(),
    "Tempo Médio de Inferência (ms)": round(np.mean(tempo_inferencias) * 1000, 4),  # >>> em milissegundos
    "Tempo Aprendizagem (ms)": round(np.mean(tempo_aprendiazagem) * 1000, 4),
    "Tamanho do Modelo (KB)": round(tamanho_memoria, 2)
    })

### EWARegressor

In [20]:
from river import datasets
from river import ensemble
from river import evaluate
from river import linear_model
from river import metrics
from river import optim
from river import preprocessing
from river import stream

In [21]:
EWARegressor = []

In [22]:
for i in range(0,5):
    train_csv = 'data/clstr_0_nov.csv'
    test_csv = f'data/clstr_{i}_dec.csv' 
    chunk_size = 20
    scaler = StandardScaler()
    test_scaler = StandardScaler()
    X_train, y_train = load_and_preprocess_data(train_csv, chunk_size, scaler)
    X_test, y_test = load_and_preprocess_data_test(test_csv, chunk_size, test_scaler)

    model = (
    preprocessing.StandardScaler() |
    ensemble.EWARegressor(
        [
            linear_model.LinearRegression(optimizer=optim.SGD(0.01), intercept_lr=.1),
            linear_model.LinearRegression(optimizer=optim.RMSProp(), intercept_lr=.1),
            linear_model.LinearRegression(optimizer=optim.AdaGrad(), intercept_lr=.1),
        ]
    )
)

    mse_metric = metrics.MSE()
    mae_metric = metrics.MAE()
    rmse_metric = metrics.RMSE()

    # Criando o gerador de dados
    dados_river = gerar_dados_para_river(X_train, y_train)

 
    for xi, yi in dados_river:            
                # Treinar o modelo com o dado atual
                model.learn_one(xi, yi)
  

    data = gerar_dados_para_river(X_test, y_test)

    # Listas para armazenar previsões e valores reais
    predictions = []
    target = []
    resultados = []

    tempo_inferencias = []
    tempo_aprendiazagem = []

    for xi, yi in data:
        t0 = time.perf_counter()
        y_pred = model.predict_one(xi)
        t1 = time.perf_counter()
        tempo_inferencias.append(t1 - t0)
        predictions.append(y_pred if y_pred is not None else np.nan)
        target.append(yi)
                    
        # Escrever a previsão no arquivo
        yi_unnorm = test_scaler.inverse_transform(yi.reshape(-1, 1)).item()
        y_pred_unnorm = test_scaler.inverse_transform(np.array(y_pred).reshape(-1, 1)).item()

        # Atualizar a métrica com a predição
        if y_pred is not None:
            mse_metric.update(yi_unnorm, y_pred_unnorm)
            mae_metric.update(yi_unnorm, y_pred_unnorm)
            rmse_metric.update(yi_unnorm, y_pred_unnorm)
            
        # Guardar os resultados na lista
        resultados.append({
            "Real": yi_unnorm,
            "Previsto": y_pred_unnorm,
            "Erro Absoluto": abs(y_pred_unnorm - yi_unnorm),
            "MAE Atual": mae_metric.get(),
            "MSE Atual": mse_metric.get(),
            "RMSE Atual": rmse_metric.get()
        })

       # Treinar o modelo com o dado atual
        ti = time.perf_counter()
        model.learn_one(xi, yi)
        tf = time.perf_counter()
        tempo_aprendiazagem.append(tf - ti) 

    # >>> Medir o uso de memória
    tamanho_memoria = asizeof.asizeof(model) / 1024  # em KB

    # Converter para DataFrame e exibir
    df_resultados = pd.DataFrame(resultados)

    # Salvar o DataFrame em um arquivo CSV
    df_resultados_csv = pd.DataFrame({
    "Real_Requests": df_resultados["Real"].round().astype(int),
    "Predicted_Requests": df_resultados["Previsto"].round().astype(int)
    })

    df_resultados_csv.to_csv(f'resultados/EWA_{i}.csv', index=False)

    EWARegressor.append({
    "Cluster": i,
    "MAE": mae_metric.get(),
    "RMSE": rmse_metric.get(),
    "Tempo Médio de Inferência (ms)": round(np.mean(tempo_inferencias) * 1000, 4),  # >>> em milissegundos
    "Tempo Aprendizagem (ms)": round(np.mean(tempo_aprendiazagem) * 1000, 4),
    "Tamanho do Modelo (KB)": round(tamanho_memoria, 2)
    })

### SRPRegressor

In [23]:
from river import ensemble
from river import evaluate
from river import metrics
from river.datasets import synth
from river import tree

In [24]:
SRPRegressor = []

In [25]:
for i in range(0,5):
    train_csv = 'data/clstr_0_nov.csv'
    test_csv = f'data/clstr_{i}_dec.csv'  
    chunk_size = 20
    scaler = StandardScaler()
    test_scaler = StandardScaler()
    X_train, y_train = load_and_preprocess_data(train_csv, chunk_size, scaler)
    X_test, y_test = load_and_preprocess_data_test(test_csv, chunk_size, test_scaler)

    base_model = tree.HoeffdingTreeRegressor()
    model = ensemble.SRPRegressor(
        model=base_model,
        training_method="patches",
        seed=42
    )

    mse_metric = metrics.MSE()
    mae_metric = metrics.MAE()
    rmse_metric = metrics.RMSE()

    # Criando o gerador de dados
    dados_river = gerar_dados_para_river(X_train, y_train)

 
    for xi, yi in dados_river:            
                # Treinar o modelo com o dado atual
                model.learn_one(xi, yi)
  

    data = gerar_dados_para_river(X_test, y_test)

    # Listas para armazenar previsões e valores reais
    predictions = []
    target = []
    resultados = []

    tempo_inferencias = []
    tempo_aprendiazagem = []

    for xi, yi in data:
        t0 = time.perf_counter()
        y_pred = model.predict_one(xi)
        t1 = time.perf_counter()
        tempo_inferencias.append(t1 - t0)
        predictions.append(y_pred if y_pred is not None else np.nan)
        target.append(yi)
                    
        # Escrever a previsão no arquivo
        yi_unnorm = test_scaler.inverse_transform(yi.reshape(-1, 1)).item()
        y_pred_unnorm = test_scaler.inverse_transform(np.array(y_pred).reshape(-1, 1)).item()

        # Atualizar a métrica com a predição
        if y_pred is not None:
            mse_metric.update(yi_unnorm, y_pred_unnorm)
            mae_metric.update(yi_unnorm, y_pred_unnorm)
            rmse_metric.update(yi_unnorm, y_pred_unnorm)
            
        # Guardar os resultados na lista
        resultados.append({
            "Real": yi_unnorm,
            "Previsto": y_pred_unnorm,
            "Erro Absoluto": abs(y_pred_unnorm - yi_unnorm),
            "MAE Atual": mae_metric.get(),
            "MSE Atual": mse_metric.get(),
            "RMSE Atual": rmse_metric.get()
        })

        # Treinar o modelo com o dado atual
        ti = time.perf_counter()
        model.learn_one(xi, yi)
        tf = time.perf_counter()
        tempo_aprendiazagem.append(tf - ti) 

    # >>> Medir o uso de memória
    tamanho_memoria = asizeof.asizeof(model) / 1024  # em KB

    # Converter para DataFrame e exibir
    df_resultados = pd.DataFrame(resultados)

    # Salvar o DataFrame em um arquivo CSV
    df_resultados_csv = pd.DataFrame({
    "Real_Requests": df_resultados["Real"].round().astype(int),
    "Predicted_Requests": df_resultados["Previsto"].round().astype(int)
    })

    df_resultados_csv.to_csv(f'resultados/SRP_{i}.csv', index=False)

    SRPRegressor.append({
    "Cluster": i,
    "MAE": mae_metric.get(),
    "RMSE": rmse_metric.get(),
    "Tempo Médio de Inferência (ms)": round(np.mean(tempo_inferencias) * 1000, 4),  # >>> em milissegundos
    "Tempo Aprendizagem (ms)": round(np.mean(tempo_aprendiazagem) * 1000, 4),
    "Tamanho do Modelo (KB)": round(tamanho_memoria, 2)
    })

### HardSamplingRegressor

In [26]:
from river import evaluate
from river import imblearn
from river import linear_model
from river import metrics
from river import optim
from river import preprocessing

In [27]:
HardSamplingRegressor = []

In [28]:
for i in range(0,5):
    train_csv = 'data/clstr_0_nov.csv'
    test_csv = f'data/clstr_{i}_dec.csv'  
    chunk_size = 20
    scaler = StandardScaler()
    test_scaler = StandardScaler()
    X_train, y_train = load_and_preprocess_data(train_csv, chunk_size, scaler)
    X_test, y_test = load_and_preprocess_data_test(test_csv, chunk_size, test_scaler)

    model = (
    imblearn.HardSamplingRegressor(
        regressor=linear_model.LinearRegression(),
        p=.2,
        size=30,
        seed=42,
    )
)

    mse_metric = metrics.MSE()
    mae_metric = metrics.MAE()
    rmse_metric = metrics.RMSE()

    # Criando o gerador de dados
    dados_river = gerar_dados_para_river(X_train, y_train)

 
    for xi, yi in dados_river:            
                # Treinar o modelo com o dado atual
                model.learn_one(xi, yi)
  

    data = gerar_dados_para_river(X_test, y_test)

    # Listas para armazenar previsões e valores reais
    predictions = []
    target = []
    resultados = []

    tempo_inferencias = []
    tempo_aprendiazagem = []

    for xi, yi in data:
        t0 = time.perf_counter()
        y_pred = model.predict_one(xi)
        t1 = time.perf_counter()
        tempo_inferencias.append(t1 - t0)
        predictions.append(y_pred if y_pred is not None else np.nan)
        target.append(yi)
                    
        # Escrever a previsão no arquivo
        yi_unnorm = test_scaler.inverse_transform(yi.reshape(-1, 1)).item()
        y_pred_unnorm = test_scaler.inverse_transform(np.array(y_pred).reshape(-1, 1)).item()

        # Atualizar a métrica com a predição
        if y_pred is not None:
            mse_metric.update(yi_unnorm, y_pred_unnorm)
            mae_metric.update(yi_unnorm, y_pred_unnorm)
            rmse_metric.update(yi_unnorm, y_pred_unnorm)
            
        # Guardar os resultados na lista
        resultados.append({
            "Real": yi_unnorm,
            "Previsto": y_pred_unnorm,
            "Erro Absoluto": abs(y_pred_unnorm - yi_unnorm),
            "MAE Atual": mae_metric.get(),
            "MSE Atual": mse_metric.get(),
            "RMSE Atual": rmse_metric.get()
        })

        # Treinar o modelo com o dado atual
        ti = time.perf_counter()
        model.learn_one(xi, yi)
        tf = time.perf_counter()
        tempo_aprendiazagem.append(tf - ti) 

    # >>> Medir o uso de memória
    tamanho_memoria = asizeof.asizeof(model) / 1024  # em KB

    # Converter para DataFrame e exibir
    df_resultados = pd.DataFrame(resultados)

    # Salvar o DataFrame em um arquivo CSV
    df_resultados_csv = pd.DataFrame({
    "Real_Requests": df_resultados["Real"].round().astype(int),
    "Predicted_Requests": df_resultados["Previsto"].round().astype(int)
    })

    df_resultados_csv.to_csv(f'resultados/HSR_{i}.csv', index=False)

    HardSamplingRegressor.append({
    "Cluster": i,
    "MAE": mae_metric.get(),
    "RMSE": rmse_metric.get(),
    "Tempo Médio de Inferência (ms)": round(np.mean(tempo_inferencias) * 1000, 4),  # >>> em milissegundos
    "Tempo Aprendizagem (ms)": round(np.mean(tempo_aprendiazagem) * 1000, 4),
    "Tamanho do Modelo (KB)": round(tamanho_memoria, 2)
    })

### HoeffdingAdaptiveTreeRegressor

In [29]:
HoeffdingAdaptiveTreeregressor = []

In [30]:
for i in range(0,5):
    train_csv = 'data/clstr_0_nov.csv'
    test_csv = f'data/clstr_{i}_dec.csv' 
    chunk_size = 20 
    scaler = StandardScaler()
    test_scaler = StandardScaler()
    X_train, y_train = load_and_preprocess_data(train_csv, chunk_size, scaler)
    X_test, y_test = load_and_preprocess_data_test(test_csv, chunk_size, test_scaler)

    model = tree.HoeffdingAdaptiveTreeRegressor( seed=42 )

    mse_metric = metrics.MSE()
    mae_metric = metrics.MAE()
    rmse_metric = metrics.RMSE()

    # Criando o gerador de dados
    dados_river = gerar_dados_para_river(X_train, y_train)

 
    for xi, yi in dados_river:            
                # Treinar o modelo com o dado atual
                model.learn_one(xi, yi)
  

    data = gerar_dados_para_river(X_test, y_test)

    # Listas para armazenar previsões e valores reais
    predictions = []
    target = []
    resultados = []

    tempo_inferencias = []
    tempo_aprendiazagem = []

    for xi, yi in data:
        t0 = time.perf_counter()
        y_pred = model.predict_one(xi)
        t1 = time.perf_counter()
        tempo_inferencias.append(t1 - t0)
        predictions.append(y_pred if y_pred is not None else np.nan)
        target.append(yi)
                    
        # Escrever a previsão no arquivo
        yi_unnorm = test_scaler.inverse_transform(yi.reshape(-1, 1)).item()
        y_pred_unnorm = test_scaler.inverse_transform(np.array(y_pred).reshape(-1, 1)).item()

        # Atualizar a métrica com a predição
        if y_pred is not None:
            mse_metric.update(yi_unnorm, y_pred_unnorm)
            mae_metric.update(yi_unnorm, y_pred_unnorm)
            rmse_metric.update(yi_unnorm, y_pred_unnorm)
            
        # Guardar os resultados na lista
        resultados.append({
            "Real": yi_unnorm,
            "Previsto": y_pred_unnorm,
            "Erro Absoluto": abs(y_pred_unnorm - yi_unnorm),
            "MAE Atual": mae_metric.get(),
            "MSE Atual": mse_metric.get(),
            "RMSE Atual": rmse_metric.get()
        })

        # Treinar o modelo com o dado atual
        ti = time.perf_counter()
        model.learn_one(xi, yi)
        tf = time.perf_counter()
        tempo_aprendiazagem.append(tf - ti) 

    # >>> Medir o uso de memória
    tamanho_memoria = asizeof.asizeof(model) / 1024  # em KB

    # Converter para DataFrame e exibir
    df_resultados = pd.DataFrame(resultados)

    # Salvar o DataFrame em um arquivo CSV
    df_resultados_csv = pd.DataFrame({
    "Real_Requests": df_resultados["Real"].round().astype(int),
    "Predicted_Requests": df_resultados["Previsto"].round().astype(int)
    })

    df_resultados_csv.to_csv(f'resultados/HAT_{i}.csv', index=False)

    HoeffdingAdaptiveTreeregressor.append({
    "Cluster": i,
    "MAE": mae_metric.get(),
    "RMSE": rmse_metric.get(),
    "Tempo Médio de Inferência (ms)": round(np.mean(tempo_inferencias) * 1000, 4),  # >>> em milissegundos
    "Tempo Aprendizagem (ms)": round(np.mean(tempo_aprendiazagem) * 1000, 4),
    "Tamanho do Modelo (KB)": round(tamanho_memoria, 2)
    })

### HoeffdingTreeRegressor

In [31]:
HoeffdingTreeRegressor = []

In [32]:
for i in range(0,5):
    train_csv = 'data/clstr_0_nov.csv'
    test_csv = f'data/clstr_{i}_dec.csv'  
    chunk_size = 20
    scaler = StandardScaler()
    test_scaler = StandardScaler()
    X_train, y_train = load_and_preprocess_data(train_csv, chunk_size, scaler)
    X_test, y_test = load_and_preprocess_data_test(test_csv, chunk_size, test_scaler)

    model = tree.HoeffdingTreeRegressor()

    mse_metric = metrics.MSE()
    mae_metric = metrics.MAE()
    rmse_metric = metrics.RMSE()

    # Criando o gerador de dados
    dados_river = gerar_dados_para_river(X_train, y_train)

 
    for xi, yi in dados_river:            
                # Treinar o modelo com o dado atual
                model.learn_one(xi, yi)
  

    data = gerar_dados_para_river(X_test, y_test)

    # Listas para armazenar previsões e valores reais
    predictions = []
    target = []
    resultados = []

    tempo_inferencias = []
    tempo_aprendiazagem = []

    for xi, yi in data:
        t0 = time.perf_counter()
        y_pred = model.predict_one(xi)
        t1 = time.perf_counter()
        tempo_inferencias.append(t1 - t0)
        predictions.append(y_pred if y_pred is not None else np.nan)
        target.append(yi)
                    
        # Escrever a previsão no arquivo
        yi_unnorm = test_scaler.inverse_transform(yi.reshape(-1, 1)).item()
        y_pred_unnorm = test_scaler.inverse_transform(np.array(y_pred).reshape(-1, 1)).item()

        # Atualizar a métrica com a predição
        if y_pred is not None:
            mse_metric.update(yi_unnorm, y_pred_unnorm)
            mae_metric.update(yi_unnorm, y_pred_unnorm)
            rmse_metric.update(yi_unnorm, y_pred_unnorm)
            
        # Guardar os resultados na lista
        resultados.append({
            "Real": yi_unnorm,
            "Previsto": y_pred_unnorm,
            "Erro Absoluto": abs(y_pred_unnorm - yi_unnorm),
            "MAE Atual": mae_metric.get(),
            "MSE Atual": mse_metric.get(),
            "RMSE Atual": rmse_metric.get()
        })

        # Treinar o modelo com o dado atual
        ti = time.perf_counter()
        model.learn_one(xi, yi)
        tf = time.perf_counter()
        tempo_aprendiazagem.append(tf - ti) 

    # >>> Medir o uso de memória
    tamanho_memoria = asizeof.asizeof(model) / 1024  # em KB

    # Converter para DataFrame e exibir
    df_resultados = pd.DataFrame(resultados)

    # Salvar o DataFrame em um arquivo CSV
    df_resultados_csv = pd.DataFrame({
    "Real_Requests": df_resultados["Real"].round().astype(int),
    "Predicted_Requests": df_resultados["Previsto"].round().astype(int)
    })

    df_resultados_csv.to_csv(f'resultados/HTR_{i}.csv', index=False)

    HoeffdingTreeRegressor.append({
    "Cluster": i,
    "MAE": mae_metric.get(),
    "RMSE": rmse_metric.get(),
    "Tempo Médio de Inferência (ms)": round(np.mean(tempo_inferencias) * 1000, 4),  # >>> em milissegundos
    "Tempo Aprendizagem (ms)": round(np.mean(tempo_aprendiazagem) * 1000, 4),
    "Tamanho do Modelo (KB)": round(tamanho_memoria, 2)
    })

### SGTRegressor

In [33]:
SGTRegressor = []

In [34]:
for i in range(0,5):
    train_csv = 'data/clstr_0_nov.csv'
    test_csv = f'data/clstr_{i}_dec.csv' 
    chunk_size = 20 
    scaler = StandardScaler()
    test_scaler = StandardScaler()
    X_train, y_train = load_and_preprocess_data(train_csv, chunk_size, scaler)
    X_test, y_test = load_and_preprocess_data_test(test_csv, chunk_size, test_scaler)

    model = tree.SGTRegressor()

    mse_metric = metrics.MSE()
    mae_metric = metrics.MAE()
    rmse_metric = metrics.RMSE()

    # Criando o gerador de dados
    dados_river = gerar_dados_para_river(X_train, y_train)

 
    for xi, yi in dados_river:            
                # Treinar o modelo com o dado atual
                model.learn_one(xi, yi)
  

    data = gerar_dados_para_river(X_test, y_test)

    # Listas para armazenar previsões e valores reais
    predictions = []
    target = []
    resultados = []

    tempo_inferencias = []
    tempo_aprendiazagem = []

    for xi, yi in data:
        t0 = time.perf_counter()
        y_pred = model.predict_one(xi)
        t1 = time.perf_counter()
        tempo_inferencias.append(t1 - t0)
        predictions.append(y_pred if y_pred is not None else np.nan)
        target.append(yi)
                    
        # Escrever a previsão no arquivo
        yi_unnorm = test_scaler.inverse_transform(yi.reshape(-1, 1)).item()
        y_pred_unnorm = test_scaler.inverse_transform(np.array(y_pred).reshape(-1, 1)).item()

        # Atualizar a métrica com a predição
        if y_pred is not None:
            mse_metric.update(yi_unnorm, y_pred_unnorm)
            mae_metric.update(yi_unnorm, y_pred_unnorm)
            rmse_metric.update(yi_unnorm, y_pred_unnorm)
            
        # Guardar os resultados na lista
        resultados.append({
            "Real": yi_unnorm,
            "Previsto": y_pred_unnorm,
            "Erro Absoluto": abs(y_pred_unnorm - yi_unnorm),
            "MAE Atual": mae_metric.get(),
            "MSE Atual": mse_metric.get(),
            "RMSE Atual": rmse_metric.get()
        })

        # Treinar o modelo com o dado atual
        ti = time.perf_counter()
        model.learn_one(xi, yi)
        tf = time.perf_counter()
        tempo_aprendiazagem.append(tf - ti) 

    # >>> Medir o uso de memória
    tamanho_memoria = asizeof.asizeof(model) / 1024  # em KB

    # Converter para DataFrame e exibir
    df_resultados = pd.DataFrame(resultados)

    # Salvar o DataFrame em um arquivo CSV
    df_resultados_csv = pd.DataFrame({
    "Real_Requests": df_resultados["Real"].round().astype(int),
    "Predicted_Requests": df_resultados["Previsto"].round().astype(int)
    })

    df_resultados_csv.to_csv(f'resultados/SGT_{i}.csv', index=False)

    SGTRegressor.append({
    "Cluster": i,
    "MAE": mae_metric.get(),
    "RMSE": rmse_metric.get(),
    "Tempo Médio de Inferência (ms)": round(np.mean(tempo_inferencias) * 1000, 4),  # >>> em milissegundos
    "Tempo Aprendizagem (ms)": round(np.mean(tempo_aprendiazagem) * 1000, 4),
    "Tamanho do Modelo (KB)": round(tamanho_memoria, 2)
    })

### BayesianLinearRegression

In [35]:
BayesianLinearRegression = []

In [36]:
for i in range(0,5):
    train_csv = 'data/clstr_0_nov.csv'
    test_csv = f'data/clstr_{i}_dec.csv'  
    chunk_size = 20
    scaler = StandardScaler()
    test_scaler = StandardScaler()
    X_train, y_train = load_and_preprocess_data(train_csv, chunk_size, scaler)
    X_test, y_test = load_and_preprocess_data_test(test_csv, chunk_size, test_scaler)

    model = linear_model.BayesianLinearRegression()

    mse_metric = metrics.MSE()
    mae_metric = metrics.MAE()
    rmse_metric = metrics.RMSE()

    # Criando o gerador de dados
    dados_river = gerar_dados_para_river(X_train, y_train)

 
    for xi, yi in dados_river:            
                # Treinar o modelo com o dado atual
                model.learn_one(xi, yi)
  

    data = gerar_dados_para_river(X_test, y_test)

    # Listas para armazenar previsões e valores reais
    predictions = []
    target = []
    resultados = []

    tempo_inferencias = []
    tempo_aprendiazagem = []

    for xi, yi in data:
        t0 = time.perf_counter()
        y_pred = model.predict_one(xi)
        t1 = time.perf_counter()
        tempo_inferencias.append(t1 - t0)
        predictions.append(y_pred if y_pred is not None else np.nan)
        target.append(yi)
                    
        # Escrever a previsão no arquivo
        yi_unnorm = test_scaler.inverse_transform(yi.reshape(-1, 1)).item()
        y_pred_unnorm = test_scaler.inverse_transform(np.array(y_pred).reshape(-1, 1)).item()


        # Atualizar a métrica com a predição
        if y_pred is not None:
            mse_metric.update(yi_unnorm, y_pred_unnorm)
            mae_metric.update(yi_unnorm, y_pred_unnorm)
            rmse_metric.update(yi_unnorm, y_pred_unnorm)
            
        # Guardar os resultados na lista
        resultados.append({
            "Real": yi_unnorm,
            "Previsto": y_pred_unnorm,
            "Erro Absoluto": abs(y_pred_unnorm - yi_unnorm),
            "MAE Atual": mae_metric.get(),
            "MSE Atual": mse_metric.get(),
            "RMSE Atual": rmse_metric.get()
        })

        # Treinar o modelo com o dado atual
        ti = time.perf_counter()
        model.learn_one(xi, yi)
        tf = time.perf_counter()
        tempo_aprendiazagem.append(tf - ti) 

    # >>> Medir o uso de memória
    tamanho_memoria = asizeof.asizeof(model) / 1024  # em KB

    # Converter para DataFrame e exibir
    df_resultados = pd.DataFrame(resultados)

        # Salvar o DataFrame em um arquivo CSV
    df_resultados_csv = pd.DataFrame({
    "Real_Requests": df_resultados["Real"].round().astype(int),
    "Predicted_Requests": df_resultados["Previsto"].round().astype(int)
    })

    df_resultados_csv.to_csv(f'resultados/BLR_{i}.csv', index=False)

    BayesianLinearRegression.append({
    "Cluster": i,
    "MAE": mae_metric.get(),
    "RMSE": rmse_metric.get(),
    "Tempo Médio de Inferência (ms)": round(np.mean(tempo_inferencias) * 1000, 4),  # >>> em milissegundos
    "Tempo Aprendizagem (ms)": round(np.mean(tempo_aprendiazagem) * 1000, 4),
    "Tamanho do Modelo (KB)": round(tamanho_memoria, 2)
    })

### LinearRegression

In [37]:
LinearRegression = []

In [38]:
for i in range(0,5):
    train_csv = 'data/clstr_0_nov.csv'
    test_csv = f'data/clstr_{i}_dec.csv'  
    chunk_size = 20
    scaler = StandardScaler()
    test_scaler = StandardScaler()
    X_train, y_train = load_and_preprocess_data(train_csv, chunk_size, scaler)
    X_test, y_test = load_and_preprocess_data_test(test_csv, chunk_size, test_scaler)

    model = linear_model.LinearRegression()

    mse_metric = metrics.MSE()
    mae_metric = metrics.MAE()
    rmse_metric = metrics.RMSE()

    # Criando o gerador de dados
    dados_river = gerar_dados_para_river(X_train, y_train)

 
    for xi, yi in dados_river:            
                # Treinar o modelo com o dado atual
                model.learn_one(xi, yi)
  

    data = gerar_dados_para_river(X_test, y_test)

    # Listas para armazenar previsões e valores reais
    predictions = []
    target = []
    resultados = []

    tempo_inferencias = []
    tempo_aprendiazagem = []

    for xi, yi in data:
        t0 = time.perf_counter()
        y_pred = model.predict_one(xi)
        t1 = time.perf_counter()
        tempo_inferencias.append(t1 - t0)
        predictions.append(y_pred if y_pred is not None else np.nan)
        target.append(yi)
                    
        # Escrever a previsão no arquivo
        yi_unnorm = test_scaler.inverse_transform(yi.reshape(-1, 1)).item()
        y_pred_unnorm = test_scaler.inverse_transform(np.array(y_pred).reshape(-1, 1)).item()

        # Atualizar a métrica com a predição
        if y_pred is not None:
            mse_metric.update(yi_unnorm, y_pred_unnorm)
            mae_metric.update(yi_unnorm, y_pred_unnorm)
            rmse_metric.update(yi_unnorm, y_pred_unnorm)
            
        # Guardar os resultados na lista
        resultados.append({
            "Real": yi_unnorm,
            "Previsto": y_pred_unnorm,
            "Erro Absoluto": abs(y_pred_unnorm - yi_unnorm),
            "MAE Atual": mae_metric.get(),
            "MSE Atual": mse_metric.get(),
            "RMSE Atual": rmse_metric.get()
        })

        # Treinar o modelo com o dado atual
        ti = time.perf_counter()
        model.learn_one(xi, yi)
        tf = time.perf_counter()
        tempo_aprendiazagem.append(tf - ti) 

    # >>> Medir o uso de memória
    tamanho_memoria = asizeof.asizeof(model) / 1024  # em KB

    # Converter para DataFrame e exibir
    df_resultados = pd.DataFrame(resultados)

    # Salvar o DataFrame em um arquivo CSV
    df_resultados_csv = pd.DataFrame({
    "Real_Requests": df_resultados["Real"].round().astype(int),
    "Predicted_Requests": df_resultados["Previsto"].round().astype(int)
    })

    df_resultados_csv.to_csv(f'resultados/LiR_{i}.csv', index=False)

    LinearRegression.append({
    "Cluster": i,
    "MAE": mae_metric.get(),
    "RMSE": rmse_metric.get(),
    "Tempo Médio de Inferência (ms)": round(np.mean(tempo_inferencias) * 1000, 4),  # >>> em milissegundos
    "Tempo Aprendizagem (ms)": round(np.mean(tempo_aprendiazagem) * 1000, 4),
    "Tamanho do Modelo (KB)": round(tamanho_memoria, 2)
    })

### PARegressor

In [39]:
PARegressor = []

In [40]:
for i in range(0,5):
    train_csv = 'data/clstr_0_nov.csv'
    test_csv = f'data/clstr_{i}_dec.csv'  
    chunk_size = 20  
    scaler = StandardScaler()
    test_scaler = StandardScaler()
    X_train, y_train = load_and_preprocess_data(train_csv, chunk_size, scaler)
    X_test, y_test = load_and_preprocess_data_test(test_csv, chunk_size, test_scaler)

    model = linear_model.PARegressor()

    mse_metric = metrics.MSE()
    mae_metric = metrics.MAE()
    rmse_metric = metrics.RMSE()

    # Criando o gerador de dados
    dados_river = gerar_dados_para_river(X_train, y_train)

 
    for xi, yi in dados_river:            
                # Treinar o modelo com o dado atual
                model.learn_one(xi, yi)
  

    data = gerar_dados_para_river(X_test, y_test)

    # Listas para armazenar previsões e valores reais
    predictions = []
    target = []
    resultados = []

    tempo_inferencias = []
    tempo_aprendiazagem = []

    for xi, yi in data:
        t0 = time.perf_counter()
        y_pred = model.predict_one(xi)
        t1 = time.perf_counter()
        tempo_inferencias.append(t1 - t0)
        predictions.append(y_pred if y_pred is not None else np.nan)
        target.append(yi)
                    
        # Escrever a previsão no arquivo
        yi_unnorm = test_scaler.inverse_transform(yi.reshape(-1, 1)).item()
        y_pred_unnorm = test_scaler.inverse_transform(np.array(y_pred).reshape(-1, 1)).item()

        # Atualizar a métrica com a predição
        if y_pred is not None:
            mse_metric.update(yi_unnorm, y_pred_unnorm)
            mae_metric.update(yi_unnorm, y_pred_unnorm)
            rmse_metric.update(yi_unnorm, y_pred_unnorm)
            
        # Guardar os resultados na lista
        resultados.append({
            "Real": yi_unnorm,
            "Previsto": y_pred_unnorm,
            "Erro Absoluto": abs(y_pred_unnorm - yi_unnorm),
            "MAE Atual": mae_metric.get(),
            "MSE Atual": mse_metric.get(),
            "RMSE Atual": rmse_metric.get()
        })

        # Treinar o modelo com o dado atual
        ti = time.perf_counter()
        model.learn_one(xi, yi)
        tf = time.perf_counter()
        tempo_aprendiazagem.append(tf - ti) 

    # >>> Medir o uso de memória
    tamanho_memoria = asizeof.asizeof(model) / 1024  # em KB

    # Converter para DataFrame e exibir
    df_resultados = pd.DataFrame(resultados)

    # Salvar o DataFrame em um arquivo CSV
    df_resultados_csv = pd.DataFrame({
    "Real_Requests": df_resultados["Real"].round().astype(int),
    "Predicted_Requests": df_resultados["Previsto"].round().astype(int)
    })

    df_resultados_csv.to_csv(f'resultados/PAR_{i}.csv', index=False)

    PARegressor.append({
    "Cluster": i,
    "MAE": mae_metric.get(),
    "RMSE": rmse_metric.get(),
    "Tempo Médio de Inferência (ms)": round(np.mean(tempo_inferencias) * 1000, 4),  # >>> em milissegundos
    "Tempo Aprendizagem (ms)": round(np.mean(tempo_aprendiazagem) * 1000, 4),
    "Tamanho do Modelo (KB)": round(tamanho_memoria, 2)
    })

### KNNRegressor

In [41]:
from river import neighbors

In [42]:
KNNRegressor = []

In [43]:
for i in range(0,5):
    train_csv = 'data/clstr_0_nov.csv'
    test_csv = f'data/clstr_{i}_dec.csv'   
    chunk_size = 20 
    scaler = StandardScaler()
    test_scaler = StandardScaler()
    X_train, y_train = load_and_preprocess_data(train_csv, chunk_size, scaler)
    X_test, y_test = load_and_preprocess_data_test(test_csv, chunk_size, test_scaler)

    model = neighbors.KNNRegressor()
    
    mse_metric = metrics.MSE()
    mae_metric = metrics.MAE()
    rmse_metric = metrics.RMSE()

    # Criando o gerador de dados
    dados_river = gerar_dados_para_river(X_train, y_train)

 
    for xi, yi in dados_river:            
                # Treinar o modelo com o dado atual
                model.learn_one(xi, yi)
  
    
    data = gerar_dados_para_river(X_test, y_test)

    # Listas para armazenar previsões e valores reais
    predictions = []
    target = []
    resultados = []

    tempo_inferencias = []
    tempo_aprendiazagem = []

    for xi, yi in data:
        t0 = time.perf_counter()
        y_pred = model.predict_one(xi)
        t1 = time.perf_counter()
        tempo_inferencias.append(t1 - t0)
        predictions.append(y_pred if y_pred is not None else np.nan)
        target.append(yi)
                    
        # Escrever a previsão no arquivo
        yi_unnorm = test_scaler.inverse_transform(yi.reshape(-1, 1)).item()
        y_pred_unnorm = test_scaler.inverse_transform(np.array(y_pred).reshape(-1, 1)).item()

        # Atualizar a métrica com a predição
        if y_pred is not None:
            mse_metric.update(yi_unnorm, y_pred_unnorm)
            mae_metric.update(yi_unnorm, y_pred_unnorm)
            rmse_metric.update(yi_unnorm, y_pred_unnorm)
            
        # Guardar os resultados na lista
        resultados.append({
            "Real": yi_unnorm,
            "Previsto": y_pred_unnorm,
            "Erro Absoluto": abs(y_pred_unnorm - yi_unnorm),
            "MAE Atual": mae_metric.get(),
            "MSE Atual": mse_metric.get(),
            "RMSE Atual": rmse_metric.get()
        })

        # Treinar o modelo com o dado atual
        ti = time.perf_counter()
        model.learn_one(xi, yi)
        tf = time.perf_counter()
        tempo_aprendiazagem.append(tf - ti) 

    # >>> Medir o uso de memória
    tamanho_memoria = asizeof.asizeof(model) / 1024  # em KB

    # Converter para DataFrame e exibir
    df_resultados = pd.DataFrame(resultados)

    # Salvar o DataFrame em um arquivo CSV
    df_resultados_csv = pd.DataFrame({
    "Real_Requests": df_resultados["Real"].round().astype(int),
    "Predicted_Requests": df_resultados["Previsto"].round().astype(int)
    })

    df_resultados_csv.to_csv(f'resultados/KNN_{i}.csv', index=False)

    KNNRegressor.append({
    "Cluster": i,
    "MAE": mae_metric.get(),
    "RMSE": rmse_metric.get(),
    "Tempo Médio de Inferência (ms)": round(np.mean(tempo_inferencias) * 1000, 4),  # >>> em milissegundos
    "Tempo Aprendizagem (ms)": round(np.mean(tempo_aprendiazagem) * 1000, 4),
    "Tamanho do Modelo (KB)": round(tamanho_memoria, 2)
    })

### SKL2RiverRegressor

In [44]:
from river import compat
from sklearn import linear_model

In [45]:
SKL2RiverRegressor = []

In [46]:
for i in range(0,5):
    train_csv = 'data/clstr_0_nov.csv'
    test_csv = f'data/clstr_{i}_dec.csv' 
    chunk_size = 20   
    scaler = StandardScaler()
    test_scaler = StandardScaler()
    X_train, y_train = load_and_preprocess_data(train_csv, chunk_size, scaler)
    X_test, y_test = load_and_preprocess_data_test(test_csv, chunk_size, test_scaler)

    model = compat.convert_sklearn_to_river(linear_model.SGDRegressor())
    
    mse_metric = metrics.MSE()
    mae_metric = metrics.MAE()
    rmse_metric = metrics.RMSE()

    # Criando o gerador de dados
    dados_river = gerar_dados_para_river(X_train, y_train)

    for xi, yi in dados_river:            
                # Treinar o modelo com o dado atual
                model.learn_one(xi, yi)
  
    data = gerar_dados_para_river(X_test, y_test)

    # Listas para armazenar previsões e valores reais
    predictions = []
    target = []
    resultados = []

    tempo_inferencias = []
    tempo_aprendiazagem = []

    for xi, yi in data:
        t0 = time.perf_counter()
        y_pred = model.predict_one(xi)
        t1 = time.perf_counter()
        tempo_inferencias.append(t1 - t0)
        predictions.append(y_pred if y_pred is not None else np.nan)
        target.append(yi)
                    
        # Escrever a previsão no arquivo
        yi_unnorm = test_scaler.inverse_transform(yi.reshape(-1, 1)).item()
        y_pred_unnorm = test_scaler.inverse_transform(np.array(y_pred).reshape(-1, 1)).item()

        # Atualizar a métrica com a predição
        if y_pred is not None:
            mse_metric.update(yi_unnorm, y_pred_unnorm)
            mae_metric.update(yi_unnorm, y_pred_unnorm)
            rmse_metric.update(yi_unnorm, y_pred_unnorm)
            
        # Guardar os resultados na lista
        resultados.append({
            "Real": yi_unnorm,
            "Previsto": y_pred_unnorm,
            "Erro Absoluto": abs(y_pred_unnorm - yi_unnorm),
            "MAE Atual": mae_metric.get(),
            "MSE Atual": mse_metric.get(),
            "RMSE Atual": rmse_metric.get()
        })

        # Treinar o modelo com o dado atual
        ti = time.perf_counter()
        model.learn_one(xi, yi)
        tf = time.perf_counter()
        tempo_aprendiazagem.append(tf - ti) 

    # >>> Medir o uso de memória
    tamanho_memoria = asizeof.asizeof(model) / 1024  # em KB

    # Converter para DataFrame e exibir
    df_resultados = pd.DataFrame(resultados)

    # Salvar o DataFrame em um arquivo CSV
    df_resultados_csv = pd.DataFrame({
    "Real_Requests": df_resultados["Real"].round().astype(int),
    "Predicted_Requests": df_resultados["Previsto"].round().astype(int)
    })

    df_resultados_csv.to_csv(f'resultados/SKL_{i}.csv', index=False)

    SKL2RiverRegressor.append({
    "Cluster": i,
    "MAE": mae_metric.get(),
    "RMSE": rmse_metric.get(),
    "Tempo Médio de Inferência (ms)": round(np.mean(tempo_inferencias) * 1000, 4),  # >>> em milissegundos
    "Tempo Aprendizagem (ms)": round(np.mean(tempo_aprendiazagem) * 1000, 4),
    "Tamanho do Modelo (KB)": round(tamanho_memoria, 2)
    })

## Resultados

In [47]:
import pandas as pd

# Lista com os nomes das variáveis de resultados dos modelos
modelos_resultados = [
    ("AMFRegressor", AMFRegressor),
    ("ARFRegressor", ARFRegressor),
    ("OXTRegressor", OXTRegressor),
    ("BaggingRegressor", BaggingRegressor),
    ("EWARegressor", EWARegressor),
    ("SRPRegressor", SRPRegressor),
    ("HardSamplingRegressor", HardSamplingRegressor),
    ("HoeffdingAdaptiveTreeregressor", HoeffdingAdaptiveTreeregressor),
    ("HoeffdingTreeRegressor", HoeffdingTreeRegressor),
    ("SGTRegressor", SGTRegressor),
    ("BayesianLinearRegression", BayesianLinearRegression),
    ("LinearRegression", LinearRegression),
    ("PARegressor", PARegressor),
    ("KNNRegressor", KNNRegressor),
    ("SKL2RiverRegressor", SKL2RiverRegressor)
]

# Tabelas para armazenar os dados
tabela_metricas = []
tabela_tempos = []
tabela_memoria = []

# Iterar sobre os resultados
for nome_modelo, resultados in modelos_resultados:
    mae = [r.get('MAE', 0.0) for r in resultados]
    rmse = [r.get('RMSE', 0.0) for r in resultados]
    inf = [r.get('Tempo Médio de Inferência (ms)', 0.0) for r in resultados]
    learn = [r.get('Tempo Aprendizagem (ms)', 0.0) for r in resultados]
    size = [r.get('Tamanho do Modelo (KB)', 0.0) for r in resultados]

    # Tabela de métricas
    tabela_metricas.append([nome_modelo, 'MAE'] + mae)
    tabela_metricas.append(['', 'RMSE'] + rmse)

    # Tabela de tempos
    tabela_tempos.append([nome_modelo, 'Inferência (ms)'] + inf)
    tabela_tempos.append(['', 'Aprendizagem (ms)'] + learn)

    # Tabela de memória
    tabela_memoria.append([nome_modelo, 'Tamanho do Modelo (KB)'] + size)

# Converter para DataFrames
colunas = ['Modelo', 'Métrica', 'Cluster 0', 'Cluster 1', 'Cluster 2', 'Cluster 3', 'Cluster 4']
df_metricas = pd.DataFrame(tabela_metricas, columns=colunas)
df_tempos = pd.DataFrame(tabela_tempos, columns=colunas)
df_memoria = pd.DataFrame(tabela_memoria, columns=colunas)

# Adicionar coluna de média
for df in [df_metricas, df_tempos, df_memoria]:
    df['Média'] = df.iloc[:, 2:7].mean(axis=1)


In [48]:
with pd.ExcelWriter("resultados_completos_modelos.xlsx") as writer:
    df_metricas.to_excel(writer, sheet_name="Métricas", index=False)
    df_tempos.to_excel(writer, sheet_name="Tempos", index=False)
    df_memoria.to_excel(writer, sheet_name="Tamanho do Modelo", index=False)
