In [1]:
%pip install autorank

[0mCollecting autorank
  Downloading autorank-1.2.1-py3-none-any.whl.metadata (19 kB)
Collecting statsmodels>=0.14.0 (from autorank)
  Downloading statsmodels-0.14.4-cp312-cp312-manylinux_2_17_x86_64.manylinux2014_x86_64.whl.metadata (9.2 kB)
Collecting baycomp>=1.0.3 (from autorank)
  Downloading baycomp-1.0.3.tar.gz (15 kB)
  Preparing metadata (setup.py) ... [?25ldone
[?25hCollecting jinja2>=3.1.2 (from autorank)
  Downloading jinja2-3.1.6-py3-none-any.whl.metadata (2.9 kB)
Collecting patsy>=0.5.6 (from statsmodels>=0.14.0->autorank)
  Downloading patsy-1.0.1-py2.py3-none-any.whl.metadata (3.3 kB)
Downloading autorank-1.2.1-py3-none-any.whl (35 kB)
Downloading jinja2-3.1.6-py3-none-any.whl (134 kB)
Downloading statsmodels-0.14.4-cp312-cp312-manylinux_2_17_x86_64.manylinux2014_x86_64.whl (10.7 MB)
[2K   [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m10.7/10.7 MB[0m [31m283.5 kB/s[0m eta [36m0:00:00[0m00:01[0m00:02[0m
[?25hDownloading patsy-1.0.1-py2.py3-none-any.w

In [2]:
from utils.FileManager import FileManager
import pandas as pd

import warnings
warnings.filterwarnings("ignore")

from autorank import autorank, plot_stats, create_report

In [3]:
from avaliacao.AvaliadorDriftBase import AvaliadorBatch
from avaliacao.AvaliadorDriftBase import AvaliadorPassivo
from experimento.ExperimentoDrift import Experimento

In [4]:
# Importando detectores de drift
from detectores.ADWINDetector import ADWINDetector
from detectores.DDMDetector import DDMDetector
from detectores.EDDMDetector import EDDMDetector
from detectores.FHDDMDetector import FHDDMDetector
from detectores.HDDM_ADetector import HDDM_ADetector
from detectores.PageHinkleyDetector import PageHinkleyDetector
from detectores.HDDM_WDetector import HDDM_WDetector
from detectores.KSWINDetector import KSWINDetector

In [6]:
# Importando modelos offline
from regressores.modelosOffline.LinearRegressionModelo import LinearRegressionModelo
from regressores.modelosOffline.KneighborsRegressorModelo import KNeighborsRegressorModelo
from regressores.modelosOffline.LassoRegressionModelo import LassoRegressionModelo
from regressores.modelosOffline.RidgeRegressionModelo import RidgeRegressionModelo
from regressores.modelosOffline.SVRModelo import SVRModelo
from regressores.modelosOffline.RandomForestModelo import RandomForestModelo
from regressores.modelosOffline.MLPRegressorModelo import MLPRegressorModelo

In [7]:
# Importando modelos online
from regressores.modelosOnline.BayesianLinearRegressionModelo import BayesianLinearRegressionModelo
from regressores.modelosOnline.HoeffdingTreeRegressorModelo import HoeffdingTreeRegressorModelo
from regressores.modelosOnline.KNNRegressorOnlineModelo import KNNRegressorOnlineModelo
from regressores.modelosOnline.LinearRegressionOnlineModelo import LinearRegressionOnlineModelo




In [8]:
# Lista de séries temporais
series = [
    "AAPL",
    "B3SA3.SA",
    "^IXIC",
    "^DJI",
    "^GSPC",
    "^BVSP",
    "USDBRL=X"
]

In [9]:
# Parâmetros do experimento
tamanho_batch = 50
lags = 5
repeticoes = 30  # Número de execuções para cada modelo-série

In [11]:
# Lista de modelos para o experimento
modelos = [
    {
        "nome": "LR + KSWIN",
        "avaliador": AvaliadorBatch(),
        "modelo": LinearRegressionModelo,
        "detector": KSWINDetector
    },
    {
        "nome": "LR + HDDMa",
        "avaliador": AvaliadorBatch(),
        "modelo": LinearRegressionModelo,
        "detector": HDDM_ADetector
    },
    {
        "nome": "LR + ADWIN",
        "avaliador": AvaliadorBatch(),
        "modelo": LinearRegressionModelo,
        "detector": ADWINDetector
    },
    {
        "nome": "LR + DDM",
        "avaliador": AvaliadorBatch(),
        "modelo": LinearRegressionModelo,
        "detector": DDMDetector
    },



    {
        "nome": "KNN + KSWIN",
        "avaliador": AvaliadorBatch(),
        "modelo": KNeighborsRegressorModelo,
        "detector": KSWINDetector
    },
    {
        "nome": "KNN + HDDMa",
        "avaliador": AvaliadorBatch(),
        "modelo": KNeighborsRegressorModelo,
        "detector": HDDM_ADetector
    },
    {
        "nome": "KNN + ADWIN",
        "avaliador": AvaliadorBatch(),
        "modelo": KNeighborsRegressorModelo,
        "detector": ADWINDetector
    },
    {
        "nome": "KNN + DDM",
        "avaliador": AvaliadorBatch(),
        "modelo": KNeighborsRegressorModelo,
        "detector": DDMDetector
    },



    {
        "nome": "RF + KSWIN",
        "avaliador": AvaliadorBatch(),
        "modelo": RandomForestModelo,
        "detector": KSWINDetector
    },
    {
        "nome": "RF + HDDMa",
        "avaliador": AvaliadorBatch(),
        "modelo": RandomForestModelo,
        "detector": HDDM_ADetector
    },
    {
        "nome": "RF + ADWIN",
        "avaliador": AvaliadorBatch(),
        "modelo": RandomForestModelo,
        "detector": ADWINDetector
    },
    {
        "nome": "RF + DDM",
        "avaliador": AvaliadorBatch(),
        "modelo": RandomForestModelo,
        "detector": DDMDetector
    },


    {
        "nome": "BayesianLinear",
        "avaliador": AvaliadorPassivo(),
        "modelo": BayesianLinearRegressionModelo,
        "detector": None  # Passivo, não usa detector
    },
    {
        "nome": "HoeffdingTree",
        "avaliador": AvaliadorPassivo(),
        "modelo": HoeffdingTreeRegressorModelo,
        "detector": None  # Passivo, não usa detector
    },
    {
        "nome": "KNNRegressorOnline",
        "avaliador": AvaliadorPassivo(),
        "modelo": KNNRegressorOnlineModelo,
        "detector": None  # Passivo, não usa detector
    },
    {
        "nome": "LinearRegressionOnline",
        "avaliador": AvaliadorPassivo(),
        "modelo": LinearRegressionOnlineModelo,
        "detector": None  # Passivo, não usa detector
    },
]


In [None]:
# Criando e executando o experimento
experimento = Experimento(
    series=series,
    modelos=modelos,
    tamanho_batch=tamanho_batch,
    lags=lags,
    repeticoes=repeticoes
)

resultados = experimento.executar()

YF.download() has changed argument auto_adjust default to True


[*********************100%***********************]  1 of 1 completed


Executando LR + KSWIN na série: AAPL
Executando LR + HDDMa na série: AAPL
Executando LR + ADWIN na série: AAPL
Executando LR + DDM na série: AAPL
Executando KNN + KSWIN na série: AAPL
Executando KNN + HDDMa na série: AAPL
Executando KNN + ADWIN na série: AAPL
Executando KNN + DDM na série: AAPL
Executando RF + KSWIN na série: AAPL
Executando RF + HDDMa na série: AAPL
Executando RF + ADWIN na série: AAPL
Executando RF + DDM na série: AAPL
Executando BayesianLinear na série: AAPL
Executando HoeffdingTree na série: AAPL
Executando KNNRegressorOnline na série: AAPL
Executando LinearRegressionOnline na série: AAPL


[*********************100%***********************]  1 of 1 completed


Executando LR + KSWIN na série: B3SA3.SA
Executando LR + HDDMa na série: B3SA3.SA
Executando LR + ADWIN na série: B3SA3.SA
Executando LR + DDM na série: B3SA3.SA
Executando KNN + KSWIN na série: B3SA3.SA
Executando KNN + HDDMa na série: B3SA3.SA
Executando KNN + ADWIN na série: B3SA3.SA
Executando KNN + DDM na série: B3SA3.SA
Executando RF + KSWIN na série: B3SA3.SA
Executando RF + HDDMa na série: B3SA3.SA
Executando RF + ADWIN na série: B3SA3.SA
Executando RF + DDM na série: B3SA3.SA
Executando BayesianLinear na série: B3SA3.SA
Executando HoeffdingTree na série: B3SA3.SA
Executando KNNRegressorOnline na série: B3SA3.SA
Executando LinearRegressionOnline na série: B3SA3.SA


[*********************100%***********************]  1 of 1 completed


Executando LR + KSWIN na série: ^IXIC
Executando LR + HDDMa na série: ^IXIC
Executando LR + ADWIN na série: ^IXIC
Executando LR + DDM na série: ^IXIC
Executando KNN + KSWIN na série: ^IXIC
Executando KNN + HDDMa na série: ^IXIC
Executando KNN + ADWIN na série: ^IXIC
Executando KNN + DDM na série: ^IXIC
Executando RF + KSWIN na série: ^IXIC
Executando RF + HDDMa na série: ^IXIC
Executando RF + ADWIN na série: ^IXIC
Executando RF + DDM na série: ^IXIC
Executando BayesianLinear na série: ^IXIC
Executando HoeffdingTree na série: ^IXIC
Executando KNNRegressorOnline na série: ^IXIC
Executando LinearRegressionOnline na série: ^IXIC


[*********************100%***********************]  1 of 1 completed


Executando LR + KSWIN na série: ^DJI
Executando LR + HDDMa na série: ^DJI
Executando LR + ADWIN na série: ^DJI
Executando LR + DDM na série: ^DJI
Executando KNN + KSWIN na série: ^DJI
Executando KNN + HDDMa na série: ^DJI
Executando KNN + ADWIN na série: ^DJI
Executando KNN + DDM na série: ^DJI
Executando RF + KSWIN na série: ^DJI
Executando RF + HDDMa na série: ^DJI
Executando RF + ADWIN na série: ^DJI
Executando RF + DDM na série: ^DJI
Executando BayesianLinear na série: ^DJI
Executando HoeffdingTree na série: ^DJI
Executando KNNRegressorOnline na série: ^DJI
Executando LinearRegressionOnline na série: ^DJI


[*********************100%***********************]  1 of 1 completed


Executando LR + KSWIN na série: ^GSPC
Executando LR + HDDMa na série: ^GSPC
Executando LR + ADWIN na série: ^GSPC
Executando LR + DDM na série: ^GSPC
Executando KNN + KSWIN na série: ^GSPC
Executando KNN + HDDMa na série: ^GSPC
Executando KNN + ADWIN na série: ^GSPC
Executando KNN + DDM na série: ^GSPC
Executando RF + KSWIN na série: ^GSPC
Executando RF + HDDMa na série: ^GSPC
Executando RF + ADWIN na série: ^GSPC
Executando RF + DDM na série: ^GSPC
Executando BayesianLinear na série: ^GSPC
Executando HoeffdingTree na série: ^GSPC
Executando KNNRegressorOnline na série: ^GSPC
Executando LinearRegressionOnline na série: ^GSPC


[*********************100%***********************]  1 of 1 completed


Executando LR + KSWIN na série: ^BVSP
Executando LR + HDDMa na série: ^BVSP
Executando LR + ADWIN na série: ^BVSP
Executando LR + DDM na série: ^BVSP
Executando KNN + KSWIN na série: ^BVSP
Executando KNN + HDDMa na série: ^BVSP
Executando KNN + ADWIN na série: ^BVSP
Executando KNN + DDM na série: ^BVSP
Executando RF + KSWIN na série: ^BVSP
Executando RF + HDDMa na série: ^BVSP


In [None]:
# salvando os resultados
arquivo_salvamento = "Experimento.csv"
FileManager.salvar_resultados(resultados, arquivo_salvamento)

In [None]:
# 1. Ler o arquivo CSV
df = pd.read_csv(arquivo_salvamento)

In [None]:
# 3. Agrupar por modelo e calcular estatísticas
summary = df.groupby(['serie', 'modelo']).agg(
    mae_mean=('mae', 'mean'),
    mae_std=('mae', 'std'),
    qtd_deteccoes_mean=('qtd_deteccoes', 'mean'),
    qtd_deteccoes_std=('qtd_deteccoes', 'std')
).reset_index()

In [None]:
# Tabela para a média do MAE
mae_mean_table = summary.pivot(index='serie', columns='modelo', values='mae_mean')
mae_mean_table

In [None]:
# Tabela para o desvio padrão do MAE
mae_std_table = summary.pivot(index='serie', columns='modelo', values='mae_std')
mae_std_table

In [None]:
# Tabela para a média das detecções
deteccoes_mean_table = summary.pivot(index='serie', columns='modelo', values='qtd_deteccoes_mean')
deteccoes_mean_table

In [None]:
# 4. Preparar dados para autorank (uma linha por repetição, colunas por modelo)
df_mae = df.pivot_table(index=["serie", "repeticao"], columns="modelo", values="mae")
# Remover qualquer valor NaN para análise (caso haja)
df_mae = df_mae.dropna()
# Tabela de desempenho
df_mae

In [None]:
# computing the most appropriate statistical test
results = autorank(-df_mae)
# printing the report
create_report(results)

In [None]:
# plotting the results
plot_stats(results, allow_insignificant=True)