# Probando regresión logística para ver si es apta para el entorno distribuido

In [1]:
import os
from pathlib import Path
os.chdir(Path.cwd().parent)
from prototypes.xuilvq import XuILVQ
from prototypes_mod import XuILVQ as XuILVQ_mod
from river import forest, tree, linear_model, optim
from utils import read_dataset, evaluate_model_online_learning, calculate_metrics

## Vamos a probar el dataset con Hoeffding tree, ilvq y regresion logística para comparar métricas y coste computacional

In [2]:
# Dictionary of dataset names and file paths
data_name = {
    "elec": "electricity.csv",
}

# Load dataset
name = "elec"
dataset = read_dataset(name, data_name)
dataset = dataset.iloc[:5000]

  dataset.replace({'UP': 1, 'DOWN': 0, 'True': 1, 'False': 0}, inplace=True)


### Inicializar modelos

In [3]:
# Inicializar modelos
arf_model = forest.ARFClassifier(n_models=3, max_size=20)
hoeffding_tree_model = tree.HoeffdingTreeClassifier()
ilvq_model = XuILVQ()
ilvq_mod_model = XuILVQ_mod()  # Versión modificada de ILVQ
logistic_regression_model = linear_model.LogisticRegression()

In [4]:
# Evaluar ARF
conf_matrix_arf, elapsed_time_arf = evaluate_model_online_learning(arf_model, dataset)
precision_arf, recall_arf, f1_arf = calculate_metrics(conf_matrix_arf)

# Evaluar Hoeffding Tree
conf_matrix_ht, elapsed_time_ht = evaluate_model_online_learning(hoeffding_tree_model, dataset)
precision_ht, recall_ht, f1_ht = calculate_metrics(conf_matrix_ht)

# Evaluar ILVQ
conf_matrix_ilvq, elapsed_time_ilvq = evaluate_model_online_learning(ilvq_model, dataset)
precision_ilvq, recall_ilvq, f1_ilvq = calculate_metrics(conf_matrix_ilvq)

# Evaluar ILVQ Mod
conf_matrix_ilvq_mod, elapsed_time_ilvq_mod = evaluate_model_online_learning(ilvq_mod_model, dataset)
precision_ilvq_mod, recall_ilvq_mod, f1_ilvq_mod = calculate_metrics(conf_matrix_ilvq_mod)

# Evaluar Regresión Logística
conf_matrix_lr, elapsed_time_lr = evaluate_model_online_learning(logistic_regression_model, dataset)
precision_lr, recall_lr, f1_lr = calculate_metrics(conf_matrix_lr)

# Evaluar Regresión Logística Adaptada
conf_matrix_lr_adapted, elapsed_time_lr_adapted = evaluate_model_online_learning(logistic_regression_model, dataset)
precision_lr_adapted, recall_lr_adapted, f1_lr_adapted = calculate_metrics(conf_matrix_lr_adapted)

In [5]:
# Mostrar resultados
print("Resultados de la evaluación:")
print(f"ARF - Precisión: {precision_arf:.4f}, Recall: {recall_arf:.4f}, F1-score: {f1_arf:.4f}")
print(f"ARF - Tiempo de ejecución: {elapsed_time_arf:.2f} segundos\n")

print(f"Hoeffding Tree - Precisión: {precision_ht:.4f}, Recall: {recall_ht:.4f}, F1-score: {f1_ht:.4f}")
print(f"Hoeffding Tree - Tiempo de ejecución: {elapsed_time_ht:.2f} segundos\n")

print(f"ILVQ - Precisión: {precision_ilvq:.4f}, Recall: {recall_ilvq:.4f}, F1-score: {f1_ilvq:.4f}")
print(f"ILVQ - Tiempo de ejecución: {elapsed_time_ilvq:.2f} segundos\n")

print(f"ILVQ Mod - Precisión: {precision_ilvq_mod:.4f}, Recall: {recall_ilvq_mod:.4f}, F1-score: {f1_ilvq_mod:.4f}")
print(f"ILVQ Mod - Tiempo de ejecución: {elapsed_time_ilvq_mod:.2f} segundos\n")

print(f"Regresión Logística (Original) - Precisión: {precision_lr:.4f}, Recall: {recall_lr:.4f}, F1-score: {f1_lr:.4f}")
print(f"Regresión Logística (Original) - Tiempo de ejecución: {elapsed_time_lr:.2f} segundos\n")

print(f"Regresión Logística (Adaptada) - Precisión: {precision_lr_adapted:.4f}, Recall: {recall_lr_adapted:.4f}, F1-score: {f1_lr_adapted:.4f}")
print(f"Regresión Logística (Adaptada) - Tiempo de ejecución: {elapsed_time_lr_adapted:.2f} segundos\n")

Resultados de la evaluación:
ARF - Precisión: 0.8423, Recall: 0.8501, F1-score: 0.8462
ARF - Tiempo de ejecución: 1.96 segundos

Hoeffding Tree - Precisión: 0.7904, Recall: 0.8265, F1-score: 0.8080
Hoeffding Tree - Tiempo de ejecución: 0.52 segundos

ILVQ - Precisión: 0.7422, Recall: 0.6607, F1-score: 0.6991
ILVQ - Tiempo de ejecución: 3.08 segundos

ILVQ Mod - Precisión: 0.6882, Recall: 0.7536, F1-score: 0.7194
ILVQ Mod - Tiempo de ejecución: 5.01 segundos

Regresión Logística (Original) - Precisión: 0.6185, Recall: 0.4394, F1-score: 0.5138
Regresión Logística (Original) - Tiempo de ejecución: 0.26 segundos

Regresión Logística (Adaptada) - Precisión: 0.6448, Recall: 0.4492, F1-score: 0.5295
Regresión Logística (Adaptada) - Tiempo de ejecución: 0.26 segundos

