# Visualizações do Fluxo

In [2]:
import numpy as np
import pandas as pd
import warnings 

warnings.filterwarnings("ignore")

from coder import Coder
from reviewer import Reviewer
from system import System
from utils import epsilon_greedy_decay, calculate_reward, update_q_value

In [None]:
# Iris dataset
from sklearn.datasets import load_iris

In [None]:
iris = load_iris()

data = iris.data # Array
df = pd.DataFrame(data=iris.data, columns=iris.feature_names) # DataFrame

# As métricas iniciais poderiam ser o início de uma clusterização com o KMeans
initial_metrics = {
    "silhouette_score": 0.3,  
    "davies_bouldin_score": 2.0,  
    "n_clusters": 3
}

In [None]:
coder = Coder(data=data, df=df, evaluation_results_initial=initial_metrics)
reviewer = Reviewer(coder)
sistema = System(coder, reviewer)

sistema.train(epochs=10, epsilon=1.0, epsilon_min=0.01, decay_rate=0.99, size_penalty=0.5, lambda_k=0.5, lambda_size=0.5)

# Rewards Plot

In [None]:
sistema.plot_rewards()

# Frequência de Ações

In [None]:
sistema.plot_action_frequency()

# Flags

In [None]:
sistema.plot_error_flags()

# Média de Recompensa por Ação

In [None]:
sistema.plot_average_reward_per_action()

# Distribuição das recompensas

In [None]:
sistema.plot_reward_distribution()