In [418]:
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt

data = {
    'Intervalo': ['00h', '23h', '48h', '68h', '75h', '144h'],
    'SMA': [0.0527, 0.0015, 0.0013, 0.0006, 0.0014, 0.0010],
    'Entropia': [5.625, 6.562, 6.920, 7.484, 6.755, 6.998],
    'Correlação': [0.997, 0.998, 0.997, 0.996, 0.997, 0.997],
    'Contraste': [6.937, 9.437, 13.684, 19.279, 13.950, 13.322],
    'Homogeneidade': [0.436, 0.399, 0.316, 0.253, 0.335, 0.328],
    'Dim. Fractal': [2.551, 2.598, 2.601, 2.605, 2.608, 2.601],
    'Lacunaridade': [1.979535, 1.979542, 1.979544, 1.979560, 1.979633, 1.979666]
}

df = pd.DataFrame(data)

In [420]:
numeric_columns = df.drop('Intervalo', axis=1)
std_deviation = numeric_columns.std()
std_deviation_sorted = std_deviation.sort_values(ascending=False)

print("Desvio Padrão")
print(std_deviation_sorted)

Desvio Padrão
Contraste        4.243403
Entropia         0.620661
Homogeneidade    0.064637
Dim. Fractal     0.021354
SMA              0.021044
Correlação       0.000632
Lacunaridade     0.000055
dtype: float64


In [421]:
fator_aumento = 30
noise_level = 0.0001
novos_dados = []

for intervalo in df['Intervalo'].unique():
    dados_intervalo = df[df['Intervalo'] == intervalo]
    novos_dados.extend([dados_intervalo] * fator_aumento)

dados_aumentados = pd.concat(novos_dados, ignore_index=True)
numeric_columns = dados_aumentados.drop('Intervalo', axis=1).columns
dados_aumentados[numeric_columns] += np.random.normal(0, noise_level, dados_aumentados[numeric_columns].shape)

In [422]:
numeric_columns = dados_aumentados.drop('Intervalo', axis=1)
std_deviation = numeric_columns.std()
std_deviation_sorted = std_deviation.sort_values(ascending=False)

print("Desvio Padrão")
print(std_deviation_sorted)


Desvio Padrão
Contraste        3.884485
Entropia         0.568168
Homogeneidade    0.059176
Dim. Fractal     0.019544
SMA              0.019264
Correlação       0.000589
Lacunaridade     0.000109
dtype: float64


In [423]:
from sklearn.tree import DecisionTreeClassifier
from sklearn.model_selection import train_test_split
from sklearn.metrics import accuracy_score, classification_report
from sklearn import preprocessing

X = dados_aumentados.drop('Intervalo', axis=1)
y = dados_aumentados['Intervalo']

# scaler = preprocessing.StandardScaler()
# X_scaled = scaler.fit_transform(X)

X_train, X_test, y_train, y_test = train_test_split(dados_aumentados.drop('Intervalo', axis=1),
                                                    dados_aumentados['Intervalo'], 
                                                    test_size=0.5, 
                                                    stratify=dados_aumentados['Intervalo'], 
                                                    random_state=100)

clf = DecisionTreeClassifier(random_state=100)
clf.fit(X_train, y_train)

y_pred = clf.predict(X_test)

accuracy = accuracy_score(y_test, y_pred)
print("Accuracy:", accuracy)
print("\nClassification Report:")
print(classification_report(y_test, y_pred))

Accuracy: 0.9888888888888889

Classification Report:
              precision    recall  f1-score   support

         00h       1.00      1.00      1.00        15
        144h       1.00      0.93      0.97        15
         23h       1.00      1.00      1.00        15
         48h       1.00      1.00      1.00        15
         68h       0.94      1.00      0.97        15
         75h       1.00      1.00      1.00        15

    accuracy                           0.99        90
   macro avg       0.99      0.99      0.99        90
weighted avg       0.99      0.99      0.99        90

