In [None]:
import pandas as pd
import numpy as np
from sklearn.ensemble import IsolationForest
from sklearn.preprocessing import StandardScaler
from tensorflow.keras.models import Sequential
from tensorflow.keras.layers import Dense, LSTM, Dropout, Conv1D, MaxPooling1D, Flatten
from sklearn.model_selection import train_test_split
import plotly.graph_objects as go

# Carregar os dados do arquivo Excel
file_path = 'latencies by service.xlsx'
df = pd.read_excel(file_path)

In [None]:
# Conversão das latências em uma lista de números e reset do índice
df_exploded = df['latencies'].str.split(',', expand=True).stack().astype(int).reset_index(name='latency')
df_exploded.drop('level_1', axis=1, inplace=True)

# Calcular os percentis para as latências
percentil_90 = np.percentile(df_exploded['latency'], 90)
percentil_95 = np.percentile(df_exploded['latency'], 95)

# Função para categorizar latências
def categorize_latency(latency):
    if latency > percentil_95:
        return 'Severe Anomaly'
    elif latency > percentil_90:
        return 'Possible Anomaly'
    else:
        return 'Normal'

df_exploded['category'] = df_exploded['latency'].apply(categorize_latency)

# Engenharia de features
window_size = 5
df_exploded['rolling_mean'] = df_exploded['latency'].rolling(window=window_size).mean()
df_exploded['rolling_std'] = df_exploded['latency'].rolling(window=window_size).std()

# Removendo os valores NaN gerados pela função rolling
df_exploded.dropna(inplace=True)

# Normalização dos dados
scaler = StandardScaler()
scaled_features = scaler.fit_transform(df_exploded[['latency', 'rolling_mean', 'rolling_std']])

# Formatação dos dados para entrada na CNN + LSTM ([samples, time steps, features])
X = np.array([scaled_features[i-window_size:i] for i in range(window_size, len(scaled_features))])
y = df_exploded['category'][window_size:].map({'Normal': 0, 'Possible Anomaly': 1, 'Severe Anomaly': 2}).values

# Divisão em conjuntos de treino e teste
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.3, random_state=42)

In [None]:

# Construção do modelo com CNN + LSTM
model = Sequential()

# Camada Conv1D
model.add(Conv1D(filters=64, kernel_size=2, activation='relu', input_shape=(window_size, X.shape[2])))
model.add(MaxPooling1D(pool_size=2))
model.add(Flatten())

# Camada LSTM
model.add(Dense(50, activation='relu'))
model.add(Dropout(0.5))

# Camada de saída
model.add(Dense(3, activation='softmax'))

# Compilando o modelo
model.compile(optimizer='adam', loss='sparse_categorical_crossentropy', metrics=['accuracy'])

# Treinamento do modelo
model.fit(X_train, y_train, epochs=40, batch_size=32, validation_data=(X_test, y_test), verbose=1)

# Avaliação do modelo
performance = model.evaluate(X_test, y_test, verbose=0)
print(f'Test Loss: {performance[0]}, Test Accuracy: {performance[1]}')

# Salvando o modelo treinado
model.save('cnn_lstm_anomaly_detection_model.h5')

In [None]:
# Visualização das categorias de latência com Plotly
fig = go.Figure()

# Adicionando as latências normais
fig.add_trace(go.Scatter(x=df_exploded[df_exploded['category'] == 'Normal'].index, 
                         y=df_exploded[df_exploded['category'] == 'Normal']['latency'],
                         mode='markers',
                         name='Normal',
                         marker=dict(color='blue')))

# Adicionando as possíveis anomalias
fig.add_trace(go.Scatter(x=df_exploded[df_exploded['category'] == 'Possible Anomaly'].index, 
                         y=df_exploded[df_exploded['category'] == 'Possible Anomaly']['latency'],
                         mode='markers',
                         name='Possible Anomaly',
                         marker=dict(color='green')))

# Adicionando as anomalias severas
fig.add_trace(go.Scatter(x=df_exploded[df_exploded['category'] == 'Severe Anomaly'].index, 
                         y=df_exploded[df_exploded['category'] == 'Severe Anomaly']['latency'],
                         mode='markers',
                         name='Severe Anomaly',
                         marker=dict(color='red')))

fig.update_layout(title='Latências Categorizadas',
                  xaxis_title='Índice',
                  yaxis_title='Latência',
                  legend_title='Categoria')

fig.show()