# Detec√ß√£o de Anomalias em M√°quinas Industriais usando Dados de Vibra√ß√£o 3-Eixos

Este notebook implementa detec√ß√£o de anomalias para m√°quinas industriais usando dados de vibra√ß√£o de 3 eixos, baseado no exemplo do MATLAB Predictive Maintenance Toolbox.

## Metodologia

Implementamos tr√™s abordagens diferentes de detec√ß√£o de anomalias:
1. **One-Class SVM**: Identifica anormalidades "distantes" dos dados normais
2. **Isolation Forest**: Usa √°rvores de decis√£o para isolar observa√ß√µes
3. **Autoencoder**: Rede neural que reconstr√≥i dados normais com baixo erro

## 1. Importa√ß√£o das Bibliotecas

In [None]:
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns
from sklearn.model_selection import train_test_split
from sklearn.svm import OneClassSVM
from sklearn.ensemble import IsolationForest
from sklearn.preprocessing import StandardScaler
from sklearn.metrics import classification_report, confusion_matrix, accuracy_score
import tensorflow as tf
from tensorflow import keras
import warnings
warnings.filterwarnings('ignore')

# Configura√ß√µes de visualiza√ß√£o
plt.style.use('seaborn-v0_8')
sns.set_palette("husl")
plt.rcParams['figure.figsize'] = (12, 8)

print("Bibliotecas importadas com sucesso!")
print(f"TensorFlow vers√£o: {tf.__version__}")

## 2. Defini√ß√£o da Classe Principal

In [None]:
class VibrationAnomalyDetector:
    """
    Detector de anomalias para m√°quinas industriais usando dados de vibra√ß√£o 3-eixos
    Baseado no exemplo do MATLAB Predictive Maintenance Toolbox
    """
    
    def __init__(self):
        self.scaler = StandardScaler()
        self.models = {}
        self.feature_names = [
            'Ch1_CrestFactor', 'Ch1_Kurtosis', 'Ch1_RMS', 'Ch1_StdDev',
            'Ch2_Mean', 'Ch2_RMS', 'Ch2_Skewness', 'Ch2_StdDev',
            'Ch3_CrestFactor', 'Ch3_SINAD', 'Ch3_SNR', 'Ch3_THD'
        ]
        print("Detector de Anomalias de Vibra√ß√£o inicializado!")
        print(f"Features extra√≠das: {len(self.feature_names)}")
    
    def generate_synthetic_data(self, n_normal=1000, n_anomaly=200):
        """
        Gera dados sint√©ticos de vibra√ß√£o 3-eixos com comportamento normal e an√¥malo
        """
        np.random.seed(42)
        
        # Dados normais (ap√≥s manuten√ß√£o)
        normal_data = []
        for i in range(n_normal):
            # Features do Canal 1 (padr√µes normais de vibra√ß√£o)
            ch1_crest = np.random.normal(3.2, 0.3)  # Fator de Crista
            ch1_kurt = np.random.normal(3.1, 0.2)   # Curtose
            ch1_rms = np.random.normal(0.15, 0.02)  # RMS
            ch1_std = np.random.normal(0.12, 0.015) # Desvio Padr√£o
            
            # Features do Canal 2
            ch2_mean = np.random.normal(0.001, 0.0005)  # M√©dia
            ch2_rms = np.random.normal(0.14, 0.018)     # RMS
            ch2_skew = np.random.normal(0.05, 0.02)     # Assimetria
            ch2_std = np.random.normal(0.11, 0.012)     # Desvio Padr√£o
            
            # Features do Canal 3
            ch3_crest = np.random.normal(3.1, 0.25)  # Fator de Crista
            ch3_sinad = np.random.normal(42, 2)      # SINAD
            ch3_snr = np.random.normal(38, 1.5)      # SNR
            ch3_thd = np.random.normal(0.08, 0.01)   # THD
            
            normal_data.append([
                ch1_crest, ch1_kurt, ch1_rms, ch1_std,
                ch2_mean, ch2_rms, ch2_skew, ch2_std,
                ch3_crest, ch3_sinad, ch3_snr, ch3_thd
            ])
        
        # Dados an√¥malos (antes da manuten√ß√£o - condi√ß√µes degradadas)
        anomaly_data = []
        for i in range(n_anomaly):
            # Features do Canal 1 (an√¥malas - vibra√ß√µes maiores, padr√µes diferentes)
            ch1_crest = np.random.normal(4.8, 0.5)    # Fator de crista maior
            ch1_kurt = np.random.normal(5.2, 0.8)     # Curtose maior
            ch1_rms = np.random.normal(0.35, 0.08)    # RMS maior
            ch1_std = np.random.normal(0.28, 0.05)    # Desvio padr√£o maior
            
            # Features do Canal 2 (an√¥malas)
            ch2_mean = np.random.normal(0.008, 0.003)  # M√©dia maior
            ch2_rms = np.random.normal(0.32, 0.06)     # RMS maior
            ch2_skew = np.random.normal(0.25, 0.08)    # Assimetria maior
            ch2_std = np.random.normal(0.25, 0.04)     # Desvio padr√£o maior
            
            # Features do Canal 3 (an√¥malas)
            ch3_crest = np.random.normal(5.1, 0.6)   # Fator de crista maior
            ch3_sinad = np.random.normal(28, 4)      # SINAD menor (mais distor√ß√£o)
            ch3_snr = np.random.normal(22, 3)        # SNR menor (mais ru√≠do)
            ch3_thd = np.random.normal(0.18, 0.03)   # THD maior (mais distor√ß√£o)
            
            anomaly_data.append([
                ch1_crest, ch1_kurt, ch1_rms, ch1_std,
                ch2_mean, ch2_rms, ch2_skew, ch2_std,
                ch3_crest, ch3_sinad, ch3_snr, ch3_thd
            ])
        
        # Combinar dados
        X_normal = np.array(normal_data)
        X_anomaly = np.array(anomaly_data)
        
        # Criar r√≥tulos (0 = normal, 1 = anomalia)
        y_normal = np.zeros(n_normal)
        y_anomaly = np.ones(n_anomaly)
        
        X = np.vstack([X_normal, X_anomaly])
        y = np.hstack([y_normal, y_anomaly])
        
        # Criar DataFrame
        df = pd.DataFrame(X, columns=self.feature_names)
        df['label'] = y
        df['condition'] = ['Normal' if label == 0 else 'Anomalia' for label in y]
        
        return df
    
    def prepare_data(self, df):
        """
        Prepara dados para treinamento - divide e normaliza
        """
        # Features e r√≥tulos
        X = df[self.feature_names].values
        y = df['label'].values
        
        # Dividir dados
        X_train, X_test, y_train, y_test = train_test_split(
            X, y, test_size=0.3, random_state=42, stratify=y
        )
        
        # Para detec√ß√£o de anomalias, tipicamente treinamos apenas com dados normais
        X_train_normal = X_train[y_train == 0]
        
        # Normalizar os dados
        X_train_normal_scaled = self.scaler.fit_transform(X_train_normal)
        X_test_scaled = self.scaler.transform(X_test)
        
        return X_train_normal_scaled, X_test_scaled, y_test

print("Classe VibrationAnomalyDetector definida!")

## 3. Gera√ß√£o e Explora√ß√£o dos Dados

In [None]:
# Inicializar o detector
detector = VibrationAnomalyDetector()

# Gerar dados sint√©ticos
print("Gerando dados sint√©ticos de vibra√ß√£o...")
df = detector.generate_synthetic_data(n_normal=1000, n_anomaly=200)

print(f"\nDados gerados:")
print(f"- Total de amostras: {len(df)}")
print(f"- Amostras normais: {len(df[df['label']==0])}")
print(f"- Amostras an√¥malas: {len(df[df['label']==1])}")
print(f"- Porcentagem de anomalias: {df['label'].mean()*100:.1f}%")

# Mostrar primeiras linhas
print("\nPrimeiras 5 amostras:")
display(df.head())

## 4. An√°lise Explorat√≥ria dos Dados

In [None]:
# Estat√≠sticas descritivas
print("Estat√≠sticas descritivas por condi√ß√£o:")
print("\n=== DADOS NORMAIS ===")
display(df[df['condition']=='Normal'][detector.feature_names].describe())

print("\n=== DADOS AN√îMALOS ===")
display(df[df['condition']=='Anomalia'][detector.feature_names].describe())

In [None]:
# Visualiza√ß√£o da distribui√ß√£o dos dados
fig, axes = plt.subplots(3, 4, figsize=(20, 15))
axes = axes.ravel()

for i, feature in enumerate(detector.feature_names):
    # Histograma para cada feature
    df[df['condition']=='Normal'][feature].hist(alpha=0.7, label='Normal', bins=30, ax=axes[i])
    df[df['condition']=='Anomalia'][feature].hist(alpha=0.7, label='Anomalia', bins=30, ax=axes[i])
    axes[i].set_title(f'{feature}')
    axes[i].legend()
    axes[i].grid(True, alpha=0.3)

plt.tight_layout()
plt.suptitle('Distribui√ß√£o das Features por Condi√ß√£o', fontsize=16, y=1.02)
plt.show()

In [None]:
# Scatter plots para visualizar separa√ß√£o entre classes
fig, axes = plt.subplots(2, 2, figsize=(15, 12))

# Plot 1: Canal 1 - RMS vs Curtose
axes[0,0].scatter(df[df['condition']=='Normal']['Ch1_RMS'], 
                  df[df['condition']=='Normal']['Ch1_Kurtosis'], 
                  alpha=0.6, label='Normal', s=50)
axes[0,0].scatter(df[df['condition']=='Anomalia']['Ch1_RMS'], 
                  df[df['condition']=='Anomalia']['Ch1_Kurtosis'], 
                  alpha=0.8, label='Anomalia', s=50)
axes[0,0].set_xlabel('Canal 1 - RMS')
axes[0,0].set_ylabel('Canal 1 - Curtose')
axes[0,0].set_title('Canal 1: RMS vs Curtose')
axes[0,0].legend()
axes[0,0].grid(True, alpha=0.3)

# Plot 2: Canal 2 - RMS vs Desvio Padr√£o
axes[0,1].scatter(df[df['condition']=='Normal']['Ch2_RMS'], 
                  df[df['condition']=='Normal']['Ch2_StdDev'], 
                  alpha=0.6, label='Normal', s=50)
axes[0,1].scatter(df[df['condition']=='Anomalia']['Ch2_RMS'], 
                  df[df['condition']=='Anomalia']['Ch2_StdDev'], 
                  alpha=0.8, label='Anomalia', s=50)
axes[0,1].set_xlabel('Canal 2 - RMS')
axes[0,1].set_ylabel('Canal 2 - Desvio Padr√£o')
axes[0,1].set_title('Canal 2: RMS vs Desvio Padr√£o')
axes[0,1].legend()
axes[0,1].grid(True, alpha=0.3)

# Plot 3: Canal 3 - SNR vs THD
axes[1,0].scatter(df[df['condition']=='Normal']['Ch3_SNR'], 
                  df[df['condition']=='Normal']['Ch3_THD'], 
                  alpha=0.6, label='Normal', s=50)
axes[1,0].scatter(df[df['condition']=='Anomalia']['Ch3_SNR'], 
                  df[df['condition']=='Anomalia']['Ch3_THD'], 
                  alpha=0.8, label='Anomalia', s=50)
axes[1,0].set_xlabel('Canal 3 - SNR')
axes[1,0].set_ylabel('Canal 3 - THD')
axes[1,0].set_title('Canal 3: SNR vs THD')
axes[1,0].legend()
axes[1,0].grid(True, alpha=0.3)

# Plot 4: Correla√ß√£o entre canais
axes[1,1].scatter(df[df['condition']=='Normal']['Ch1_RMS'], 
                  df[df['condition']=='Normal']['Ch2_RMS'], 
                  alpha=0.6, label='Normal', s=50)
axes[1,1].scatter(df[df['condition']=='Anomalia']['Ch1_RMS'], 
                  df[df['condition']=='Anomalia']['Ch2_RMS'], 
                  alpha=0.8, label='Anomalia', s=50)
axes[1,1].set_xlabel('Canal 1 - RMS')
axes[1,1].set_ylabel('Canal 2 - RMS')
axes[1,1].set_title('Correla√ß√£o entre Canais: RMS')
axes[1,1].legend()
axes[1,1].grid(True, alpha=0.3)

plt.tight_layout()
plt.show()

## 5. Prepara√ß√£o dos Dados

In [None]:
# Preparar dados para treinamento
print("Preparando dados para treinamento...")
X_train_normal, X_test, y_test = detector.prepare_data(df)

print(f"\nDivis√£o dos dados:")
print(f"- Conjunto de treino (apenas normais): {X_train_normal.shape[0]} amostras")
print(f"- Conjunto de teste: {X_test.shape[0]} amostras")
print(f"- Features: {X_train_normal.shape[1]}")
print(f"- Anomalias no teste: {y_test.sum()} ({y_test.mean()*100:.1f}%)")

# Verificar normaliza√ß√£o
print(f"\nVerifica√ß√£o da normaliza√ß√£o (conjunto de treino):")
print(f"- M√©dia: {X_train_normal.mean(axis=0)[:3]:.4f}... (primeiras 3 features)")
print(f"- Desvio padr√£o: {X_train_normal.std(axis=0)[:3]:.4f}... (primeiras 3 features)")

## 6. Implementa√ß√£o dos Modelos

### 6.1 One-Class SVM

In [None]:
def train_one_class_svm(detector, X_train_normal):
    """
    Treina One-Class SVM para detec√ß√£o de anomalias
    """
    print("Treinando One-Class SVM...")
    
    # One-Class SVM
    oc_svm = OneClassSVM(nu=0.05, kernel='rbf', gamma='scale')
    oc_svm.fit(X_train_normal)
    
    detector.models['OneClassSVM'] = oc_svm
    print("‚úÖ Treinamento do One-Class SVM conclu√≠do.")
    
    # Informa√ß√µes do modelo
    print(f"   - Par√¢metro nu: {oc_svm.nu}")
    print(f"   - Kernel: {oc_svm.kernel}")
    print(f"   - Gamma: {oc_svm.gamma}")
    print(f"   - Vetores de suporte: {len(oc_svm.support_vectors_)}")

# Treinar One-Class SVM
train_one_class_svm(detector, X_train_normal)

### 6.2 Isolation Forest

In [None]:
def train_isolation_forest(detector, X_train_normal):
    """
    Treina Isolation Forest para detec√ß√£o de anomalias
    """
    print("Treinando Isolation Forest...")
    
    # Isolation Forest
    iso_forest = IsolationForest(contamination=0.1, random_state=42, n_estimators=100)
    iso_forest.fit(X_train_normal)
    
    detector.models['IsolationForest'] = iso_forest
    print("‚úÖ Treinamento do Isolation Forest conclu√≠do.")
    
    # Informa√ß√µes do modelo
    print(f"   - Contamina√ß√£o esperada: {iso_forest.contamination}")
    print(f"   - N√∫mero de √°rvores: {iso_forest.n_estimators}")
    print(f"   - Max samples: {iso_forest.max_samples}")

# Treinar Isolation Forest
train_isolation_forest(detector, X_train_normal)

### 6.3 Autoencoder Neural Network

In [None]:
def build_autoencoder(input_dim):
    """
    Constr√≥i rede neural autoencoder
    """
    # Encoder
    encoder = keras.Sequential([
        keras.layers.Dense(8, activation='relu', input_shape=(input_dim,), name='encoder_layer1'),
        keras.layers.Dense(4, activation='relu', name='encoder_layer2'),
        keras.layers.Dense(2, activation='relu', name='bottleneck')  # Camada gargalo
    ], name='encoder')
    
    # Decoder
    decoder = keras.Sequential([
        keras.layers.Dense(4, activation='relu', input_shape=(2,), name='decoder_layer1'),
        keras.layers.Dense(8, activation='relu', name='decoder_layer2'),
        keras.layers.Dense(input_dim, activation='linear', name='output')
    ], name='decoder')
    
    # Autoencoder
    autoencoder = keras.Sequential([encoder, decoder], name='autoencoder')
    autoencoder.compile(optimizer='adam', loss='mse', metrics=['mae'])
    
    return autoencoder, encoder, decoder

def train_autoencoder(detector, X_train_normal):
    """
    Treina autoencoder para detec√ß√£o de anomalias
    """
    print("Treinando Autoencoder...")
    
    # Construir e treinar autoencoder
    autoencoder, encoder, decoder = build_autoencoder(X_train_normal.shape[1])
    
    # Mostrar arquitetura
    print("\nArquitetura do Autoencoder:")
    autoencoder.summary()
    
    # Treinar apenas com dados normais
    history = autoencoder.fit(
        X_train_normal, X_train_normal,
        epochs=100,
        batch_size=32,
        validation_split=0.2,
        verbose=1,
        callbacks=[
            keras.callbacks.EarlyStopping(patience=10, restore_best_weights=True)
        ]
    )
    
    detector.models['Autoencoder'] = autoencoder
    detector.models['Encoder'] = encoder
    detector.models['Decoder'] = decoder
    
    print("‚úÖ Treinamento do Autoencoder conclu√≠do.")
    
    return history

# Treinar Autoencoder
history = train_autoencoder(detector, X_train_normal)

In [None]:
# Visualizar hist√≥rico de treinamento do Autoencoder
fig, axes = plt.subplots(1, 2, figsize=(15, 5))

# Loss
axes[0].plot(history.history['loss'], label='Treino', linewidth=2)
axes[0].plot(history.history['val_loss'], label='Valida√ß√£o', linewidth=2)
axes[0].set_title('Fun√ß√£o de Perda do Autoencoder')
axes[0].set_xlabel('√âpoca')
axes[0].set_ylabel('MSE Loss')
axes[0].legend()
axes[0].grid(True, alpha=0.3)

# MAE
axes[1].plot(history.history['mae'], label='Treino', linewidth=2)
axes[1].plot(history.history['val_mae'], label='Valida√ß√£o', linewidth=2)
axes[1].set_title('Erro Absoluto M√©dio do Autoencoder')
axes[1].set_xlabel('√âpoca')
axes[1].set_ylabel('MAE')
axes[1].legend()
axes[1].grid(True, alpha=0.3)

plt.tight_layout()
plt.show()

print(f"Perda final de treino: {history.history['loss'][-1]:.4f}")
print(f"Perda final de valida√ß√£o: {history.history['val_loss'][-1]:.4f}")

## 7. Predi√ß√µes e Avalia√ß√£o

In [None]:
def predict_anomalies(detector, X_test):
    """
    Prediz anomalias usando todos os modelos treinados
    """
    predictions = {}
    
    # Predi√ß√µes do One-Class SVM
    if 'OneClassSVM' in detector.models:
        print("Fazendo predi√ß√µes com One-Class SVM...")
        oc_pred = detector.models['OneClassSVM'].predict(X_test)
        # Converter -1 (anomalia) para 1, e 1 (normal) para 0
        predictions['OneClassSVM'] = (oc_pred == -1).astype(int)
        print(f"  Anomalias detectadas: {predictions['OneClassSVM'].sum()}")
    
    # Predi√ß√µes do Isolation Forest
    if 'IsolationForest' in detector.models:
        print("Fazendo predi√ß√µes com Isolation Forest...")
        iso_pred = detector.models['IsolationForest'].predict(X_test)
        # Converter -1 (anomalia) para 1, e 1 (normal) para 0
        predictions['IsolationForest'] = (iso_pred == -1).astype(int)
        print(f"  Anomalias detectadas: {predictions['IsolationForest'].sum()}")
    
    # Predi√ß√µes do Autoencoder
    if 'Autoencoder' in detector.models:
        print("Fazendo predi√ß√µes com Autoencoder...")
        # Reconstruir dados
        reconstructed = detector.models['Autoencoder'].predict(X_test, verbose=0)
        # Calcular erro de reconstru√ß√£o
        mse = np.mean(np.square(X_test - reconstructed), axis=1)
        # Usar threshold para classificar (percentil 95 dos erros de reconstru√ß√£o)
        threshold = np.percentile(mse, 95)
        predictions['Autoencoder'] = (mse > threshold).astype(int)
        print(f"  Threshold de erro: {threshold:.4f}")
        print(f"  Anomalias detectadas: {predictions['Autoencoder'].sum()}")
        
        # Armazenar erros de reconstru√ß√£o para an√°lise
        detector.reconstruction_errors = mse
        detector.threshold = threshold
    
    return predictions

# Fazer predi√ß√µes
print("Fazendo predi√ß√µes com todos os modelos...")
predictions = predict_anomalies(detector, X_test)
print(f"\nTotal de anomalias reais no teste: {y_test.sum()}")

## 8. Avalia√ß√£o Detalhada dos Modelos

In [None]:
def evaluate_models(y_true, predictions):
    """
    Avalia performance dos modelos
    """
    results = {}
    
    for model_name, y_pred in predictions.items():
        print(f"\n{'='*50}")
        print(f"üìä RESULTADOS DO {model_name.upper()}")
        print(f"{'='*50}")
        
        # Relat√≥rio de classifica√ß√£o
        report = classification_report(y_true, y_pred, target_names=['Normal', 'Anomalia'])
        print(report)
        
        # Matriz de confus√£o
        cm = confusion_matrix(y_true, y_pred)
        print(f"\nMatriz de Confus√£o:")
        print(f"         Predito")
        print(f"       Normal Anomalia")
        print(f"Normal   {cm[0,0]:4d}   {cm[0,1]:4d}")
        print(f"Anomalia {cm[1,0]:4d}   {cm[1,1]:4d}")
        
        # Calcular m√©tricas
        tn, fp, fn, tp = cm.ravel()
        accuracy = (tp + tn) / (tp + tn + fp + fn)
        precision = tp / (tp + fp) if (tp + fp) > 0 else 0
        recall = tp / (tp + fn) if (tp + fn) > 0 else 0
        f1 = 2 * (precision * recall) / (precision + recall) if (precision + recall) > 0 else 0
        specificity = tn / (tn + fp) if (tn + fp) > 0 else 0
        
        print(f"\nüìà M√©tricas Detalhadas:")
        print(f"   ‚Ä¢ Acur√°cia: {accuracy:.3f} ({accuracy*100:.1f}%)")
        print(f"   ‚Ä¢ Precis√£o: {precision:.3f} ({precision*100:.1f}%)")
        print(f"   ‚Ä¢ Recall (Sensibilidade): {recall:.3f} ({recall*100:.1f}%)")
        print(f"   ‚Ä¢ Especificidade: {specificity:.3f} ({specificity*100:.1f}%)")
        print(f"   ‚Ä¢ F1-Score: {f1:.3f}")
        
        results[model_name] = {
            'accuracy': accuracy,
            'precision': precision,
            'recall': recall,
            'specificity': specificity,
            'f1_score': f1,
            'confusion_matrix': cm,
            'tp': tp, 'tn': tn, 'fp': fp, 'fn': fn
        }
    
    return results

# Avaliar todos os modelos
results = evaluate_models(y_test, predictions)

## 9. Visualiza√ß√µes dos Resultados

In [None]:
# Compara√ß√£o visual dos modelos
fig, axes = plt.subplots(2, 2, figsize=(16, 12))

# Preparar dados para compara√ß√£o
model_names = list(results.keys())
metrics = ['accuracy', 'precision', 'recall', 'f1_score']
metric_labels = ['Acur√°cia', 'Precis√£o', 'Recall', 'F1-Score']

# Gr√°fico de barras comparativo
x = np.arange(len(model_names))
width = 0.2

for i, (metric, label) in enumerate(zip(metrics, metric_labels)):
    ax = axes[i//2, i%2]
    values = [results[model][metric] for model in model_names]
    bars = ax.bar(x, values, width=0.6, alpha=0.8)
    
    # Adicionar valores nas barras
    for bar, value in zip(bars, values):
        height = bar.get_height()
        ax.text(bar.get_x() + bar.get_width()/2., height + 0.01,
                f'{value:.3f}', ha='center', va='bottom', fontweight='bold')
    
    ax.set_title(f'{label} por Modelo', fontsize=14, fontweight='bold')
    ax.set_ylabel(label)
    ax.set_xticks(x)
    ax.set_xticklabels(model_names, rotation=45)
    ax.set_ylim(0, 1.1)
    ax.grid(True, alpha=0.3)

plt.tight_layout()
plt.show()

In [None]:
# Matriz de confus√£o visual
fig, axes = plt.subplots(1, 3, figsize=(18, 5))

for i, (model_name, result) in enumerate(results.items()):
    cm = result['confusion_matrix']
    
    # Heatmap da matriz de confus√£o
    sns.heatmap(cm, annot=True, fmt='d', cmap='Blues', 
                xticklabels=['Normal', 'Anomalia'],
                yticklabels=['Normal', 'Anomalia'],
                ax=axes[i], cbar_kws={'shrink': 0.8})
    
    axes[i].set_title(f'{model_name}\nAcur√°cia: {result["accuracy"]:.3f}', 
                      fontweight='bold')
    axes[i].set_ylabel('Valores Reais')
    axes[i].set_xlabel('Predi√ß√µes')

plt.tight_layout()
plt.show()

In [None]:
# An√°lise dos erros de reconstru√ß√£o do Autoencoder
if hasattr(detector, 'reconstruction_errors'):
    fig, axes = plt.subplots(1, 2, figsize=(15, 6))
    
    # Histograma dos erros de reconstru√ß√£o
    normal_errors = detector.reconstruction_errors[y_test == 0]
    anomaly_errors = detector.reconstruction_errors[y_test == 1]
    
    axes[0].hist(normal_errors, bins=30, alpha=0.7, label='Normal', density=True)
    axes[0].hist(anomaly_errors, bins=30, alpha=0.7, label='Anomalia', density=True)
    axes[0].axvline(detector.threshold, color='red', linestyle='--', 
                    label=f'Threshold ({detector.threshold:.4f})')
    axes[0].set_xlabel('Erro de Reconstru√ß√£o (MSE)')
    axes[0].set_ylabel('Densidade')
    axes[0].set_title('Distribui√ß√£o dos Erros de Reconstru√ß√£o')
    axes[0].legend()
    axes[0].grid(True, alpha=0.3)
    
    # Box plot dos erros
    data_for_box = [normal_errors, anomaly_errors]
    axes[1].boxplot(data_for_box, labels=['Normal', 'Anomalia'])
    axes[1].axhline(detector.threshold, color='red', linestyle='--', 
                    label=f'Threshold ({detector.threshold:.4f})')
    axes[1].set_ylabel('Erro de Reconstru√ß√£o (MSE)')
    axes[1].set_title('Box Plot dos Erros de Reconstru√ß√£o')
    axes[1].legend()
    axes[1].grid(True, alpha=0.3)
    
    plt.tight_layout()
    plt.show()
    
    print(f"Estat√≠sticas dos erros de reconstru√ß√£o:")
    print(f"Normal - M√©dia: {normal_errors.mean():.4f}, Desvio: {normal_errors.std():.4f}")
    print(f"Anomalia - M√©dia: {anomaly_errors.mean():.4f}, Desvio: {anomaly_errors.std():.4f}")

## 10. Resumo Final e Compara√ß√£o dos Modelos

In [None]:
# Tabela resumo
print("\n" + "="*80)
print("üéØ RESUMO FINAL - COMPARA√á√ÉO DOS MODELOS")
print("="*80)

# Criar DataFrame para compara√ß√£o
comparison_data = []
for model_name, result in results.items():
    comparison_data.append({
        'Modelo': model_name,
        'Acur√°cia': f"{result['accuracy']:.3f}",
        'Precis√£o': f"{result['precision']:.3f}",
        'Recall': f"{result['recall']:.3f}",
        'F1-Score': f"{result['f1_score']:.3f}",
        'Especificidade': f"{result['specificity']:.3f}"
    })

comparison_df = pd.DataFrame(comparison_data)
display(comparison_df)

# Identificar melhor modelo por m√©trica
print("\nüèÜ MELHORES MODELOS POR M√âTRICA:")
for metric in ['accuracy', 'precision', 'recall', 'f1_score']:
    best_model = max(results.keys(), key=lambda x: results[x][metric])
    best_value = results[best_model][metric]
    metric_name = {'accuracy': 'Acur√°cia', 'precision': 'Precis√£o', 
                   'recall': 'Recall', 'f1_score': 'F1-Score'}[metric]
    print(f"   ‚Ä¢ {metric_name}: {best_model} ({best_value:.3f})")

# An√°lise interpretativa
print("\n" + "="*80)
print("üìã AN√ÅLISE INTERPRETATIVA")
print("="*80)

print("\nüîç Caracter√≠sticas dos Modelos:")
print("""
‚Ä¢ ONE-CLASS SVM:
  - Funciona bem quando dados normais formam clusters compactos
  - Sens√≠vel ao ajuste de hiperpar√¢metros
  - Bom para identificar outliers

‚Ä¢ ISOLATION FOREST:
  - M√©todo ensemble usando florestas aleat√≥rias
  - Efetivo para dados de alta dimensionalidade
  - Menos sens√≠vel a hiperpar√¢metros

‚Ä¢ AUTOENCODER:
  - Abordagem de deep learning
  - Aprende representa√ß√£o comprimida dos dados normais
  - Erro de reconstru√ß√£o indica anomalias
""")

print("\nüí° Recomenda√ß√µes para Aplica√ß√£o Industrial:")
print("""
1. Para m√°xima detec√ß√£o de anomalias (recall): One-Class SVM
2. Para melhor balance geral: Isolation Forest
3. Para m√°xima precis√£o: Autoencoder (com ajuste de threshold)
4. Para produ√ß√£o: Considere ensemble dos tr√™s modelos
""")

## 11. Salvando Resultados

In [None]:
# Salvar resultados em arquivo
import pickle
import json
from datetime import datetime

# Criar timestamp
timestamp = datetime.now().strftime("%Y%m%d_%H%M%S")

# Salvar modelos
with open(f'models_vibration_anomaly_{timestamp}.pkl', 'wb') as f:
    pickle.dump({
        'models': detector.models,
        'scaler': detector.scaler,
        'feature_names': detector.feature_names
    }, f)

# Salvar resultados em JSON
results_json = {}
for model_name, result in results.items():
    results_json[model_name] = {
        'accuracy': float(result['accuracy']),
        'precision': float(result['precision']),
        'recall': float(result['recall']),
        'f1_score': float(result['f1_score']),
        'specificity': float(result['specificity'])
    }

with open(f'results_vibration_anomaly_{timestamp}.json', 'w') as f:
    json.dump(results_json, f, indent=2)

# Salvar dados para an√°lise posterior
df.to_csv(f'synthetic_vibration_data_{timestamp}.csv', index=False)

print(f"‚úÖ Resultados salvos com timestamp: {timestamp}")
print(f"   ‚Ä¢ Modelos: models_vibration_anomaly_{timestamp}.pkl")
print(f"   ‚Ä¢ Resultados: results_vibration_anomaly_{timestamp}.json")
print(f"   ‚Ä¢ Dados: synthetic_vibration_data_{timestamp}.csv")

## üéâ Conclus√£o

Este notebook implementou com sucesso um sistema completo de detec√ß√£o de anomalias para m√°quinas industriais usando dados de vibra√ß√£o de 3 eixos. 

### Principais Conquistas:

1. **Gera√ß√£o de Dados Realistas**: Criamos dados sint√©ticos que simulam padr√µes reais de vibra√ß√£o
2. **Extra√ß√£o de Features**: Implementamos 12 features relevantes em 3 canais
3. **M√∫ltiplos Algoritmos**: Comparamos One-Class SVM, Isolation Forest e Autoencoder
4. **Avalia√ß√£o Completa**: M√©tricas detalhadas e visualiza√ß√µes
5. **Aplicabilidade Industrial**: C√≥digo pronto para adapta√ß√£o a dados reais

### Pr√≥ximos Passos:

- Testar com dados reais de m√°quinas industriais
- Implementar ensemble dos modelos
- Adicionar monitoramento em tempo real
- Integrar com sistemas de manuten√ß√£o preditiva