# Gráficos mostrando a relação entre features

## 1. Importar Bibliotecas

Importe as bibliotecas necessárias para manipulação dos dados e geração dos gráficos.

In [None]:
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
import seaborn as sns

## 2. Carregar e Preparar Dados

Carregue o arquivo CSV, converta a coluna 'timestamp' para datetime e ajuste os tipos das colunas relevantes para garantir que os dados estejam prontos para análise.

In [None]:
csv_path = "../../../data/itu_415_processed.csv"
csv2_path = "../../../data/itu_693_processed.csv"

df415 = pd.read_csv(csv_path, low_memory=False)
df693 = pd.read_csv(csv2_path, low_memory=False)

# Ajustar tipos das colunas principais (se necessário)
for col in ['Eng_RPM', 'Bat_V', 'Char_V', 'Oil_P']:
    if col in df415.columns:
        df415[col] = pd.to_numeric(df415[col], errors='coerce')

for col in ['Eng_RPM', 'Bat_V', 'Char_V', 'Oil_P']:
    if col in df693.columns:
        df693[col] = pd.to_numeric(df693[col], errors='coerce')

## 3. Selecionar Features do CSV

Seleção das principais features para análise e visualização: 

* **Eng\_RPM** → Rotação do motor (RPM)
  Mede quantas rotações por minuto o motor está fazendo. Relaciona-se diretamente à carga e ao funcionamento da bomba.

* **Bat\_V** → Tensão da bateria (V)
  Mede a voltagem da bateria. Pode indicar estado de carga ou possíveis falhas elétricas.

* **Char\_V** → Tensão do alternador (V)
  Mede a tensão fornecida pelo alternador, responsável por carregar a bateria e alimentar o sistema elétrico.

* **Oil\_P** → Pressão do óleo do motor (mca)
  Importante para lubrificação do motor. Queda na pressão pode indicar falha iminente.

* **Cool\_T** → Temperatura do líquido de arrefecimento (°C)
  Mede a temperatura do fluido de resfriamento do motor. Um aumento pode indicar superaquecimento.

* **Fuel\_L** → Nível de combustível (%)
  Mede quanto combustível resta no tanque. Pode cair gradualmente conforme o motor opera.

* **Oil\_L** → Nível de óleo do motor (%)
  Mede a quantidade de óleo lubrificante disponível. Tendência de queda ao longo do tempo.

In [None]:
# Features selecionadas
selected_features = ['Eng_RPM', 'Bat_V', 'Char_V', 'Oil_P', 'Cool_T', 'Fuel_L', 'Oil_L']
ranges = [[0, 2000], [28, 28.5], [26, 28], [300, 800], [0, 100], [0, 120], [0, 100]]

# Filtrar apenas as colunas de interesse e timestamp
df415_selected = df415[['timestamp'] + selected_features].copy()
df693_selected = df693[['timestamp'] + selected_features].copy()

df415_selected['timestamp'] = pd.to_datetime(df415_selected['timestamp'])
df693_selected['timestamp'] = pd.to_datetime(df693_selected['timestamp'])

for feature in selected_features:
    df415_selected = df415_selected[df415_selected[feature] > 0]
df415_selected = df415_selected.reset_index(drop=True)

for feature in selected_features:
    df693_selected = df693_selected[df693_selected[feature] > 0]
df693_selected = df693_selected.reset_index(drop=True)

## 4. Gráficos de Séries Temporais para Features Selecionadas

**Gráfico 1:** Séries temporais das features selecionadas da bomba hidráulica ITU 415

**Gráfico 2:** Séries temporais das features selecionadas da bomba hidráulica ITU 693

**Gráfico 3:** Séries temporais das features selecionadas da bomba hidráulica ITU 415 e ITU 693

**Gráfico 4:** Gráfico comparando as médias de valores das features selecionadas das bombas ITU 415 e ITU 693

In [None]:
colors = ["blue", "red", "green", "purple", "gray", "pink", "orange"]

plt.figure(figsize=(16, 10))
for i, feature in enumerate(selected_features):
    plt.subplot(len(selected_features), 1, i+1)
    plt.plot(df415_selected['timestamp'], df415_selected[feature], label=feature)
    plt.ylabel(feature)
    plt.ylim(ranges[i][0], ranges[i][1])
    plt.gca().lines[-1].set_color(f'tab:{colors[i]}')
    
    # Calcular e marcar o máximo e mínimo (sem legenda, com valor)
    max_val = df415_selected[feature].max()
    min_val = df415_selected[feature].min()
    max_idx = df415_selected[feature].idxmax()
    min_idx = df415_selected[feature].idxmin()
    plt.scatter(df415_selected['timestamp'][max_idx], max_val, color='red', marker='o')
    plt.text(df415_selected['timestamp'][max_idx], max_val, f'{max_val:.2f}', color='red', va='bottom', ha='right')
    plt.scatter(df415_selected['timestamp'][min_idx], min_val, color='blue', marker='o')
    plt.text(df415_selected['timestamp'][min_idx], min_val, f'{min_val:.2f}', color='blue', va='top', ha='right')
    
    plt.legend()
    plt.grid(alpha=0.3)
plt.xlabel('Timestamp')
plt.suptitle('Séries Temporais das Features Selecionadas - ITU 415')
plt.tight_layout(rect=[0, 0, 1, 0.97])
plt.show()

In [None]:
colors = ["blue", "red", "green", "purple", "gray", "pink", "orange"]

plt.figure(figsize=(16, 10))
for i, feature in enumerate(selected_features):
    plt.subplot(len(selected_features), 1, i+1)
    plt.plot(df693_selected['timestamp'], df693_selected[feature], label=feature)
    plt.ylabel(feature)
    # plt.ylim(ranges[i][0], ranges[i][1])
    plt.gca().lines[-1].set_color(f'tab:{colors[i]}')
    
    # Calcular e marcar o máximo e mínimo (sem legenda, com valor)
    max_val = df693_selected[feature].max()
    min_val = df693_selected[feature].min()
    max_idx = df693_selected[feature].idxmax()
    min_idx = df693_selected[feature].idxmin()
    plt.scatter(df693_selected['timestamp'][max_idx], max_val, color='red', marker='o')
    plt.text(df693_selected['timestamp'][max_idx], max_val, f'{max_val:.2f}', color='red', va='bottom', ha='right')
    plt.scatter(df693_selected['timestamp'][min_idx], min_val, color='blue', marker='o')
    plt.text(df693_selected['timestamp'][min_idx], min_val, f'{min_val:.2f}', color='blue', va='top', ha='right')
    
    plt.legend()
    plt.grid(alpha=0.3)
plt.xlabel('Timestamp')
plt.suptitle('Séries Temporais das Features Selecionadas - ITU 693')
plt.tight_layout(rect=[0, 0, 1, 0.97])
plt.show()

In [None]:
# Gráfico comparando os valores das principais features entre ITU-415 e ITU-693 (sem média móvel)

colors = ["blue", "red", "green", "purple", "gray", "pink", "orange"]

plt.figure(figsize=(16, 10))
for i, feature in enumerate(selected_features):
    plt.subplot(len(selected_features), 1, i+1)
    plt.plot(df415_selected['timestamp'], df415_selected[feature], label=f'{feature} ITU-415', color='blue', alpha=0.7)
    plt.plot(df693_selected['timestamp'], df693_selected[feature], label=f'{feature} ITU-693', color='red', alpha=0.7)
    plt.ylabel(feature)
    plt.legend()
    plt.grid(alpha=0.3)
plt.xlabel('Timestamp')
plt.suptitle('Comparação das Features Selecionadas - ITU-415 vs ITU-693 (sem média móvel)')
plt.tight_layout(rect=[0, 0, 1, 0.97])
plt.show()

In [None]:
# Gráfico de barras individuais para cada feature, alinhados horizontalmente (em uma linha)

plt.figure(figsize=(18, 2 * len(selected_features)))
for i, feature in enumerate(selected_features):
    plt.subplot(1, len(selected_features), i+1)
    mean_415 = df415_selected[feature].mean()
    mean_693 = df693_selected[feature].mean()
    plt.bar(['ITU-415', 'ITU-693'], [mean_415, mean_693], color=['blue', 'red'])
    plt.ylabel('Valor médio')
    plt.title(feature)
    plt.grid(axis='y', alpha=0.3)
    plt.ylim(0,
             1800 if feature == "Eng_RPM" else 600
             if feature == "Oil_P" else 100
             if feature == "Fuel_L" or feature == "Cool_T" else 60)
# plt.tight_layout()
plt.suptitle("Gráfico comparando as médias de valores das features selecionadas das bombas ITU 415 e ITU 693")
plt.show()

## 5. Gerar Gráficos de Correlação entre Features Selecionadas

Visualize as correlações entre as features selecionadas usando scatter plots e heatmaps.

In [None]:
# Normalizar valores para comparação
df_norm = df415_selected.copy()
for feature in selected_features:
    min_val = df_norm[feature].min()
    max_val = df_norm[feature].max()
    df_norm[feature + '_norm'] = (df_norm[feature] - min_val) / (max_val - min_val)

# Scatter plot: Eng_RPM vs Bat_V
plt.figure(figsize=(8, 6))
plt.scatter(df_norm['Eng_RPM_norm'], df_norm['Bat_V_norm'], alpha=0.5)
plt.xlabel('Eng_RPM (normalizado)')
plt.ylabel('Bat_V (normalizado)')
plt.title('Correlação entre Eng_RPM e Bat_V')
plt.grid(alpha=0.3)
plt.show()

# Heatmap de correlação
corr = df415_selected[selected_features].corr()
sns.heatmap(corr, annot=True, cmap='coolwarm')
plt.title('Heatmap de Correlação entre Features Selecionadas')
plt.show()