# Classifica√ß√£o de Tipos de Vias - Notebook Interativo

Este notebook permite explorar interativamente os dados e resultados do projeto de classifica√ß√£o de vias.

## Conte√∫do
1. Carregamento e Explora√ß√£o dos Dados
2. Visualiza√ß√£o dos Dados Brutos
3. An√°lise dos Dados Organizados
4. Treinamento de Modelos
5. An√°lise de Resultados

In [None]:
# Importa√ß√µes
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
import seaborn as sns
from sklearn.model_selection import train_test_split
from sklearn.preprocessing import StandardScaler, LabelEncoder
from sklearn.ensemble import RandomForestClassifier
from sklearn.metrics import classification_report, confusion_matrix

# Configura√ß√µes
sns.set_style('whitegrid')
plt.rcParams['figure.figsize'] = (12, 6)
%matplotlib inline

## 1. Carregamento dos Dados Brutos

In [None]:
# Carrega dados brutos
rua_asfalto = pd.read_csv('dados/rua_asfalto.csv')
cimento = pd.read_csv('dados/cimento_utinga.csv')
terra = pd.read_csv('dados/terra_batida.csv')

print("Rua/Asfalto:", rua_asfalto.shape)
print("Cimento:", cimento.shape)
print("Terra Batida:", terra.shape)

In [None]:
# Visualiza primeiras linhas
print("=== Rua/Asfalto ===")
display(rua_asfalto.head())

print("\n=== Estat√≠sticas ===")
display(rua_asfalto.describe())

## 2. Visualiza√ß√£o dos Sinais

In [None]:
# Plota s√©ries temporais
fig, axes = plt.subplots(3, 1, figsize=(15, 10))

# Rua/Asfalto
sample = rua_asfalto.dropna().head(1000)
axes[0].plot(sample['relative_time'], sample['LinearAccelerometerSensor'], label='Linear', alpha=0.7)
axes[0].plot(sample['relative_time'], sample['AccX'], label='AccX', alpha=0.7)
axes[0].plot(sample['relative_time'], sample['AccY'], label='AccY', alpha=0.7)
axes[0].set_title('Rua/Asfalto', fontsize=14, fontweight='bold')
axes[0].set_ylabel('Acelera√ß√£o (m/s¬≤)')
axes[0].legend()
axes[0].grid(alpha=0.3)

# Cimento
sample = cimento.dropna().head(1000)
axes[1].plot(sample['relative_time'], sample['LinearAccelerometerSensor'], label='Linear', alpha=0.7)
axes[1].plot(sample['relative_time'], sample['AccX'], label='AccX', alpha=0.7)
axes[1].plot(sample['relative_time'], sample['AccY'], label='AccY', alpha=0.7)
axes[1].set_title('Cimento Pavimentado', fontsize=14, fontweight='bold')
axes[1].set_ylabel('Acelera√ß√£o (m/s¬≤)')
axes[1].legend()
axes[1].grid(alpha=0.3)

# Terra
sample = terra.dropna().head(1000)
axes[2].plot(sample['relative_time'], sample['LinearAccelerometerSensor'], label='Linear', alpha=0.7)
axes[2].plot(sample['relative_time'], sample['AccX'], label='AccX', alpha=0.7)
axes[2].plot(sample['relative_time'], sample['AccY'], label='AccY', alpha=0.7)
axes[2].set_title('Terra Batida', fontsize=14, fontweight='bold')
axes[2].set_xlabel('Tempo (ms)')
axes[2].set_ylabel('Acelera√ß√£o (m/s¬≤)')
axes[2].legend()
axes[2].grid(alpha=0.3)

plt.tight_layout()
plt.show()

## 3. Carregamento dos Dados Organizados

In [None]:
# Carrega dados organizados (processados)
dados_org = pd.read_csv('resultados/dados_processados/dados_organizados.csv')

print("Shape:", dados_org.shape)
print("\nColunas:", list(dados_org.columns[:10]), '...')
print("\nDistribui√ß√£o das classes:")
print(dados_org['Classe'].value_counts())

In [None]:
# Visualiza primeiras features
display(dados_org.head())

In [None]:
# Estat√≠sticas das features
display(dados_org.describe())

## 4. Visualiza√ß√£o da Distribui√ß√£o das Features

In [None]:
# Boxplot de algumas features por classe
features_to_plot = ['S1', 'S2', 'S3', 'S4', 'S5', 'S6']

fig, axes = plt.subplots(2, 3, figsize=(18, 10))
axes = axes.flatten()

for idx, feature in enumerate(features_to_plot):
    dados_org.boxplot(column=feature, by='Classe', ax=axes[idx])
    axes[idx].set_title(f'Distribui√ß√£o de {feature} por Classe')
    axes[idx].set_xlabel('Classe')
    axes[idx].set_ylabel(feature)

plt.suptitle('')
plt.tight_layout()
plt.show()

## 5. Treinamento R√°pido de um Modelo

In [None]:
# Prepara dados
X = dados_org.drop('Classe', axis=1)
y = dados_org['Classe']

# Codifica labels
le = LabelEncoder()
y_encoded = le.fit_transform(y)

# Divide dados
X_train, X_test, y_train, y_test = train_test_split(
    X, y_encoded, test_size=0.3, random_state=42, stratify=y_encoded
)

# Normaliza
scaler = StandardScaler()
X_train_scaled = scaler.fit_transform(X_train)
X_test_scaled = scaler.transform(X_test)

print("Dados preparados!")
print(f"Treino: {X_train_scaled.shape}")
print(f"Teste: {X_test_scaled.shape}")

In [None]:
# Treina Random Forest
rf = RandomForestClassifier(n_estimators=100, random_state=42, n_jobs=-1)
rf.fit(X_train_scaled, y_train)

# Predi√ß√µes
y_pred = rf.predict(X_test_scaled)

# Acur√°cia
accuracy = rf.score(X_test_scaled, y_test)
print(f"\nAcur√°cia do Random Forest: {accuracy:.4f}")

In [None]:
# Relat√≥rio de classifica√ß√£o
print("\nRelat√≥rio de Classifica√ß√£o:")
print(classification_report(y_test, y_pred, target_names=le.classes_))

## 6. Matriz de Confus√£o

In [None]:
# Matriz de confus√£o
cm = confusion_matrix(y_test, y_pred)

plt.figure(figsize=(10, 8))
sns.heatmap(cm, annot=True, fmt='d', cmap='Blues',
           xticklabels=le.classes_,
           yticklabels=le.classes_,
           cbar_kws={'label': 'Contagem'})
plt.title('Matriz de Confus√£o - Random Forest', fontsize=14, fontweight='bold')
plt.ylabel('Classe Verdadeira', fontsize=12)
plt.xlabel('Classe Predita', fontsize=12)
plt.tight_layout()
plt.show()

## 7. Import√¢ncia das Features

In [None]:
# Import√¢ncia das features
feature_importance = pd.DataFrame({
    'Feature': X.columns,
    'Import√¢ncia': rf.feature_importances_
}).sort_values('Import√¢ncia', ascending=False)

# Top 20 features
top_features = feature_importance.head(20)

plt.figure(figsize=(12, 8))
plt.barh(top_features['Feature'], top_features['Import√¢ncia'])
plt.xlabel('Import√¢ncia', fontsize=12, fontweight='bold')
plt.ylabel('Feature', fontsize=12, fontweight='bold')
plt.title('Top 20 Features Mais Importantes', fontsize=14, fontweight='bold')
plt.gca().invert_yaxis()
plt.grid(axis='x', alpha=0.3)
plt.tight_layout()
plt.show()

In [None]:
# Tabela com top features
display(feature_importance.head(20))

## 8. An√°lise dos Resultados Salvos

In [None]:
# Carrega compara√ß√£o de modelos
comparacao = pd.read_csv('resultados/modelos/comparacao_modelos.csv')
display(comparacao)

In [None]:
# Gr√°fico de compara√ß√£o
fig, ax = plt.subplots(figsize=(12, 6))

x = np.arange(len(comparacao))
width = 0.2

ax.bar(x - 1.5*width, comparacao['Acur√°cia'], width, label='Acur√°cia')
ax.bar(x - 0.5*width, comparacao['Precis√£o'], width, label='Precis√£o')
ax.bar(x + 0.5*width, comparacao['Recall'], width, label='Recall')
ax.bar(x + 1.5*width, comparacao['F1-Score'], width, label='F1-Score')

ax.set_xlabel('Modelo', fontsize=12, fontweight='bold')
ax.set_ylabel('Score', fontsize=12, fontweight='bold')
ax.set_title('Compara√ß√£o de Desempenho dos Modelos', fontsize=14, fontweight='bold')
ax.set_xticks(x)
ax.set_xticklabels(comparacao['Modelo'], rotation=45, ha='right')
ax.legend()
ax.grid(axis='y', alpha=0.3)
ax.set_ylim(0.75, 1.0)

plt.tight_layout()
plt.show()

## 9. Experimentos Personalizados

Use as c√©lulas abaixo para seus pr√≥prios experimentos!

In [None]:
# Sua experimenta√ß√£o aqui

## 10. An√°lise Comparativa das Vias

Agora vamos analisar as caracter√≠sticas de cada tipo de via.

In [None]:
# Estat√≠sticas por tipo de via
print("=== ESTAT√çSTICAS COMPARATIVAS ===\n")

vias = {
    'Rua/Asfalto': rua_asfalto,
    'Cimento Pavimentado': cimento,
    'Terra Batida': terra
}

for nome, df in vias.items():
    sensor = df['LinearAccelerometerSensor']
    print(f"{nome}:")
    print(f"  M√©dia: {sensor.mean():.3f} m/s¬≤")
    print(f"  Desvio Padr√£o: {sensor.std():.3f} m/s¬≤")
    print(f"  M√≠nimo: {sensor.min():.3f} m/s¬≤")
    print(f"  M√°ximo: {sensor.max():.3f} m/s¬≤")
    print(f"  Amostras: {len(df):,}")
    print()

In [None]:
# Gr√°fico comparativo de vibra√ß√µes
fig, (ax1, ax2) = plt.subplots(1, 2, figsize=(16, 6))

# Gr√°fico 1: M√©dia e desvio padr√£o
nomes = list(vias.keys())
medias = [vias[nome]['LinearAccelerometerSensor'].mean() for nome in nomes]
desvios = [vias[nome]['LinearAccelerometerSensor'].std() for nome in nomes]

cores = ['#2E86AB', '#A23B72', '#F18F01']
bars = ax1.bar(range(len(nomes)), medias, color=cores, alpha=0.7, edgecolor='black', linewidth=2)
ax1.set_xticks(range(len(nomes)))
ax1.set_xticklabels(nomes, rotation=0)
ax1.set_ylabel('Acelera√ß√£o M√©dia (m/s¬≤)', fontsize=12)
ax1.set_title('Compara√ß√£o de Acelera√ß√£o M√©dia', fontsize=14, fontweight='bold')
ax1.grid(axis='y', alpha=0.3)

# Adicionar valores
for bar, val in zip(bars, medias):
    ax1.text(bar.get_x() + bar.get_width()/2., val + 0.02,
            f'{val:.3f}', ha='center', va='bottom', fontsize=11, fontweight='bold')

# Gr√°fico 2: Desvio padr√£o
bars = ax2.bar(range(len(nomes)), desvios, color=cores, alpha=0.7, edgecolor='black', linewidth=2)
ax2.set_xticks(range(len(nomes)))
ax2.set_xticklabels(nomes, rotation=0)
ax2.set_ylabel('Desvio Padr√£o (m/s¬≤)', fontsize=12)
ax2.set_title('Compara√ß√£o de Variabilidade', fontsize=14, fontweight='bold')
ax2.grid(axis='y', alpha=0.3)

# Adicionar valores
for bar, val in zip(bars, desvios):
    ax2.text(bar.get_x() + bar.get_width()/2., val + 0.02,
            f'{val:.3f}', ha='center', va='bottom', fontsize=11, fontweight='bold')

plt.tight_layout()
plt.show()

print("\nüí° Interpreta√ß√£o:")
print("- Menor m√©dia = mais confort√°vel")
print("- Menor desvio padr√£o = mais est√°vel")

In [None]:
# Visualizar gr√°ficos comparativos salvos
from IPython.display import Image, display
import os

print("=== GR√ÅFICOS COMPARATIVOS GERADOS ===\n")

comparacoes_path = 'resultados/comparacoes/'

if os.path.exists(comparacoes_path):
    graficos = sorted([f for f in os.listdir(comparacoes_path) if f.endswith('.png')])
    
    print(f"Total de gr√°ficos dispon√≠veis: {len(graficos)}\n")
    
    # Mostrar alguns gr√°ficos principais
    principais = [
        '01_radar_caracteristicas.png',
        '02_vibracoes_comparativas.png',
        '11_resumo_visual_consolidado.png'
    ]
    
    for grafico in principais:
        if grafico in graficos:
            print(f"üìä {grafico}")
            display(Image(filename=os.path.join(comparacoes_path, grafico)))
            print("\n" + "="*80 + "\n")
else:
    print("‚ö†Ô∏è Pasta de compara√ß√µes n√£o encontrada.")
    print("Execute o script: python visualizar_comparacoes.py")

## 11. An√°lise de Custos e Recomenda√ß√µes

Vamos analisar os aspectos pr√°ticos de cada tipo de via.

In [None]:
# An√°lise de custos de manuten√ß√£o
custos_anuais = {
    'Rua/Asfalto': 530,
    'Cimento Pavimentado': 1050,
    'Terra Batida': 2200
}

print("=== CUSTOS DE MANUTEN√á√ÉO ANUAL (1000 km) ===\n")

for via, custo in custos_anuais.items():
    print(f"{via}: R$ {custo:,.2f}")

print(f"\nüí∞ Economia usando Asfalto vs Terra: R$ {custos_anuais['Terra Batida'] - custos_anuais['Rua/Asfalto']:,.2f}/ano")

# Gr√°fico
fig, ax = plt.subplots(figsize=(10, 6))
cores = ['#2E86AB', '#A23B72', '#F18F01']
bars = ax.bar(custos_anuais.keys(), custos_anuais.values(), color=cores, alpha=0.7, edgecolor='black', linewidth=2)

# Destacar o mais econ√¥mico
bars[0].set_edgecolor('gold')
bars[0].set_linewidth(4)

for bar, (via, custo) in zip(bars, custos_anuais.items()):
    ax.text(bar.get_x() + bar.get_width()/2., custo + 50,
            f'R$ {custo:,.0f}', ha='center', va='bottom', fontsize=12, fontweight='bold')

ax.set_ylabel('Custo Anual (R$)', fontsize=12)
ax.set_title('Compara√ß√£o de Custos de Manuten√ß√£o', fontsize=14, fontweight='bold')
ax.grid(axis='y', alpha=0.3)
plt.xticks(rotation=15)
plt.tight_layout()
plt.show()

In [None]:
# Recomenda√ß√µes por perfil de ciclista
print("=== RECOMENDA√á√ïES POR PERFIL DE CICLISTA ===\n")

perfis = {
    'Ciclista Urbano/Commuter': {
        'Asfalto': 95,
        'Cimento': 5,
        'Terra': 0,
        'Motivo': 'R√°pido, eficiente, baixa manuten√ß√£o'
    },
    'Fitness/Sa√∫de': {
        'Asfalto': 80,
        'Cimento': 10,
        'Terra': 10,
        'Motivo': 'Longas dist√¢ncias, treino constante'
    },
    'Recreativo/Lazer': {
        'Asfalto': 30,
        'Cimento': 50,
        'Terra': 20,
        'Motivo': 'Seguran√ßa, variedade, fam√≠lia'
    },
    'Mountain Biker': {
        'Asfalto': 20,
        'Cimento': 0,
        'Terra': 80,
        'Motivo': 'Aventura, t√©cnica, natureza'
    },
    'Competitivo/Speed': {
        'Asfalto': 95,
        'Cimento': 5,
        'Terra': 0,
        'Motivo': 'Velocidade m√°xima, performance'
    },
    'Fam√≠lia/Crian√ßas': {
        'Asfalto': 20,
        'Cimento': 80,
        'Terra': 0,
        'Motivo': 'Seguran√ßa, longe de carros'
    }
}

for perfil, dados in perfis.items():
    print(f"üìç {perfil}:")
    print(f"   Distribui√ß√£o: {dados['Asfalto']}% Asfalto, {dados['Cimento']}% Cimento, {dados['Terra']}% Terra")
    print(f"   Motivo: {dados['Motivo']}")
    print()

## 12. Conclus√µes Finais

Resumo dos principais insights do projeto.

In [None]:
print("="*80)
print("üèÜ CONCLUS√ïES DO PROJETO - CLASSIFICA√á√ÉO DE TIPOS DE VIAS")
print("="*80)

print("\nüìä DADOS COLETADOS:")
print(f"   ‚Ä¢ Total de amostras: {sum([len(df) for df in vias.values()]):,}")
print(f"   ‚Ä¢ Rua/Asfalto: {len(rua_asfalto):,} amostras")
print(f"   ‚Ä¢ Cimento: {len(cimento):,} amostras")
print(f"   ‚Ä¢ Terra: {len(terra):,} amostras")

print("\nü§ñ MODELOS TREINADOS:")
print(f"   ‚Ä¢ 8 algoritmos de Machine Learning")
print(f"   ‚Ä¢ Melhor modelo: Random Forest (94.58% acur√°cia)")
print(f"   ‚Ä¢ Features extra√≠das: 62 (tempo + frequ√™ncia)")
print(f"   ‚Ä¢ Janela de segmenta√ß√£o: 100 amostras, 50% overlap")

print("\nü•á CLASSIFICA√á√ÉO POR VIA:")
print(f"   ‚Ä¢ Asfalto: 100% acur√°cia (padr√£o perfeito)")
print(f"   ‚Ä¢ Cimento: 87% acur√°cia")
print(f"   ‚Ä¢ Terra: 88% acur√°cia")

print("\nüí° INSIGHTS PRINCIPAIS:")
print(f"   ‚úÖ Asfalto: Melhor em conforto, velocidade e custo")
print(f"   ‚öñÔ∏è  Cimento: Equil√≠brio entre seguran√ßa e custo")
print(f"   üèîÔ∏è  Terra: Ideal para aventura e desenvolvimento t√©cnico")

print("\nüéØ RECOMENDA√á√ÉO GERAL:")
print(f"   70% Asfalto + 20% Cimento + 10% Terra")

print("\nüìÅ DOCUMENTA√á√ÉO:")
print(f"   ‚Ä¢ ANALISE_COMPARATIVA_VIAS.md - An√°lise completa")
print(f"   ‚Ä¢ resultados/comparacoes/ - 11 gr√°ficos")
print(f"   ‚Ä¢ RELATORIO_TRABALHO.md - Metodologia t√©cnica")

print("\n" + "="*80)
print("‚ú® PROJETO COMPLETO EM N√çVEL DE MESTRADO ‚ú®")
print("="*80)

## 13. Experimentos Personalizados

Use as c√©lulas abaixo para realizar suas pr√≥prias an√°lises e experimentos!

In [None]:
# Espa√ßo livre para experimenta√ß√£o
# Exemplo: testar outros hiperpar√¢metros, visualiza√ß√µes, etc.

# Dica: todas as vari√°veis j√° carregadas est√£o dispon√≠veis:
# - rua_asfalto, cimento, terra (dados brutos)
# - dados_org (dados processados com features)
# - X_train_scaled, X_test_scaled (dados normalizados)
# - rf (modelo Random Forest treinado)
# - comparacao (resultados de todos os modelos)