In [7]:
# Célula 1: Configuração e Dados Falsos
import pandas as pd
import numpy as np
import warnings
warnings.filterwarnings('ignore') # Esconde avisos chatos

# Bibliotecas de IA
from sklearn.model_selection import train_test_split
from sklearn.ensemble import RandomForestClassifier
from sklearn.preprocessing import OneHotEncoder
from sklearn.compose import ColumnTransformer
from sklearn.pipeline import Pipeline
from sklearn.impute import SimpleImputer

# Gerando dados de voos falsos para testar
print("✈️ Gerando dados de simulação...")
np.random.seed(42)
n_samples = 3000

data = {
    'companhia': np.random.choice(['AZUL', 'GOL', 'LATAM', 'VOEPASS'], n_samples),
    'origem': np.random.choice(['GRU', 'GIG', 'BSB', 'CNF', 'VCP'], n_samples),
    'destino': np.random.choice(['MIA', 'LIS', 'EZE', 'JFK', 'OPO'], n_samples),
    'data_voo': pd.date_range(start='2025-01-01', periods=n_samples, freq='h'),
    'distancia_km': np.random.randint(400, 10000, n_samples),
    'atrasado': np.random.choice([0, 1], n_samples, p=[0.7, 0.3]) # 0 = Pontual, 1 = Atrasado
}

df = pd.DataFrame(data)

# Tratando a data (separando hora e dia)
df['hora'] = df['data_voo'].dt.hour
df['dia_semana'] = df['data_voo'].dt.dayofweek
df['mes'] = df['data_voo'].dt.month

print("✅ Dados prontos!")
display(df.head())

✈️ Gerando dados de simulação...
✅ Dados prontos!


Unnamed: 0,companhia,origem,destino,data_voo,distancia_km,atrasado,hora,dia_semana,mes
0,LATAM,GIG,OPO,2025-01-01 00:00:00,8177,0,0,2,1
1,VOEPASS,CNF,LIS,2025-01-01 01:00:00,4632,1,1,2,1
2,AZUL,VCP,JFK,2025-01-01 02:00:00,6919,0,2,2,1
3,LATAM,VCP,EZE,2025-01-01 03:00:00,2177,0,3,2,1
4,LATAM,GIG,EZE,2025-01-01 04:00:00,1622,0,4,2,1


In [8]:
# Célula 2: Treinando o Modelo
# Separar dados (X) do resultado (y)
X = df[['companhia', 'origem', 'destino', 'distancia_km', 'hora', 'dia_semana', 'mes']]
y = df['atrasado']

# Configurar a transformação dos dados (Texto -> Número)
categorical_features = ['companhia', 'origem', 'destino']
numerical_features = ['distancia_km', 'hora', 'dia_semana', 'mes']

preprocessor = ColumnTransformer(
    transformers=[
        ('num', SimpleImputer(strategy='median'), numerical_features),
        ('cat', OneHotEncoder(handle_unknown='ignore'), categorical_features)
    ])

# Criar o Pipeline (Receita completa)
modelo = Pipeline(steps=[
    ('preprocessor', preprocessor),
    ('classifier', RandomForestClassifier(n_estimators=50, random_state=42))
])

# Treinar
print("⏳ Treinando a IA...")
modelo.fit(X, y)
print("✅ Modelo treinado com sucesso!")

⏳ Treinando a IA...
✅ Modelo treinado com sucesso!


In [9]:
# Célula 3: Baixar o Modelo
import joblib
from google.colab import files

# Salva o arquivo no Google Colab
joblib.dump(modelo, 'flight_model.joblib')
print("Arquivo salvo no disco virtual.")

# Baixa para o seu PC (Vai aparecer uma janela de download)
files.download('flight_model.joblib')

Arquivo salvo no disco virtual.


<IPython.core.display.Javascript object>

<IPython.core.display.Javascript object>