## Relatório de Modelagem e Avaliação de Performance – Semana 04 (DS4)


**Detalhes do Projeto**
*   **Responsáveis:** Amélia e Ana, Time DS (Liderança: Helena)
*   **Repositório:** [Projeto FlightOnTime](https://github.com/LaboraDev/hackathon_one_flightOnTime/tree/main)
*   **Conformidade:** Processos de treino respeitando a cronologia dos dados (Split Temporal).
*  **Notebook Rastreável:** [Consolidado_S03_splitTemporal.ipynb](https://github.com/LaboraDev/hackathon_one_flightOnTime/blob/main/notebooks/semana_05/Consolidado_S03_splitTemporal.ipynb)
*   **Eficiência Técnica:** Esse script concentra a lógica de treinamento, validação e otimização, tornando o processo replicável e pronto para integração futura em APIs ou dashboards. [Pipeline automatizado](https://github.com/LaboraDev/hackathon_one_flightOnTime/blob/main/notebooks/semana03/script.py)
*   **Status:** Final (Pronto para Entrega) | **Data:** 16/01/2026


***

##1. Visão Geral

Na Semana 04, evoluímos o projeto para a escolha de um algoritmo com
alta performance. O objetivo foi selecionar e refinar o melhor modelo para prever o
atraso de voos baseado no critério de desempenho pontual (OT-P). Após testar arquiteturas como Random Forest
e LightGBM, o modelo XGBoost destacou-se pela robustez técnica, sendo validado
através de uma estratégia que simula a realidade operacional da aviação,
aprendendo com o passado para prever o futuro.
[In[15-17]](https://github.com/LaboraDev/hackathon_one_flightOnTime/blob/main/notebooks/semana_05/Consolidado_S03_splitTemporal.ipynb)

***

##2. Dicionário de Terminologia Técnica
Para garantir a compreensão de todos, usamos as seguintes definições:
- **[OnTime Performance(OTP)](https://www.cirium.com/resources/on-time-performance/on-time-performance-faq/):** Desempenho pontual é um critério internacional usado em todos os aerportos para definir um voo como atrasado se o mesmo decolar ou aterrizar após 15 minutos do horário previsto.
- **Classificação Binária:**
Problema de aprendizado supervisionado onde o modelo deve categorizar o voo em: **Atrasado (1)** e **Pontual (0)**
- **Time Serie Split:[In[18]](https://github.com/LaboraDev/hackathon_one_flightOnTime/blob/main/notebooks/semana_05/Consolidado_S03_splitTemporal.ipynb)**  Estratégia de divisão de dados baseada no tempo, garantindo que o modelo aprenda com o passado para prever o futuro, evitando o vazamento de informações futuras (**Data Leakage**).
- **Target:[In[6]](https://github.com/LaboraDev/hackathon_one_flightOnTime/blob/main/notebooks/semana_05/Consolidado_S03_splitTemporal.ipynb)** É uma variável alvo que orienta o treinamento do modelo a prara fazer previsões.
- **[Hub](https://viajanamilha.com.br/glossario/o-que-e-aeroportos-hub/)**: é um aeroporto central usado por uma companhia aérea como ponto de conexão.

- **Recall (Sensibilidade)** [In[18]](https://github.com/LaboraDev/hackathon_one_flightOnTime/blob/main/notebooks/semana_05/Consolidado_S03_splitTemporal.ipynb): Capacidade do modelo de identificar corretamente os voos que realmentem atrasaram. É a métrica de maior valor de negócio.  
- **Precisão**[In[18]](https://github.com/LaboraDev/hackathon_one_flightOnTime/blob/main/notebooks/semana_05/Consolidado_S03_splitTemporal.ipynb): Indica a assertividade dos alertas emitidos pelo modelo, mensurando quantos dos voos classificados como "atrasados" realmente confirmaram o atraso.  
- **Acurácia [In[15]](https://github.com/LaboraDev/hackathon_one_flightOnTime/blob/main/notebooks/semana_05/Consolidado_S03_splitTemporal.ipynb)**: Percentual geral de acertos do modelo (atrasos e pontualidade combinados).  
- **F1-Score [20](https://github.com/LaboraDev/hackathon_one_flightOnTime/blob/main/notebooks/semana_05/Consolidado_S03_splitTemporal.ipynb)**: Equilíbrio estatístico entre Precisão e Recall, fundamental para validar a robustez em cenários desbalanceados.
- **XGBoost [In[15]](https://github.com/LaboraDev/hackathon_one_flightOnTime/blob/main/notebooks/semana_05/Consolidado_S03_splitTemporal.ipynb)**  Modelo de alta performance baseado em árvores de decisão, escolhido como modelo final por sua eficiência e estabilidade estatística.  
- **LightGBM [In[15]](https://github.com/LaboraDev/hackathon_one_flightOnTime/blob/main/notebooks/semana_05/Consolidado_S03_splitTemporal.ipynb)**: Algoritmo focado em velocidade.  
- **Floresta Aleatória [In[15]](https://github.com/LaboraDev/hackathon_one_flightOnTime/blob/main/notebooks/semana_05/Consolidado_S03_splitTemporal.ipynb)**: Modelo baseado em múltiplas árvores, com maior complexidade.  
- **Regressão Logística [In[15]](https://github.com/LaboraDev/hackathon_one_flightOnTime/blob/main/notebooks/semana_05/Consolidado_S03_splitTemporal.ipynb)**: Modelo linear básico utilizado como baseline inicial de comparação.

***
##3. Estratégia de Modelagem e Segmentação de Dados


###3.1 Classificação Binária
[In[6]](https://github.com/LaboraDev/hackathon_one_flightOnTime/blob/main/notebooks/semana_05/Consolidado_S03_splitTemporal.ipynb) (Atrasado vs. Pontual)
  Foi aplicada para garantir a validade dos resultados em um cenário real, adotamos as seguintes premissas:

###3.2 Split Temporal
Os dados foram divididos cronologicamente.  
Treinamos o modelo com dados de **2021 a 2023** e o testamos com o período de **2024 a 2025**, garantindo que não houvesse vazamento de informações do futuro para o passado.[In[9]](https://github.com/LaboraDev/hackathon_one_flightOnTime/blob/main/notebooks/semana_05/Consolidado_S03_splitTemporal.ipynb) e [In[11]](https://github.com/LaboraDev/hackathon_one_flightOnTime/blob/main/notebooks/semana_05/Consolidado_S03_splitTemporal.ipynb)

###3.3 Validação Cruzada Temporal
Utilizamos o `TimeSeriesSplit` com 5 dobras (folds), testando o modelo em janelas de tempo deslizantes para assegurar que ele seja estável diante de sazonalidades.[In[18]](https://github.com/LaboraDev/hackathon_one_flightOnTime/blob/main/notebooks/semana_05/Consolidado_S03_splitTemporal.ipynb)
###3.4 Pipeline de Pré-processamento
Integramos o tratamento de variáveis categóricas e numéricas (**FeatureConfig**, `montar_processador`) diretamente ao fluxo de treino, assegurando que o modelo receba dados limpos e padronizados.[In[10]](https://github.com/LaboraDev/hackathon_one_flightOnTime/blob/main/notebooks/semana_05/Consolidado_S03_splitTemporal.ipynb) e [In[13]](https://github.com/LaboraDev/hackathon_one_flightOnTime/blob/main/notebooks/semana_05/Consolidado_S03_splitTemporal.ipynb)

###3.5 Avaliação Comparativa e Métricas de Performance
Realizamos uma competição de algoritmos para identificar a melhor solução para a malha aérea brasileira.  
O objetivo foi comparar diferentes modelos de classificação binária, avaliando suas métricas de desempenho em cenários reais de operação.
###3.6 Modelos Avaliados
- Logistic Regression  
- Random Forest  
- XGBoost  
- LightGBM  

###3.7 Métricas de Performance
- **Precisão (Precision):** proporção de previsões positivas corretas.  
- **Revocação (Recall):** proporção de casos positivos corretamente identificados.  
- **F1-Score:** equilíbrio entre precisão e revocação.  
- **AUC-ROC:** capacidade do modelo em distinguir entre classes.  

###3.8 Estratégia
- Treinamento com dados históricos.  
- Avaliação em períodos futuros para evitar vazamento de informações.  
- Comparação direta das métricas para selecionar o modelo mais robusto e confiável.

### 3.9 Resultados Comparativos dos Modelos

| Modelo              | Accuracy | F1-Score (Positivo) | Observação Técnica                                      | Referência |
|---------------------|----------|---------------------|---------------------------------------------------------|------------|
| XGBoost             | 0.8058   | 0.3283              | Melhor equilíbrio entre precisão e volume de acertos    | [In[15]](https://github.com/LaboraDev/hackathon_one_flightOnTime/blob/main/notebooks/semana_05/Consolidado_S03_splitTemporal.ipynb)     |
| LightGBM            | 0.7333   | 0.3274              | Rápido, mas com menor precisão que o XGBoost            | [In[15]](https://github.com/LaboraDev/hackathon_one_flightOnTime/blob/main/notebooks/semana_05/Consolidado_S03_splitTemporal.ipynb)     |
| Random Forest       | 0.6621   | 0.3130              | Tendência a gerar muitos alarmes falsos                 | [In[15]](https://github.com/LaboraDev/hackathon_one_flightOnTime/blob/main/notebooks/semana_05/Consolidado_S03_splitTemporal.ipynb)     |
| Regressão Logística | 0.6171   | 0.2975              | Base linear simples; insuficiente para este problema    | [In[15]](https://github.com/LaboraDev/hackathon_one_flightOnTime/blob/main/notebooks/semana_05/Consolidado_S03_splitTemporal.ipynb)     |

O algoritmo final apresenta uma **Precision de 33,5%** e um **Recall de 32,1%**.  
Isso significa que o modelo é capaz de capturar cerca de **um terço de todos os atrasos reais**, mantendo uma taxa de acerto confiável para os alertas gerados em um dataset altamente desbalanceado. [In[17]](https://github.com/LaboraDev/hackathon_one_flightOnTime/blob/main/notebooks/semana_05/Consolidado_S03_splitTemporal.ipynb)



***

##4. Importância das Variáveis (Explicabilidade Global)

Mapeamos quais fatores mais "pesam" na decisão do modelo para que a predição seja transparente para o usuário:`def explicar_global_xgb()`[In[28]](https://github.com/LaboraDev/hackathon_one_flightOnTime/blob/main/notebooks/semana_05/Consolidado_S03_splitTemporal.ipynb)

####Principais Fatores

4.1 **Código de Tipo de Linha**
   O tipo de operação (Nacional ou Internacional) é o fator mais decisivo. [In[28]](https://github.com/LaboraDev/hackathon_one_flightOnTime/blob/main/notebooks/semana_05/Consolidado_S03_splitTemporal.ipynb)
4.2 **Média de Atraso por Empresa**  
   O histórico recente de pontualidade da companhia aérea influencia diretamente a predição.`MediaAtrasoTransformer` [In[12]](https://github.com/LaboraDev/hackathon_one_flightOnTime/blob/main/notebooks/semana_05/Consolidado_S03_splitTemporal.ipynb)

4.3 **Sazonalidade Temporal**  
   Variáveis como mês do ano e hora do dia capturam os picos de demanda que geram gargalos no sistema.`DatasFeaturesTransformer` [In[12]](https://github.com/LaboraDev/hackathon_one_flightOnTime/blob/main/notebooks/semana_05/Consolidado_S03_splitTemporal.ipynb)

4.4 **Presença de Hub**  
   Voos que partem de aeroportos principais (Hubs) possuem dinâmicas de atraso distintas de aeroportos menores. `UltimateFeatureEngineer` [In[12]](https://github.com/LaboraDev/hackathon_one_flightOnTime/blob/main/notebooks/semana_05/Consolidado_S03_splitTemporal.ipynb)

###4.5 Matriz de Comportamento e Performance Operacional - Features para Modelagem


| Dimensão              | Feature Engineered                                 | Importância (Gain) | Observação Técnica        |
| --------------------- | -------------------------------------------------- | ------------------ | ------------------------- |
| Sazonalidade Temporal | Hora do Dia (hora_sin)                            | 245.62             | Picos de demanda          |
| Influência Geográfica | Presença de Hub (is_hub)                          | 110.09             | Dinâmica em aeroportos    |
| Histórico Operacional | Média de Atraso por Empresa (media_atraso_empresa) | 478.16             | Pontualidade histórica    |
| Tipo de Operação      | Código de Tipo de Linha (codigo_tipo_linha_N)      | 3253.21            | Nacional vs Internacional |


#### Interpretação Técnica

A matriz consolidada evidencia que o modelo XGBoost conseguiu identificar e ordenar as variáveis mais relevantes para prever atrasos. A importância relativa de cada feature (medida via Gain) mostra:

- **Código de Tipo de Linha (3253.21):** preditor dominante, destacando a diferença entre operações nacionais e internacionais.  
- **Média de Atraso por Empresa (478.16):** segundo fator crítico, reforçando o peso da pontualidade histórica.  
- **Sazonalidade Temporal (245.62):** fator complementar que captura padrões de demanda em horários específicos.  
- **Presença de Hub (110.09):** fator adicional que reflete dinâmicas distintas em aeroportos principais.  

Essa hierarquia garante que o modelo opere de forma explicável e possa ser integrado diretamente ao dashboard analítico, com foco na mitigação de riscos de conexões perdidas. [In[28]](https://github.com/LaboraDev/hackathon_one_flightOnTime/blob/main/notebooks/semana_05/Consolidado_S03_splitTemporal.ipynb)


***
## 5. Pilares Fundamentais para o Sucesso do Projeto


1. **Priorização do Recall**  
   Foco na detecção da **Classe 1 (Atrasado)**. É preferível gerar um *falso positivo* (alerta preventivo) do que um *falso negativo* (não prever um atraso real), mitigando riscos de conexões perdidas. [In[15,17 e 21]](https://github.com/LaboraDev/hackathon_one_flightOnTime/blob/main/notebooks/semana_05/Consolidado_S03_splitTemporal.ipynb)
  
2. **Split Temporal Estrito**  
   Divisão cronológica dos dados (**Treino: 2021-23 / Teste: 2024-25**). Essa estratégia evita vazamento de dados (*data leakage*) e garante que o modelo aprenda com o passado para prever o futuro real. [In[18]](https://github.com/LaboraDev/hackathon_one_flightOnTime/blob/main/notebooks/semana_05/Consolidado_S03_splitTemporal.ipynb)  

3. **Ajuste de Pesos**  
   Utilização do parâmetro `scale_pos_weight` no XGBoost para compensar o desbalanceamento das classes (~84% pontuais vs ~16% atrasados), forçando o modelo a identificar padrões de atraso. [In[15]](https://github.com/LaboraDev/hackathon_one_flightOnTime/blob/main/notebooks/semana_05/Consolidado_S03_splitTemporal.ipynb)  

4. **Engenharia de Features e Explicabilidade**  
   Ênfase em **sazonalidade (hora/dia)** e **histórico de empresas**. Todas as decisões do modelo devem ser rastreáveis via métrica de *Gain*, garantindo transparência para o usuário final.  [In[28]](https://github.com/LaboraDev/hackathon_one_flightOnTime/blob/main/notebooks/semana_05/Consolidado_S03_splitTemporal.ipynb)


***

## 6. Respostas às Perguntas-Chave (DS4)
### 6.1 Qual a problemática solucionada?
Classificação binária supervisionada, distinguindo voos que cumprem o horário daqueles que atrasam mais de 15 minutos (Target: atrasado) [In[6]](https://github.com/LaboraDev/hackathon_one_flightOnTime/blob/main/notebooks/semana_05/Consolidado_S03_splitTemporal.ipynb).
### 6.2 Qual algoritmo se destacou entre os demais?
O **XGBoost**, devido à sua superioridade no tratamento de dados categóricos (aeroportos/empresas) e padrões temporais não lineares.
### 6.3 Como os dados foram segmentados?
Seguindo uma ordem cronológica rigorosa e abrangendo o período de 2021 a 2025.
- Treino: 70%  
- Validação: 10%  
- Teste: 20%  
### 6.4 Qual a lógica por trás dessa segmentação?
Para mitigar o *Data Leakage*. Em aviação, o modelo não pode usar dados de 2025 para "prever" um voo de 2022; ele deve simular a realidade temporal.
### 6.5 Quais métricas foram escolhidas?
As métricas escolhidas foram **Acurácia, F1-Score e Precisão**, tendo o **Recall (Sensibilidade)** como métrica principal.  
Essa decisão se justifica porque, na logística de passageiros, o impacto de um **Falso Negativo** (não prever um atraso real) é mais crítico do que um **Falso Positivo**, que pode ser aceito como uma margem de segurança preventiva para o usuário.
### 6.6 Quais interpretações podemos ter com esse resultado?
O modelo atua como um **assistente preventivo eficiente** para o dashboard, permitindo que o passageiro antecipe riscos em voos historicamente críticos.
### 6.7 Quais são as principais limitações do modelo?
- Ausência de dados externos (clima, greves, manutenções).  
- Dependência exclusiva dos padrões operacionais reportados pela **ANAC**.

***
## 7. Análise de Risco para a Modelagem

| **Risco**                 | **Severidade** | **Estratégia de Mitigação**                                                   |
| -------------------------- | -------------- | ----------------------------------------------------------------------------- |
| Viés de Classe Majoritária | Alta           | Uso do parâmetro `scale_pos_weight` no XGBoost para balancear classes          |
| Variação na Malha Aérea    | Média          | Treinamento com `Split Temporal` para captar mudanças sazonais                 |
| Vazamento de Features      | Alta           | Remoção rigorosa de colunas de "Chegada" e "Log Real" antes do treino          |

***

## 8. CheckList de Integridade (Selo de Qualidade)

- **[X] Estratégia**  
  Priorização do Recall para mitigação de riscos em conexões.  
  Rastreio [In[15 e 17]](https://github.com/LaboraDev/hackathon_one_flightOnTime/blob/main/notebooks/semana_05/Consolidado_S03_splitTemporal.ipynb)

- **[X] Validação**  
  Split Temporal (Treino até 2023 / Teste 2024+) sem vazamento.  
  Rastreio [In[9-11]](https://github.com/LaboraDev/hackathon_one_flightOnTime/blob/main/notebooks/semana_05/Consolidado_S03_splitTemporal.ipynb)

- **[X] Robustez**  
  Uso de scale_pos_weight para tratar o desbalanceamento operacional.  
  Rastreio [In[15-17]](https://github.com/LaboraDev/hackathon_one_flightOnTime/blob/main/notebooks/semana_05/Consolidado_S03_splitTemporal.ipynb)

- **[X] Arquitetura**  
  Pipeline Consolidado com tratamento automático de nulos e categorias.  
  Rastreio [In[9]](https://github.com/LaboraDev/hackathon_one_flightOnTime/blob/main/notebooks/semana_05/Consolidado_S03_splitTemporal.ipynb)

- **[X] Explicabilidade**  
  Identificação clara das features de maior Gain (Tipo de Linha/Empresa).  
  Rastreio [In[28]](https://github.com/LaboraDev/hackathon_one_flightOnTime/blob/main/notebooks/semana_05/Consolidado_S03_splitTemporal.ipynb)

- **[X] Consistência**  
  Validação de colunas via pre_chk.fit() para suporte à API futura.  
  Rastreio [In[13]](https://github.com/LaboraDev/hackathon_one_flightOnTime/blob/main/notebooks/semana_05/Consolidado_S03_splitTemporal.ipynb)


***



## 9. BluePrint de Rastreabilidade de Células


|              Etapa                    | Célula | Evidência                                                                              |
| ---------------------------------------- | --------------------- | ------------------------------------------------------------------------------------------------------- |
| 1. Visão Geral (Seleção do Algoritmo)    | [In[15-17]](https://github.com/LaboraDev/hackathon_one_flightOnTime/blob/main/notebooks/semana_05/Consolidado_S03_splitTemporal.ipynb)               | Comparativo de métricas onde o XGBoost superou RF e LightGBM. DOC_DS4F.ipynb-Colab.pdf                  |
| 2. Divisão de Dados (Split Temporal)     | [In[9]](https://github.com/LaboraDev/hackathon_one_flightOnTime/blob/main/notebooks/semana_05/Consolidado_S03_splitTemporal.ipynb) e [In[11]](https://github.com/LaboraDev/hackathon_one_flightOnTime/blob/main/notebooks/semana_05/Consolidado_S03_splitTemporal.ipynb)            | Filtro cronológico que separa treino (2021-23) de teste (2024-25). Consolidado_S03_splitTemporal.ipynb  |
| 2. Estabilidade (Validação Cruzada)      | [In[18]](https://github.com/LaboraDev/hackathon_one_flightOnTime/blob/main/notebooks/semana_05/Consolidado_S03_splitTemporal.ipynb)                 | Execução do `TimeSeriesSplit` com 5 folds sobre a série temporal. Consolidado_S03_splitTemporal.ipynb     |
| 2. Padronização (Reprodutibilidade)      | [In[13]](https://github.com/LaboraDev/hackathon_one_flightOnTime/blob/main/notebooks/semana_05/Consolidado_S03_splitTemporal.ipynb)                  | Teste `pre_chk.fit(Xfe_chk)` para fixar a estrutura da API. Consolidado_S03_splitTemporal.ipynb           |
| 3. Performance (Métricas Operacionais)   | [In[17]](https://github.com/LaboraDev/hackathon_one_flightOnTime/blob/main/notebooks/semana_05/Consolidado_S03_splitTemporal.ipynb) e [In[25]](https://github.com/LaboraDev/hackathon_one_flightOnTime/blob/main/notebooks/semana_05/Consolidado_S03_splitTemporal.ipynb)           | Relatório final com Recall de 52,2% e Acurácia de 80,5%. DOC_DS4F.ipynb-Colab.pdf                       |
| 4. Explicabilidade (Variáveis Críticas)  | [In[28]](https://github.com/LaboraDev/hackathon_one_flightOnTime/blob/main/notebooks/semana_05/Consolidado_S03_splitTemporal.ipynb)                  | `explicar_global_xgb()` plotando a importância via Gain. DOC_DS4F.ipynb-Colab.pdf                  |
| 4. Sazonalidade (Engenharia de Features) | [In[12]](https://github.com/LaboraDev/hackathon_one_flightOnTime/blob/main/notebooks/semana_05/Consolidado_S03_splitTemporal.ipynb)                  | `Transformadores DatasFeatures` e `MediaAtrasoTransformer`. Consolidado_S03_splitTemporal.ipynb             |
| 5. Próximos Passos (Integração)          | [In[29]](https://github.com/LaboraDev/hackathon_one_flightOnTime/blob/main/notebooks/semana_05/Consolidado_S03_splitTemporal.ipynb)                  | `pickle.dump()` exportando o modelo validado para .pkl. Consolidado_S03_splitTemporal.ipynb               |

***
## 10. Conclusão do Projeto: Predição de Atrasos de Voos

A metodologia aplicada neste projeto garantiu um sistema de predição robusto e focado na mitigação de **Falsos Negativos**, objetivo central para minimizar os impactos operacionais de atrasos não detectados.  

Por meio de um **Pipeline Consolidado**, o tratamento de dados faltantes foi realizado de forma automatizada, aproveitando a capacidade nativa dos modelos de *Gradient Boosting* (XGBoost e LightGBM) para processar valores nulos sem perda de informação estatística. [In[15]](https://github.com/LaboraDev/hackathon_one_flightOnTime/blob/main/notebooks/semana_05/Consolidado_S03_splitTemporal.ipynb)

---

## Pilares da Estratégia de Modelagem

- **Mitigação de Erros**  
  O ajuste do parâmetro `scale_pos_weight=4` no XGBoost aumentou significativamente o **Recall**, forçando o modelo a identificar com maior precisão os voos que realmente sofreriam atrasos.  [In[15]](https://github.com/LaboraDev/hackathon_one_flightOnTime/blob/main/notebooks/semana_05/Consolidado_S03_splitTemporal.ipynb)
  
- **Integridade dos Dados**  
  A separação temporal rigorosa e a remoção de variáveis de vazamento (como `partida_real` e `situacao_voo`) garantiram que o modelo fosse avaliado em condições reais de uso, evitando métricas infladas artificialmente.  
  [In[11]](https://github.com/LaboraDev/hackathon_one_flightOnTime/blob/main/notebooks/semana_05/Consolidado_S03_splitTemporal.ipynb)

- **Inteligência de Atributos**  
  A análise de **Gain** confirmou que as variáveis criadas via *Feature Engineering* foram determinantes para a decisão do modelo, validando a eficácia das transformações customizadas aplicadas ao dataset original.  
  [In[28]](https://github.com/LaboraDev/hackathon_one_flightOnTime/blob/main/notebooks/semana_05/Consolidado_S03_splitTemporal.ipynb)

---

## 10.1 Síntese Final

O modelo final não apenas apresenta métricas de acurácia consistentes, mas também oferece uma ferramenta confiável para a tomada de decisão antecipada. Ele equilibra a precisão técnica com a necessidade prática de capturar o maior número possível de eventos de atraso. [In[15 e 17]](https://github.com/LaboraDev/hackathon_one_flightOnTime/blob/main/notebooks/semana_05/Consolidado_S03_splitTemporal.ipynb)
***
## 11. Referências

- **ANAC - Agência Nacional de Aviação Civil. (2024).**  
  *Portal de Dados Abertos - VRA.*  
  Disponível em: [ANAC](https://www.anac.gov.br)

- **Scikit-learn. (2024).**  
  *Feature Engineering and Preprocessing.*  
  Disponível em: [Scikit-learn](https://scikit-learn.org)

  **CIRIUM** - Uma consultora mundial de metadados aeronáuticos.
  Acessado entre dezembro 2025 e janeiro 2026
  Assunto: OnTimePerformance (OTP) critério da pontualidade.
  Disponível em: [OnTimePerformance](https://www.cirium.com/)
