#**Justificaci√≥n del Target.**

La definici√≥n del target permite establecer de forma expl√≠cita cu√°l es la variable objetivo del modelo, es decir, aquello que el algoritmo debe aprender a predecir a partir de los datos hist√≥ricos.

---

##**1. ¬øQu√© es el target en este proyecto?**

En el proyecto **FlightOnTime,** el target representa el **resultado operativo del vuelo** que el modelo debe aprender a predecir.

Dado que el objetivo del proyecto es **estimar el riesgo de retraso operativo,** el target indica **si un vuelo fue puntual o present√≥ un retraso,** de acuerdo con el est√°ndar definido previamente.


---

##**2. Tipo de target.**

El target se define como una **variable binaria,** coherente con la formulaci√≥n del problema como una tarea de **clasificaci√≥n supervisada.**

---

##**3. Definici√≥n conceptual del target.**

La variable objetivo se codifica de la siguiente forma:

*   **0 ‚Äî Puntual:** El vuelo presenta un retraso operativo **menor a 15 minutos.**

*   **1 ‚Äî Retrasado:** El vuelo presenta un retraso operativo **igual o superior a 15 minutos.**

---

##**4. Alcance del target.**

El target definido:

*   **No incluye vuelos cancelados,** ya que estos no constituyen retrasos operativos.
*   **No incluye vuelos desviados,** dado que no llegan al aeropuerto de destino programado y no pueden ser evaluados bajo el est√°ndar de puntualidad.
*   **No debe de incluirse como feature**.




El target se construye exclusivamente a partir de **datos hist√≥ricos**, donde el resultado del vuelo es conocido.

---

##**5. Relaci√≥n con el uso del modelo.**

El modelo no busca predecir el **tiempo exacto de retraso**, sino **estimar la probabilidad de que el vuelo pertenezca a la clase ‚Äúretrasado‚Äù**.

Este enfoque probabil√≠stico resulta adecuado para apoyar decisiones operativas tempranas, y es consistente con un enfoque MVP, donde se prioriza la anticipaci√≥n del riesgo por sobre la predicci√≥n exacta del minuto de demora.

---

##**6. Regla de c√°lculo del target a partir del dataset.**

### **6.1. Variables necesarias para definir el target.**

Las variables utilizadas para construir el target **describen el resultado observado del vuelo**, no su contexto operacional.

---

####‚úà  **Estado de vuelo.**

Estas variables son imprescindibles para definir exclusiones:

*   `cancelled`
*   `diverted`

**Justificaci√≥n**

El target solo se define sobre vuelos **operados entre origen y destino.**

Los vuelos cancelados o desviados **no son retrasos operativos**, seg√∫n el est√°ndar A15



**Reglas de exclusi√≥n e inclusi√≥n:**

*   cancelled == 1  excluir.
*   diverted == 1 excluir.
*   cancelled == 0 incluir.
*   diverted == 0 incluir.

**Conclusi√≥n 1:**

la definici√≥n del retraso operativo se basa exclusivamente en:

*   El estado del vuelo (operado, no cancelado ni desviado), y

*   la medici√≥n objetiva del retraso en minutos respecto al horario programado, aplicando el umbral operativo establecido.

---

####‚úà  **Medici√≥n del retraso.**

Variables n√∫cleo del target:

*   `dep_dellay`    o
*   `arr_dellay`

**Justificaci√≥n:**

El retraso no se **infiere**, sino que se **observa directamente** como una diferencia en minutos respecto al horario programado.


Sin embargo, el riesgo operativo de retraso en **salida** y en **llegada** no pueden representarse como un √∫nico evento sin perder coherencia temporal y estad√≠stica. Ambos corresponden a:

*   eventos distintos,
*   que ocurren en momentos diferentes,
*   con din√°micas operativas distintas,
*   y que no representan el mismo resultado.


Por tal raz√≥n, **no se debe mezclarse en un mismo target predictivo.**


**Conclusi√≥n 2:**

Aunque el concepto de retraso operativo engloba demoras tanto en salida como en llegada desde una perspectiva de negocio, para efectos de modelado predictivo es necesario definir **un evento √∫nico y claramente delimitado en el tiempo**, con el fin de preservar la coherencia estad√≠stica, la interpretabilidad del modelo y la validez causal de la predicci√≥n.

---

###**6.2. Opciones para definir el target.**

**Opci√≥n 1: elegir un solo target.**

Por ejemplo

*   `dep_dellay_15`   o
*   `arr_dellay_15`

Ventajas:

*   Modelo claro.
*   predicci√≥n asociada a un momento definido.
*   Ideal para una versi√≥n s√≥lida de MVP.

**Opci√≥n 2: dos targets.**

Denifir:

*   `dep_dellay_15`
*   `arr_dellay_15`

Cada uno:

*   con su propia regla.
*   su propio significado.
*   mismo modelo, distinto target.


**Decisi√≥n:**

Se elige la **Opci√≥n 1**, con el fin de presentar una versi√≥n s√≥lida, simple y alineada con la consigna original del MVP.

---

### **6.3. Variables que no deben usarse para medir el target.**

üö´ **Variables temporales y de calendario.**

Describen cu√°ndo ocurre el vuelo, no si ocurri√≥ con retraso. Usarlas para definir el target introducir√≠a data leakage conceptual

*   `year`, `month`, `day_of_month`, `day_of_week`
*   `fl_date`
*   `crs_dep_time`, `crs_arr_time`


Son **input del modelo**, no definici√≥n del resultado.

---

üö´ **Identificadores operativos.**

Identifican **qui√©n opera y d√≥nde,** pero no determinan el retraso por s√≠ mismos.

*   `op_unique_carrier`, `op_carrier_fl_num`
*   `origin`, `origin_city_name`, `origin_state_nm`
*   `dest`,`dest_city_name`, `dest_state_nm`

Son variables **explicativas del retraso,** no lo definen.

---

üö´ **Tiempos intermedios del proceso de vuelo.**

Ocurren durante o despu√©s del inicio del proceso operacional.

*   `taxi_out`, `wheels_off`, `wheels_on`, `taxi_in`
*   `air_time`,
*   `actual_elapsed_time`, `crs_elapsed_time`

---


üö´ **Variables causales del retraso.**

Solo existen si el retraso ya ocurri√≥, por lo que su uso implica label leakage directo.

*   `carrier_delay`
*   `weather_delay`
*   `nas_delay`
*   `security_delay`
*   `late_aircraft_delay`

**Conclusi√≥n 3:**

El target debe construirse exclusivamente a partir de variables que describen el **resultado final observado del vuelo** y su **elegibilidad operativa**. Variables contextuales, temporales, operativas o causales no deben intervenir en su definici√≥n, ya que introducir√≠an sesgos y riesgos de data leakage.

---