# **Librerias - Dependencias**

In [None]:
import json

# **CORPUS**

In [None]:
def cargar_corpus():
    """Carga el corpus de entrenamiento y separa ciudades/paises de aerolíneas."""
    with open(archivo_corpus, "r", encoding="utf-8") as f:
        corpus = json.load(f)

    ciudades_paises = set()
    aerolineas = set()

    for oracion in corpus:
        for palabra, etiqueta in oracion:
            if etiqueta == "np000g0":  # Nombre propio (Ciudad/País)
                ciudades_paises.add(palabra)
            elif etiqueta == "npcso00":  # Entidad (Aerolínea)
                aerolineas.add(palabra)

    return ciudades_paises, aerolineas

In [None]:
def cargar_frases(archivo_frases):
    with open(archivo_frases, "r", encoding="utf-8") as f:
    return json.load(f)

# **CODIGO IATA**

In [None]:
def obtener_codigo_iata(ciudad):
    """Consulta la API para obtener el código IATA de una ciudad."""
    url = "https://www.air-port-codes.com/api/v1/multi"
    headers = {
        "APC-Auth": "APY_KEY",
        "APC-Auth-Secret": "APY_SECRET"
    }
    params = {"term": ciudad, "limit": 1}

    try:
        respuesta = requests.get(url, headers=headers, params=params)
        datos = respuesta.json()

        if respuesta.status_code == 200 and datos.get("airports"):
            return datos["airports"][0]["iata"]  # Retornar código IATA
        else:
            print(f"⚠ No se encontró IATA para {ciudad}")
            return None

    except Exception as e:
        print(f"Error al consultar la API para {ciudad}: {str(e)}")
        return None

# **FECHA**

In [None]:
# Lista de meses en español
MESES = {
    "enero", "febrero", "marzo", "abril", "mayo", "junio",
    "julio", "agosto", "septiembre", "octubre", "noviembre", "diciembre"
}

def extraer_fechas(texto):
    """Extrae fechas en formatos como '25 de Agosto' o solo meses."""
    fechas = []

    # 1. Buscar fechas completas con día y mes (ej. '25 de Agosto')
    patron_fecha = r"(\d{1,2}) de (" + "|".join(MESES) + r")"
    for match in re.findall(patron_fecha, texto, re.IGNORECASE):
        dia, mes = match
        fechas.append(f"{dia} de {mes.capitalize()}")  # Guardamos con formato correcto

    # 2. Buscar solo meses (ej. 'en Septiembre')
    for palabra in texto.split():
        if palabra.lower() in MESES and palabra.lower() not in [f.split()[-1].lower() for f in fechas]:
            fechas.append(palabra.capitalize())  # Guardamos el mes si no estaba ya registrado

    return fechas