In [3]:
import pandas as pd
import os

cad = pd.read_csv("dataset/cadastro-de-aerodromos-civis-publicos.csv", sep=";", dtype=str)
print(cad.columns)

Index(['C√ìDIGO OACI', 'CIAD', 'NOME', 'MUNIC√çPIO ATENDIDO', 'UF', 'LATITUDE',
       'LONGITUDE', 'ALTITUDE', 'OPERA√á√ÉO', 'OACI', 'AIP BRASIL', 'DESIGNA√á√ÉO',
       'COMPRIMENTO', 'LARGURA', 'RESIST√äNCIA', 'SUPERF√çCIE', 'DESIGNA√á√ÉO.1',
       'COMPRIMENTO.1', 'LARGURA.1', 'RESIST√äNCIA.1', 'SUPERF√çCIE.1',
       'DESIGNA√á√ÉO.2', 'COMPRIMENTO.2', 'LARGURA.2', 'RESIST√äNCIA.2',
       'SUPERF√çCIE.2', 'RAMPA(S) DE APROXIMA√á√ÉO', 'FORMATO DA √ÅREA DE POUSO',
       'DIMENS√ïES', 'RESIST√äNCIA.3', 'SUPERF√çCIE.3', 'p1', 'p2', 'p3', 'p4',
       'PORTARIAS', 'Unnamed: 36', 'Unnamed: 37', 'Unnamed: 38',
       'PORTARIA N¬∫ 16.739/2025 e altera√ß√µes',
       'PORTARIA N¬∫ 11.183/2023\nA Classe I se divide ainda em RBAC 121, RBAC 135 Regular e Outras Opera√ß√µes',
       'PORTARIA N¬∫ 2007/2014 E ALTERA√á√ïES\n(* = REGIME TARIF√ÅRIO DIFERENCIADO)',
       'AERONAVE CR√çTICA', 'TIPO DE APROX. (CABECEIRAS)', 'FREQ. SEMANAL',
       'r1', 'r2', 'REFER√äNCIA(S)', 'RESTRI√á√ÉO(√ïES)'

In [None]:
import pandas as pd
import os

# ============================
# 1. CARREGAR MAPA ICAO ‚Üí CIDADE
# ============================

cadastro_path = "dataset/cadastro-de-aerodromos-civis-publicos.csv"

cad = pd.read_csv(cadastro_path, sep=";", dtype=str)

# Normalizar nomes
cad["C√ìDIGO OACI"] = cad["C√ìDIGO OACI"].str.upper().str.strip()
cad["MUNIC√çPIO ATENDIDO"] = cad["MUNIC√çPIO ATENDIDO"].str.upper().str.strip()

icao_to_city = dict(zip(cad["C√ìDIGO OACI"], cad["MUNIC√çPIO ATENDIDO"]))

print("‚úîÔ∏è Mapa ICAO ‚Üí Cidade carregado:", len(icao_to_city), "aeroportos")


# ============================
# 2. UNIFICAR OS CSVs DOS ANOS
# ============================

base_folder_path = "./dataset/"
df_list = []

# pastas 2023, 2024, 2025...
year_folders = [
    d for d in os.listdir(base_folder_path)
    if os.path.isdir(os.path.join(base_folder_path, d)) and d.isdigit()
]

for year_folder in year_folders:
    year_path = os.path.join(base_folder_path, year_folder)
    year = int(year_folder)

    for csv_file in os.listdir(year_path):
        if not csv_file.lower().endswith(".csv"):
            continue

        file_path = os.path.join(year_path, csv_file)

        try:
            df = pd.read_csv(file_path, sep=";", dtype=str)

            # normalizar ICAO
            df["ORIGEM"] = df["ORIGEM"].str.upper().str.strip()
            df["DESTINO"] = df["DESTINO"].str.upper().str.strip()

            # ano garantido
            df["ANO"] = year

            # MES normalizado
            df["MES"] = df["MES"].str.replace(",", "").astype(int)

            # TARIFA num√©rica
            df["TARIFA"] = df["TARIFA"].str.replace(",", ".").astype(float)

            # criar colunas de cidade
            df["CIDADE_ORIGEM"] = df["ORIGEM"].map(icao_to_city)
            df["CIDADE_DESTINO"] = df["DESTINO"].map(icao_to_city)

            df_list.append(df)

        except Exception as e:
            print(f"‚ùå ERRO ao ler {file_path}: {e}")

# ============================
# 3. CONCATENAR
# ============================

main_df = pd.concat(df_list, ignore_index=True)

print("\n‚úîÔ∏è DataFrame final criado!")
print(main_df.head(20))

# ============================
# 4. EXPORTAR
# ============================

out = "dataset_unificado.csv"
main_df.to_csv(out, sep=";", index=False, encoding="utf-8")
print("\nüì¶ Exportado:", out)


‚úîÔ∏è Mapa ICAO ‚Üí Cidade carregado: 504 aeroportos
