In [65]:
pip install pandas

Note: you may need to restart the kernel to use updated packages.


In [66]:
pip install scipy

Note: you may need to restart the kernel to use updated packages.


# Preparação dos dados

In [67]:
# Importação da biblioteca pandas para manipulação de dados
import pandas as pd

# Caminhos para os arquivos CSV
file_path = './csv_recebidos/Distâncias_aeroportos.csv'  # Arquivo com as distâncias entre aeroportos
file_path1 = './csv_recebidos/Nome_Aeroporto.csv'  # Arquivo com os nomes dos aeroportos

# Carrega os arquivos CSV em DataFrames
df = pd.read_csv(file_path)  # DataFrame com as distâncias
df_nome = pd.read_csv(file_path1)  # DataFrame com os nomes dos aeroportos

# Remove a coluna 'Distance m' do DataFrame de distâncias
df = df.drop('Distance m', axis=1)
df

Unnamed: 0,InputID,TargetID,Distance km
0,1,2,2095
1,1,3,1448
2,1,4,2294
3,1,5,2318
4,1,6,2337
...,...,...,...
7305,86,81,919
7306,86,82,822
7307,86,83,561
7308,86,84,363


In [68]:
# Renomeia as colunas do DataFrame de distâncias
df.columns = ["InputID", "TargetID", "Distância km"]
df

Unnamed: 0,InputID,TargetID,Distância km
0,1,2,2095
1,1,3,1448
2,1,4,2294
3,1,5,2318
4,1,6,2337
...,...,...,...
7305,86,81,919
7306,86,82,822
7307,86,83,561
7308,86,84,363


In [69]:
# Cria um mapeamento de IDs para nomes dos aeroportos
mapa_ids = {i+1: nome for i, nome in enumerate(df_nome['Aeroporto'])}

# Substitui os IDs nas colunas 'InputID' e 'TargetID' pelos nomes dos aeroportos
df['InputID'] = df['InputID'].replace(mapa_ids)
df['TargetID'] = df['TargetID'].replace(mapa_ids)

df

Unnamed: 0,InputID,TargetID,Distância km
0,Aeroporto Internacional de Guarulhos,Aeroporto Internacional do Recife,2095
1,Aeroporto Internacional de Guarulhos,Aeroporto Internacional de Salvador,1448
2,Aeroporto Internacional de Guarulhos,Aeroporto Internacional de Natal,2294
3,Aeroporto Internacional de Guarulhos,Aeroporto Internacional de São Luís,2318
4,Aeroporto Internacional de Guarulhos,Aeroporto Internacional de Fortaleza,2337
...,...,...,...
7305,Aeroporto Internacional de Porto Alegre,Aeroporto Internacional de São José dos Campos,919
7306,Aeroporto Internacional de Porto Alegre,Aeroporto Internacional de Viracopos,822
7307,Aeroporto Internacional de Porto Alegre,Aeroporto Internacional de Curitiba,561
7308,Aeroporto Internacional de Porto Alegre,Aeroporto Internacional de Florianópolis,363


In [70]:
# Função para formatar horas no formato HH:MM
def format_time(hours):
    h = int(hours)
    m = int((hours - h) * 60)
    return f"{h:02}:{m:02}"

# Calcula o tempo médio de voo para aeronaves comerciais
df['Tempo Médio Horas - Comercial'] = df['Distância km'].apply(
    lambda d: f"{format_time(d / 900)} ~ {format_time(d / 850)}"
)

# Calcula o tempo médio de voo para aeronaves cargueiras
df['Tempo Médio Horas - Cargueiro'] = df['Distância km'].apply(
    lambda d: f"{format_time(d / 850)} ~ {format_time(d / 800)}"
)

df


Unnamed: 0,InputID,TargetID,Distância km,Tempo Médio Horas - Comercial,Tempo Médio Horas - Cargueiro
0,Aeroporto Internacional de Guarulhos,Aeroporto Internacional do Recife,2095,02:19 ~ 02:27,02:27 ~ 02:37
1,Aeroporto Internacional de Guarulhos,Aeroporto Internacional de Salvador,1448,01:36 ~ 01:42,01:42 ~ 01:48
2,Aeroporto Internacional de Guarulhos,Aeroporto Internacional de Natal,2294,02:32 ~ 02:41,02:41 ~ 02:52
3,Aeroporto Internacional de Guarulhos,Aeroporto Internacional de São Luís,2318,02:34 ~ 02:43,02:43 ~ 02:53
4,Aeroporto Internacional de Guarulhos,Aeroporto Internacional de Fortaleza,2337,02:35 ~ 02:44,02:44 ~ 02:55
...,...,...,...,...,...
7305,Aeroporto Internacional de Porto Alegre,Aeroporto Internacional de São José dos Campos,919,01:01 ~ 01:04,01:04 ~ 01:08
7306,Aeroporto Internacional de Porto Alegre,Aeroporto Internacional de Viracopos,822,00:54 ~ 00:58,00:58 ~ 01:01
7307,Aeroporto Internacional de Porto Alegre,Aeroporto Internacional de Curitiba,561,00:37 ~ 00:39,00:39 ~ 00:42
7308,Aeroporto Internacional de Porto Alegre,Aeroporto Internacional de Florianópolis,363,00:24 ~ 00:25,00:25 ~ 00:27


In [71]:
# Lista de aeroportos de interesse
aeroportos_interesse = [
    "Aeroporto Internacional de Guarulhos",
    "Aeroporto Internacional do Recife",
    "Aeroporto Internacional de Salvador",
    "Aeroporto Internacional de Natal",
    "Aeroporto Internacional de São Luís",
    "Aeroporto Internacional de Fortaleza",
    "Aeroporto Internacional de Brasília",
    "Aeroporto Internacional de Várzea Grande",
    "Aeroporto Internacional de Belém",
    "Aeroporto Internacional de Tabatinga",
    "Aeroporto Internacional de Manaus",
    "Aeroporto Internacional de Macapá",
    "Aeroporto Internacional de Maceió",
    "Aeroporto Internacional de Aracaju",
    "Aeroporto Internacional de Belo Horizonte",
    "Aeroporto Santos Dumont",
    "Aeroporto Internacional do Rio de Janeiro",
    "Aeroporto Internacional de Vitória",
    "Aeroporto Internacional de São José dos Campos",
    "Aeroporto Internacional de Viracopos",
    "Aeroporto Internacional de Curitiba",
    "Aeroporto Internacional de Florianópolis",
    "Aeroporto Internacional de Navegantes",
    "Aeroporto Internacional de Porto Alegre"
]

# Gera uma lista de aeroportos de origem únicos
lista_origem = df['InputID'].unique().tolist()

# Remove os aeroportos de interesse da lista de origem
for i in aeroportos_interesse:
    try:
        lista_origem.remove(i)
    except ValueError:
        pass

lista_origem

['Aeroporto Internacional de Nursultan Nazarbayev',
 'Aeroporto Internacional de Xangai Pudong',
 'Aeroporto Internacional de Pequim Capital',
 'Aeroporto Internacional de Pyongyang Sunan',
 'Aeroporto Internacional de Incheon',
 'Aeroporto Internacional Ninoy Aquino',
 'Aeroporto Internacional de Hong Kong',
 'Aeroporto Internacional Indira Gandhi',
 'Aeroporto Internacional Soekarno-Hatta (Jacarta)',
 'Aeroporto Internacional Ngurah Rai (Bali)',
 'Aeroporto Internacional de Narita (Tóquio)',
 'Aeroporto Internacional de Haneda (Tóquio)',
 'Aeroporto Internacional de Kansai (Osaka)',
 'Aeroporto Internacional de Wattay (Vientiane)',
 'Aeroporto Internacional de Kuala Lumpur (Sepang)',
 'Aeroporto Internacional de Penang (Penang)',
 'Aeroporto Internacional de Malé',
 'Aeroporto Internacional de Changi',
 'Aeroporto Internacional de Suvarnabhumi',
 'Aeroporto Internacional Don Mueang',
 'Aeroporto Internacional de Taiwan Taoyuan',
 'Aeroporto Internacional de Tan Son Nhat',
 'Aeroporto

In [72]:
# Dicionário de aeroportos por estado
aeroportos_estado = {
    "Alagoas": ["Aeroporto Internacional de Maceió"],
    "Amapá": ["Aeroporto Internacional de Macapá"],
    "Amazonas": [
        "Aeroporto Internacional de Tabatinga",
        "Aeroporto Internacional de Manaus"
    ],
    "Bahia": ["Aeroporto Internacional de Salvador"],
    "Ceará": ["Aeroporto Internacional de Fortaleza"],
    "Distrito Federal": ["Aeroporto Internacional de Brasília"],
    "Espírito Santo": ["Aeroporto Internacional de Vitória"],
    "Maranhão": ["Aeroporto Internacional de São Luís"],
    "Mato Grosso": ["Aeroporto Internacional de Várzea Grande"],
    "Minas Gerais": ["Aeroporto Internacional de Belo Horizonte"],
    "Pará": ["Aeroporto Internacional de Belém"],
    "Paraná": ["Aeroporto Internacional de Curitiba"],
    "Pernambuco": ["Aeroporto Internacional do Recife"],
    "Rio de Janeiro": [
        "Aeroporto Santos Dumont",
        "Aeroporto Internacional do Rio de Janeiro"
    ],
    "Rio Grande do Norte": ["Aeroporto Internacional de Natal"],
    "Rio Grande do Sul": ["Aeroporto Internacional de Porto Alegre"],
    "Santa Catarina": [
        "Aeroporto Internacional de Florianópolis",
        "Aeroporto Internacional de Navegantes"
    ],
    "São Paulo": [
        "Aeroporto Internacional de Guarulhos",
        "Aeroporto Internacional de São José dos Campos",
        "Aeroporto Internacional de Viracopos"
    ],
    "Sergipe": ["Aeroporto Internacional de Aracaju"]
}

# Tabela completa

In [73]:
# Lista para armazenar os resultados
result = []

# Itera sobre todos os aeroportos de origem na lista_origem
for aeroporto_origem in lista_origem:
    # Inicializa um dicionário para armazenar os dados de cada aeroporto de destino
    dados_aeroportos = {estado_destino: [None, None, None] for estado_destino in aeroportos_estado.keys()}
    
    # Itera sobre os aeroportos de destino
    for estado_destino, aeroporto_destino in aeroportos_estado.items():
        # Seleciona a linha com informações sobre o aeroporto de origem e destino
        linha = df.loc[(df['InputID'] == aeroporto_origem) & (df['TargetID'] == aeroporto_destino[0])]
        
        if not linha.empty:  # Verifica se há dados para a combinação de aeroportos
            # Extrai os valores necessários da linha
            distancia = linha['Distância km'].values[0]
            tempo_comercial = linha['Tempo Médio Horas - Comercial'].values[0]
            tempo_carga = linha['Tempo Médio Horas - Cargueiro'].values[0]
            
            # Atualiza os dados do estado de destino
            dados_aeroportos[estado_destino] = [distancia, tempo_comercial, tempo_carga]

    # Prepara os dados para o aeroporto de origem atual
    dados_origem = {"Origem": aeroporto_origem}
    for estado_destino, valores in dados_aeroportos.items():
        dados_origem.update({
            f"{estado_destino} (Km)": valores[0],
            f"{estado_destino} (Hr - Comercial)": valores[1],
            f"{estado_destino} (Hr - Cargueiro)": valores[2],
        })
    
    # Adiciona os dados ao resultado
    result.append(dados_origem)

# Transforma o resultado em um DataFrame
df_result = pd.DataFrame(result)

df_result

Unnamed: 0,Origem,Alagoas (Km),Alagoas (Hr - Comercial),Alagoas (Hr - Cargueiro),Amapá (Km),Amapá (Hr - Comercial),Amapá (Hr - Cargueiro),Amazonas (Km),Amazonas (Hr - Comercial),Amazonas (Hr - Cargueiro),...,Rio Grande do Sul (Hr - Cargueiro),Santa Catarina (Km),Santa Catarina (Hr - Comercial),Santa Catarina (Hr - Cargueiro),São Paulo (Km),São Paulo (Hr - Comercial),São Paulo (Hr - Cargueiro),Sergipe (Km),Sergipe (Hr - Comercial),Sergipe (Hr - Cargueiro)
0,Aeroporto Internacional de Nursultan Nazarbayev,11988,13:19 ~ 14:06,14:06 ~ 14:59,12209,13:33 ~ 14:21,14:21 ~ 15:15,13424,14:54 ~ 15:47,15:47 ~ 16:46,...,17:23 ~ 18:28,14423,16:01 ~ 16:58,16:58 ~ 18:01,13941,15:29 ~ 16:24,16:24 ~ 17:25,12243,13:36 ~ 14:24,14:24 ~ 15:18
1,Aeroporto Internacional de Xangai Pudong,16641,18:29 ~ 19:34,19:34 ~ 20:48,16473,18:18 ~ 19:22,19:22 ~ 20:35,16815,18:41 ~ 19:46,19:46 ~ 21:01,...,22:45 ~ 24:10,19014,21:07 ~ 22:22,22:22 ~ 23:46,18581,20:38 ~ 21:51,21:51 ~ 23:13,16896,18:46 ~ 19:52,19:52 ~ 21:07
2,Aeroporto Internacional de Pequim Capital,15617,17:21 ~ 18:22,18:22 ~ 19:31,15391,17:06 ~ 18:06,18:06 ~ 19:14,15927,17:41 ~ 18:44,18:44 ~ 19:54,...,21:41 ~ 23:02,18075,20:04 ~ 21:15,21:15 ~ 22:35,17578,19:31 ~ 20:40,20:40 ~ 21:58,15873,17:38 ~ 18:40,18:40 ~ 19:50
3,Aeroporto Internacional de Pyongyang Sunan,16188,17:59 ~ 19:02,19:02 ~ 20:14,15644,17:22 ~ 18:24,18:24 ~ 19:33,15853,17:36 ~ 18:39,18:39 ~ 19:48,...,22:17 ~ 23:40,18618,20:41 ~ 21:54,21:54 ~ 23:16,18106,20:07 ~ 21:18,21:18 ~ 22:37,16441,18:16 ~ 19:20,19:20 ~ 20:33
4,Aeroporto Internacional de Incheon,16388,18:12 ~ 19:16,19:16 ~ 20:29,15844,17:36 ~ 18:38,18:38 ~ 19:48,16012,17:47 ~ 18:50,18:50 ~ 20:00,...,22:31 ~ 23:56,18825,20:55 ~ 22:08,22:08 ~ 23:31,18312,20:20 ~ 21:32,21:32 ~ 22:53,16642,18:29 ~ 19:34,19:34 ~ 20:48
...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...
56,Aeroporto Adolfo Suárez Madrid-Barajas,6403,07:06 ~ 07:31,07:31 ~ 08:00,6560,07:17 ~ 07:43,07:43 ~ 08:11,7993,08:52 ~ 09:24,09:24 ~ 09:59,...,10:50 ~ 11:31,8863,09:50 ~ 10:25,10:25 ~ 11:04,8355,09:16 ~ 09:49,09:49 ~ 10:26,6658,07:23 ~ 07:49,07:49 ~ 08:19
57,Aeroporto de Barcelona-El Prat,6784,07:32 ~ 07:58,07:58 ~ 08:28,7021,07:48 ~ 08:15,08:15 ~ 08:46,8471,09:24 ~ 09:57,09:57 ~ 10:35,...,11:18 ~ 12:00,9246,10:16 ~ 10:52,10:52 ~ 11:33,8743,09:42 ~ 10:17,10:17 ~ 10:55,7040,07:49 ~ 08:16,08:16 ~ 08:48
58,Aeroporto de Tallinn,9280,10:18 ~ 10:55,10:55 ~ 11:35,9207,10:13 ~ 10:49,10:49 ~ 11:30,10385,11:32 ~ 12:13,12:13 ~ 12:58,...,14:13 ~ 15:06,11733,13:02 ~ 13:48,13:48 ~ 14:39,11222,12:28 ~ 13:12,13:12 ~ 14:01,9534,10:35 ~ 11:12,11:12 ~ 11:55
59,Aeroporto de Vágar,8260,09:10 ~ 09:43,09:43 ~ 10:19,7794,08:39 ~ 09:10,09:10 ~ 09:44,8783,09:45 ~ 10:19,10:19 ~ 10:58,...,12:51 ~ 13:40,10608,11:47 ~ 12:28,12:28 ~ 13:15,10097,11:13 ~ 11:52,11:52 ~ 12:37,8499,09:26 ~ 09:59,09:59 ~ 10:37


In [74]:
# Ordena o DataFrame pela coluna "Distrito Federal (Km)"
df_result_sorted = df_result.sort_values(by="Distrito Federal (Km)", ascending=False).reset_index(drop=True)

# Exporta o DataFrame ordenado para um arquivo CSV
df_result_sorted.to_csv('./csv_gerado/Tabela_Completa.csv', index=False)

df_result_sorted

Unnamed: 0,Origem,Alagoas (Km),Alagoas (Hr - Comercial),Alagoas (Hr - Cargueiro),Amapá (Km),Amapá (Hr - Comercial),Amapá (Hr - Cargueiro),Amazonas (Km),Amazonas (Hr - Comercial),Amazonas (Hr - Cargueiro),...,Rio Grande do Sul (Hr - Cargueiro),Santa Catarina (Km),Santa Catarina (Hr - Comercial),Santa Catarina (Hr - Cargueiro),São Paulo (Km),São Paulo (Hr - Comercial),São Paulo (Hr - Cargueiro),Sergipe (Km),Sergipe (Hr - Comercial),Sergipe (Hr - Cargueiro)
0,Aeroporto Internacional Ninoy Aquino,17431,19:22 ~ 20:30,20:30 ~ 21:47,18182,20:12 ~ 21:23,21:23 ~ 22:43,18543,20:36 ~ 21:48,21:48 ~ 23:10,...,21:18 ~ 22:38,18200,20:13 ~ 21:24,21:24 ~ 22:45,18378,20:25 ~ 21:37,21:37 ~ 22:58,17624,19:34 ~ 20:44,20:44 ~ 22:01
1,Aeroporto Internacional de Taiwan Taoyuan,17006,18:53 ~ 20:00,20:00 ~ 21:15,17106,19:00 ~ 20:07,20:07 ~ 21:22,17472,19:24 ~ 20:33,20:33 ~ 21:50,...,22:27 ~ 23:51,18969,21:04 ~ 22:18,22:18 ~ 23:42,18769,20:51 ~ 22:04,22:04 ~ 23:27,17251,19:10 ~ 20:17,20:17 ~ 21:33
2,Aeroporto Internacional de Xangai Pudong,16641,18:29 ~ 19:34,19:34 ~ 20:48,16473,18:18 ~ 19:22,19:22 ~ 20:35,16815,18:41 ~ 19:46,19:46 ~ 21:01,...,22:45 ~ 24:10,19014,21:07 ~ 22:22,22:22 ~ 23:46,18581,20:38 ~ 21:51,21:51 ~ 23:13,16896,18:46 ~ 19:52,19:52 ~ 21:07
3,Aeroporto Internacional de Hong Kong,16471,18:18 ~ 19:22,19:22 ~ 20:35,17053,18:56 ~ 20:03,20:03 ~ 21:18,17906,19:53 ~ 21:03,21:03 ~ 22:22,...,21:32 ~ 22:53,18163,20:10 ~ 21:22,21:22 ~ 22:42,18018,20:01 ~ 21:11,21:11 ~ 22:31,16697,18:33 ~ 19:38,19:38 ~ 20:52
4,Aeroporto Internacional de Kansai (Osaka),17047,18:56 ~ 20:03,20:03 ~ 21:18,16132,17:55 ~ 18:58,18:58 ~ 20:09,15914,17:40 ~ 18:43,18:43 ~ 19:53,...,22:38 ~ 24:02,19176,21:18 ~ 22:33,22:33 ~ 23:58,18773,20:51 ~ 22:05,22:05 ~ 23:27,17290,19:12 ~ 20:20,20:20 ~ 21:36
...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...
56,Aeroporto de Barcelona-El Prat (Espanha),6783,07:32 ~ 07:58,07:58 ~ 08:28,7020,07:47 ~ 08:15,08:15 ~ 08:46,8471,09:24 ~ 09:57,09:57 ~ 10:35,...,11:18 ~ 12:00,9246,10:16 ~ 10:52,10:52 ~ 11:33,8742,09:42 ~ 10:17,10:17 ~ 10:55,7039,07:49 ~ 08:16,08:16 ~ 08:47
57,Aeroporto de Barcelona-El Prat,6784,07:32 ~ 07:58,07:58 ~ 08:28,7021,07:48 ~ 08:15,08:15 ~ 08:46,8471,09:24 ~ 09:57,09:57 ~ 10:35,...,11:18 ~ 12:00,9246,10:16 ~ 10:52,10:52 ~ 11:33,8743,09:42 ~ 10:17,10:17 ~ 10:55,7040,07:49 ~ 08:16,08:16 ~ 08:48
58,Aeroporto Adolfo Suárez Madrid-Barajas,6403,07:06 ~ 07:31,07:31 ~ 08:00,6560,07:17 ~ 07:43,07:43 ~ 08:11,7993,08:52 ~ 09:24,09:24 ~ 09:59,...,10:50 ~ 11:31,8863,09:50 ~ 10:25,10:25 ~ 11:04,8355,09:16 ~ 09:49,09:49 ~ 10:26,6658,07:23 ~ 07:49,07:49 ~ 08:19
59,Aeroporto Francisco Sá Carneiro (Porto),6219,06:54 ~ 07:18,07:18 ~ 07:46,6244,06:56 ~ 07:20,07:20 ~ 07:48,7628,08:28 ~ 08:58,08:58 ~ 09:32,...,10:36 ~ 11:16,8666,09:37 ~ 10:11,10:11 ~ 10:49,8154,09:03 ~ 09:35,09:35 ~ 10:11,6471,07:11 ~ 07:36,07:36 ~ 08:05


# Dataset resumidos - por distância, emissão de CO2, horas de voo em avião comercial e de carga.

In [75]:
# Cria DataFrames separados para distâncias, emissões, tempos comerciais e tempos de carga
df_distancias = df_result.filter(["Origem"] + [f"{estado} (Km)" for estado in aeroportos_estado.keys()])
df_tempo_comercial = df_result.filter(["Origem"] + [f"{estado} (Hr - Comercial)" for estado in aeroportos_estado.keys()])
df_tempo_carga = df_result.filter(["Origem"] + [f"{estado} (Hr - Cargueiro)" for estado in aeroportos_estado.keys()])

# Exporta os DataFrames para arquivos CSV
df_distancias.to_csv('./csv_gerado/Tabela_Distâncias.csv', index=False)
df_tempo_comercial.to_csv('./csv_gerado/Tabela_Tempo_Comercial.csv', index=False)
df_tempo_carga.to_csv('./csv_gerado/Tabela_Tempo_Carga.csv', index=False)

# Exibe o DataFrame de distâncias
df_distancias

Unnamed: 0,Origem,Alagoas (Km),Amapá (Km),Amazonas (Km),Bahia (Km),Ceará (Km),Distrito Federal (Km),Espírito Santo (Km),Maranhão (Km),Mato Grosso (Km),Minas Gerais (Km),Pará (Km),Paraná (Km),Pernambuco (Km),Rio de Janeiro (Km),Rio Grande do Norte (Km),Rio Grande do Sul (Km),Santa Catarina (Km),São Paulo (Km),Sergipe (Km)
0,Aeroporto Internacional de Nursultan Nazarbayev,11988,12209,13424,12498,11724,13412,13249,12004,13962,13404,12173,14275,11852,13667,11673,14786,14423,13941,12243
1,Aeroporto Internacional de Xangai Pudong,16641,16473,16815,17150,16349,18024,17863,16524,18278,18050,16557,18921,16506,18277,16326,19342,19014,18581,16896
2,Aeroporto Internacional de Pequim Capital,15617,15391,15927,16130,15276,16936,16907,15429,17215,17040,15463,17901,15483,17323,15285,18438,18075,17578,15873
3,Aeroporto Internacional de Pyongyang Sunan,16188,15644,15853,16696,15769,17343,17515,15821,17383,17589,15771,18383,16057,17915,15838,18941,18618,18106,16441
4,Aeroporto Internacional de Incheon,16388,15844,16012,16898,15975,17549,17713,16028,17570,17793,15975,18590,16257,18116,16040,19148,18825,18312,16642
...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...
56,Aeroporto Adolfo Suárez Madrid-Barajas,6403,6560,7993,6915,6059,7742,7726,6310,8270,7821,6494,8674,6271,8129,6061,9219,8863,8355,6658
57,Aeroporto de Barcelona-El Prat,6784,7021,8471,7297,6469,8156,8096,6745,8711,8206,6945,9067,6650,8504,6450,9605,9246,8743,7040
58,Aeroporto de Tallinn,9280,9207,10385,9790,8902,10568,10608,9086,11003,10691,9200,11534,9149,11007,8933,12086,11733,11222,9534
59,Aeroporto de Vágar,8260,7794,8783,8743,7771,9345,9582,7823,9625,9597,7844,10373,8140,9945,7896,10934,10608,10097,8499


In [76]:
aeroportos_exterior = {
    "Albânia": ["Aeroporto Internacional Madre Teresa (Tirana)"],
    "Alemanha": ["Aeroporto de Frankfurt"],
    "Andorra": [
        "Aeroporto de Barcelona-El Prat (Espanha)",
        "Aeroporto de Toulouse-Blagnac (França)"
    ],
    "Áustria": ["Aeroporto Internacional de Viena"],
    "Bélgica": ["Aeroporto de Bruxelas"],
    "Bulgária": ["Aeroporto de Sófia"],
    "Cazaquistão": ["Aeroporto Internacional de Nursultan Nazarbayev"],
    "China": [
        "Aeroporto Internacional de Xangai Pudong",
        "Aeroporto Internacional de Pequim Capital"
    ],
    "Coreia do Norte": ["Aeroporto Internacional de Pyongyang Sunan"],
    "Coreia do Sul": ["Aeroporto Internacional de Incheon"],
    "Eslováquia": ["Aeroporto de Bratislava"],
    "Eslovênia": ["Aeroporto de Ljubljana Joe Pu?nik"],
    "Espanha": [
        "Aeroporto Adolfo Suárez Madrid-Barajas",
        "Aeroporto de Barcelona-El Prat (Espanha)"
    ],
    "Estônia": ["Aeroporto de Tallinn"],
    "Filipinas": ["Aeroporto Internacional Ninoy Aquino"],
    "Finlândia": ["Aeroporto de Helsinque"],
    "França": ["Aeroporto de Toulouse-Blagnac (França)"],
    "Hong Kong": ["Aeroporto Internacional de Hong Kong"],
    "Hungria": ["Aeroporto Internacional de Budapeste Ferenc Liszt"],
    "Ilhas Faroe": ["Aeroporto de Vágar"],
    "Índia": ["Aeroporto Internacional Indira Gandhi"],
    "Indonésia": [
        "Aeroporto Internacional Soekarno-Hatta (Jacarta)",
        "Aeroporto Internacional Ngurah Rai (Bali)"
    ],
    "Irlanda": ["Aeroporto de Dublin"],
    "Itália": [
        "Aeroporto de Roma-Fiumicino",
        "Aeroporto de Milão-Malpensa"
    ],
    "Japão": [
        "Aeroporto Internacional de Narita (Tóquio)",
        "Aeroporto Internacional de Haneda (Tóquio)",
        "Aeroporto Internacional de Kansai (Osaka)"
    ],
    "Laos": ["Aeroporto Internacional de Wattay (Vientiane)"],
    "Letônia": ["Aeroporto Internacional de Riga"],
    "Lituânia": ["Aeroporto Internacional de Vilnius"],
    "Luxemburgo": ["Aeroporto de Luxemburgo"],
    "Malásia": [
        "Aeroporto Internacional de Kuala Lumpur (Sepang)",
        "Aeroporto Internacional de Penang (Penang)"
    ],
    "Maldivas": ["Aeroporto Internacional de Malé"],
    "Malta": ["Aeroporto Internacional de Malta"],
    "Noruega": ["Aeroporto de Oslo-Gardermoen"],
    "Países Baixos (Holanda)": ["Aeroporto de Schiphol (Amsterdã)"],
    "Polônia": ["Aeroporto de Varsóvia Chopin"],
    "Portugal": [
        "Aeroporto Humberto Delgado (Lisboa)",
        "Aeroporto Francisco Sá Carneiro (Porto)"
    ],
    "Reino Unido": [
        "Aeroporto de Heathrow (Londres)",
        "Aeroporto de Gatwick (Londres)"
    ],
    "República Tcheca": ["Aeroporto de Praga"],
    "Romênia": ["Aeroporto Internacional Henri Coand? (Bucareste)"],
    "Rússia": [
        "Aeroporto Internacional Sheremetyevo (Moscou)",
        "Aeroporto de Pulkovo (São Petersburgo)"
    ],
    "Sérvia": ["Aeroporto Nikola Tesla (Belgrado)"],
    "Singapura": ["Aeroporto Internacional de Changi"],
    "Suécia": ["Aeroporto de Estocolmo-Arlanda"],
    "Suíça": ["Aeroporto de Zurique"],
    "Tailândia": [
        "Aeroporto Internacional de Suvarnabhumi",
        "Aeroporto Internacional Don Mueang"
    ],
    "Taiwan (Formosa)": ["Aeroporto Internacional de Taiwan Taoyuan"],
    "Turquia": ["Aeroporto de Istambul"],
    "Ucrânia": ["Aeroporto Internacional de Boryspil (Kiev)"],
    "Vietnã": [
        "Aeroporto Internacional de Tan Son Nhat",
        "Aeroporto Internacional de Noi Bai"
    ]
}


# Arrumar o dataset Rota_Original

In [77]:
# Caminho para o arquivo CSV com as rotas
file = './csv_recebidos/Rota_Original.csv'
df_rotas = pd.read_csv(file)

# Remove duplicatas e ordena o DataFrame pelo destino
df_rotas = df_rotas.drop_duplicates()
df_rotas = df_rotas.sort_values(by="Destino", ascending=True).reset_index(drop=True)
df_rotas

Unnamed: 0,Destino,Aeroporto Nacional,Origem
0,Alagoas,Aeroporto Internacional de Viracopos,China
1,Alagoas,Aeroporto Internacional de Guarulhos,China
2,Alagoas,Aeroporto Internacional de Viracopos,Alemanha
3,Alagoas,Aeroporto Internacional do Recife,Espanha
4,Alagoas,Aeroporto Internacional de Maceió,Taiwan (Formosa)
...,...,...,...
1081,São Paulo,Aeroporto Internacional de Vitória,Malásia
1082,São Paulo,Aeroporto Internacional do Rio de Janeiro,Alemanha
1083,Tocantins,Aeroporto Internacional de Vitória,China
1084,Tocantins,Aeroporto Internacional de Viracopos,Taiwan (Formosa)


# Rotas Originais

In [78]:
# Lista de estados únicos de destino
lista_estados = df_rotas['Destino'].unique().tolist()
lista_estados

['Alagoas',
 'Amapá',
 'Amazonas',
 'Bahia',
 'Ceará',
 'Distrito Federal',
 'Espírito Santo',
 'Goiás',
 'Maranhão',
 'Mato Grosso',
 'Mato Grosso do Sul',
 'Minas Gerais',
 'Paraná',
 'Paraíba',
 'Pará',
 'Pernambuco',
 'Piauí',
 'Rio Grande do Norte',
 'Rio Grande do Sul',
 'Rio de Janeiro',
 'Rondônia',
 'Roraima',
 'Santa Catarina',
 'Sergipe',
 'São Paulo',
 'Tocantins']

In [79]:
aeroportos_nome = {
    "Aeroporto Internacional de Guarulhos": "SP-Guarulhos",
    "Aeroporto Internacional do Recife": "PE",
    "Aeroporto Internacional de Salvador": "BA",
    "Aeroporto Internacional de Natal": "RN",
    "Aeroporto Internacional de São Luís": "MA",
    "Aeroporto Internacional de Fortaleza": "CE",
    "Aeroporto Internacional de Nursultan Nazarbayev": "KAZ",
    "Aeroporto Internacional de Xangai Pudong": "CHN-Xangai",
    "Aeroporto Internacional de Pequim Capital": "CHN-Pequim",
    "Aeroporto Internacional de Pyongyang Sunan": "CNR",
    "Aeroporto Internacional de Incheon": "CRS",
    "Aeroporto Internacional Ninoy Aquino": "PHL",
    "Aeroporto Internacional de Hong Kong": "HKG",
    "Aeroporto Internacional Indira Gandhi": "IND-Delhi",
    "Aeroporto Internacional Soekarno-Hatta (Jacarta)": "IND-Jakarta",
    "Aeroporto Internacional Ngurah Rai (Bali)": "IND-Bali",
    "Aeroporto Internacional de Narita (Tóquio)": "JPN-Narita",
    "Aeroporto Internacional de Haneda (Tóquio)": "JPN-Haneda",
    "Aeroporto Internacional de Kansai (Osaka)": "JPN-Kansai",
    "Aeroporto Internacional de Wattay (Vientiane)": "LAO",
    "Aeroporto Internacional de Kuala Lumpur (Sepang)": "MYS",
    "Aeroporto Internacional de Penang (Penang)": "MAL-Penang",
    "Aeroporto Internacional de Malé": "MAL",
    "Aeroporto Internacional de Changi": "SGP",
    "Aeroporto Internacional de Suvarnabhumi": "THA",
    "Aeroporto Internacional Don Mueang": "THA-DonMueang",
    "Aeroporto Internacional de Taiwan Taoyuan": "TWN-Taipei",
    "Aeroporto Internacional de Tan Son Nhat": "VNM-HoChiMinh",
    "Aeroporto Internacional de Noi Bai": "VNM-Hanoi",
    "Aeroporto de Frankfurt": "ALE",
    "Aeroporto de Dublin": "IRL",
    "Aeroporto de Varsóvia Chopin": "POL",
    "Aeroporto de Oslo-Gardermoen": "NOR",
    "Aeroporto de Roma-Fiumicino": "ITA-Roma",
    "Aeroporto de Milão-Malpensa": "ITA-Milao",
    "Aeroporto de Praga": "CZE",
    "Aeroporto de Heathrow (Londres)": "UK-Heathrow",
    "Aeroporto de Gatwick (Londres)": "UK-Gatwick",
    "Aeroporto Internacional de Budapeste Ferenc Liszt": "HUN",
    "Aeroporto de Schiphol (Amsterdã)": "NLD",
    "Aeroporto Internacional de Boryspil (Kiev)": "UKR",
    "Aeroporto de Istambul": "TUR",
    "Aeroporto de Zurique": "SUI",
    "Aeroporto de Estocolmo-Arlanda": "SWE",
    "Aeroporto Nikola Tesla (Belgrado)": "SRB",
    "Aeroporto Internacional Sheremetyevo (Moscou)": "RUS-Moscou",
    "Aeroporto de Pulkovo (São Petersburgo)": "RUS-SPetersburgo",
    "Aeroporto Internacional Henri Coand? (Bucareste)": "ROU",
    "Aeroporto Humberto Delgado (Lisboa)": "PRT-Lisboa",
    "Aeroporto Francisco Sá Carneiro (Porto)": "PRT-Porto",
    "Aeroporto Internacional de Malta": "MLT",
    "Aeroporto de Luxemburgo": "LUX",
    "Aeroporto Internacional de Vilnius": "LTU",
    "Aeroporto Internacional de Riga": "LVA",
    "Aeroporto Internacional Madre Teresa (Tirana)": "ALB",
    "Aeroporto de Barcelona-El Prat (Espanha)": "ESP-Barcelona",
    "Aeroporto de Toulouse-Blagnac (França)": "FRA-Toulouse",
    "Aeroporto Internacional de Viena": "VIE",
    "Aeroporto de Bruxelas": "BEL",
    "Aeroporto de Sófia": "BUL",
    "Aeroporto de Bratislava": "SVK",
    "Aeroporto de Ljubljana Joe Pu?nik": "SVN",
    "Aeroporto Adolfo Suárez Madrid-Barajas": "ESP-Madrid",
    "Aeroporto de Barcelona-El Prat": "ESP-Barcelona",
    "Aeroporto de Tallinn": "EST",
    "Aeroporto de Vágar": "FRO",
    "Aeroporto de Helsinque": "FIN",
    "Aeroporto Internacional de Brasília": "DF",
    "Aeroporto Internacional de Várzea Grande": "MT",
    "Aeroporto Internacional de Belém": "PA",
    "Aeroporto Internacional de Tabatinga": "AM-Tabatinga",
    "Aeroporto Internacional de Manaus": "AM-Manaus",
    "Aeroporto Internacional de Macapá": "AP",
    "Aeroporto Internacional de Fortaleza": "CE",
    "Aeroporto Internacional de Maceió": "AL",
    "Aeroporto Internacional de Aracaju": "SE",
    "Aeroporto Internacional de Belo Horizonte": "MG",
    "Aeroporto Santos Dumont": "RJ-SantosDumont",
    "Aeroporto Internacional do Rio de Janeiro": "RJ-Galeão",
    "Aeroporto Internacional de Vitória": "ES",
    "Aeroporto Internacional de São José dos Campos": "SP-SJC",
    "Aeroporto Internacional de Viracopos": "SP-Viracopos",
    "Aeroporto Internacional de Curitiba": "PR",
    "Aeroporto Internacional de Florianópolis": "SC-Florianopolis",
    "Aeroporto Internacional de Navegantes": "SC-Navegantes",
    "Aeroporto Internacional de Porto Alegre": "RS"
}

In [80]:
# Dicionário de aeroportos não Hub por estado
aeroportos_noHub = {
    'Alagoas': ['Aeroporto Internacional de Maceió'],
    'Amapá': ['Aeroporto Internacional de Macapá'],
    'Amazonas': ['Aeroporto Internacional de Tabatinga', 'Aeroporto Internacional de Manaus'],
    'Distrito Federal': ['Aeroporto Internacional de Brasília'],
    'Espírito Santo': ['Aeroporto Internacional de Vitória'],
    'Goiás': ['Aeroporto Internacional de Brasília'],
    'Mato Grosso': ['Aeroporto Internacional de Várzea Grande'],
    'Minas Gerais': ['Aeroporto Internacional de Belo Horizonte'],
    'Pará': ['Aeroporto Internacional de Belém'],
    'Paraná': ['Aeroporto Internacional de Curitiba'],
    'Rio de Janeiro': ['Aeroporto Santos Dumont', 'Aeroporto Internacional do Rio de Janeiro'],
    'Rio Grande do Sul': ['Aeroporto Internacional de Porto Alegre'],
    'Santa Catarina': ['Aeroporto Internacional de Florianópolis', 'Aeroporto Internacional de Navegantes'],
    'São Paulo': ['Aeroporto Internacional de São José dos Campos', 'Aeroporto Internacional de Viracopos', 'Aeroporto Internacional de Guarulhos'],
    'Sergipe': ['Aeroporto Internacional de Aracaju']
}

In [81]:
df_aux = df_rotas.loc[df_rotas['Destino'] == 'Alagoas']
df_aux

Unnamed: 0,Destino,Aeroporto Nacional,Origem
0,Alagoas,Aeroporto Internacional de Viracopos,China
1,Alagoas,Aeroporto Internacional de Guarulhos,China
2,Alagoas,Aeroporto Internacional de Viracopos,Alemanha
3,Alagoas,Aeroporto Internacional do Recife,Espanha
4,Alagoas,Aeroporto Internacional de Maceió,Taiwan (Formosa)
5,Alagoas,Aeroporto Internacional de Salvador,China
6,Alagoas,Aeroporto Internacional de Guarulhos,Hong Kong
7,Alagoas,Aeroporto Internacional do Recife,Alemanha
8,Alagoas,Aeroporto Internacional de Guarulhos,Reino Unido
9,Alagoas,Aeroporto Internacional de Guarulhos,Taiwan (Formosa)


In [82]:
# Dicionário para armazenar as rotas por estado
aeroportos_rotas = {}

# Preenche o dicionário com as rotas de cada estado
for i in lista_estados:
    df_aux = df_rotas.loc[df_rotas['Destino'] == i]
    u = df_aux['Origem'].unique()
    paises = u.tolist()
    aeroporto = []
    for j in paises:
        if j in aeroportos_exterior.keys():
            for k in aeroportos_exterior[j]:
                aeroporto.append(k)
    aeroportos_rotas[i] = aeroporto


aeroportos_rotas['Alagoas']

['Aeroporto Internacional de Xangai Pudong',
 'Aeroporto Internacional de Pequim Capital',
 'Aeroporto de Frankfurt',
 'Aeroporto Adolfo Suárez Madrid-Barajas',
 'Aeroporto de Barcelona-El Prat (Espanha)',
 'Aeroporto Internacional de Taiwan Taoyuan',
 'Aeroporto Internacional de Hong Kong',
 'Aeroporto de Heathrow (Londres)',
 'Aeroporto de Gatwick (Londres)']

In [83]:
dados = []  # Lista para armazenar os dados estruturados

for estado in lista_estados:
    df_aux = df_rotas.loc[df_rotas['Destino'] == estado]
    
    for _, linha in df_aux.iterrows():
        aeroporto_nacional = linha['Aeroporto Nacional']
        origem = linha['Origem']
        
        if origem in aeroportos_exterior.keys():
            for aeroporto_internacional in aeroportos_exterior[origem]:
                dados.append({
                    "Estado": estado,
                    "Aeroporto": aeroporto_nacional,
                    "Origem": aeroporto_internacional
                })

# Criar o DataFrame a partir da lista de dicionários
rotas_originais = pd.DataFrame(dados)
rotas_originais

Unnamed: 0,Estado,Aeroporto,Origem
0,Alagoas,Aeroporto Internacional de Viracopos,Aeroporto Internacional de Xangai Pudong
1,Alagoas,Aeroporto Internacional de Viracopos,Aeroporto Internacional de Pequim Capital
2,Alagoas,Aeroporto Internacional de Guarulhos,Aeroporto Internacional de Xangai Pudong
3,Alagoas,Aeroporto Internacional de Guarulhos,Aeroporto Internacional de Pequim Capital
4,Alagoas,Aeroporto Internacional de Viracopos,Aeroporto de Frankfurt
...,...,...,...
1434,São Paulo,Aeroporto Internacional do Rio de Janeiro,Aeroporto de Frankfurt
1435,Tocantins,Aeroporto Internacional de Vitória,Aeroporto Internacional de Xangai Pudong
1436,Tocantins,Aeroporto Internacional de Vitória,Aeroporto Internacional de Pequim Capital
1437,Tocantins,Aeroporto Internacional de Viracopos,Aeroporto Internacional de Taiwan Taoyuan


In [84]:
def best_route(alvo,regional):
    for i in regional:
        aux = df[(df['InputID'] == alvo) & (df['TargetID'] == i)]['Distância km'].values[0]
        min = 0
        if min == 0 or aux < min:
            melhor = i
            min = aux
    
    return melhor

def create_table(tabela, edges,internacional,regional,estado,df):
    for i in edges:
        aux = {'Destino' : estado}
        if i[0] in internacional:
            if i[1] in regional:
                aux.update({
                    'Origem' : i[0],
                    'Intermerdiario' : '*',
                    'Final' : i[1],
                    'Distancia' : df[(df['InputID'] == i[0]) & (df['TargetID'] == i[1])]['Distância km'].values[0],})
                tabela.append(aux) 
            else:
                target = best_route(i[1],regional)
                aux.update({
                    'Origem' : i[0],
                    'Intermerdiario' : i[1],
                    'Final' : target,
                    'Distancia' : df[(df['InputID'] == i[0]) & (df['TargetID'] == i[1])]['Distância km'].values[0] + df[(df['InputID'] == target) & (df['TargetID'] == i[1])]['Distância km'].values[0]},)
                tabela.append(aux) 
    return tabela

In [102]:
import pandas as pd
import networkx as nx
import matplotlib.pyplot as plt

# Função para calcular distâncias entre aeroportos
def achar_distancias(lista_nacionais, lista_interesse, df):
    df_filtrado = df[
        (df['InputID'].isin(lista_nacionais)) &
        (df['TargetID'].isin(lista_interesse))
    ]
    distancias = {}
    for nacional in lista_nacionais:
        distancias[nacional] = {}
        for interesse in lista_interesse:
            distancia = df_filtrado[
                (df_filtrado['InputID'] == nacional) & 
                (df_filtrado['TargetID'] == interesse)
            ]['Distância km']
            distancias[nacional][interesse] = distancia.values[0] if not distancia.empty else None
    return distancias

# Função para carregar o grafo a partir do DataFrame
def load_graph_from_df(df, rotas, source_airports, interest_airports, local_airport):
    distancia = achar_distancias(interest_airports, local_airport, df)

    G = nx.DiGraph()
    for _, linha in rotas.iterrows():
        source = linha['Origem']
        target = linha['Aeroporto']
        df_filtrado = df[(df['InputID'] == source) & (df['TargetID'] == target)]
        if not df_filtrado.empty:
            weight = 3.16 * (875 * df_filtrado['Distância km'].values[0]) * 4412.5
        else:
            weight = 0  # ou outro valor padrão

        G.add_edge(source, target, weight=weight)
    for airport in interest_airports:
        for local in local_airport:
            if not G.has_edge(airport, local):
                weight = 3.16 * (875 * (distancia.get(airport, {}).get(local, 0) or 0)) * 4412.5
                G.add_edge(airport, local, weight=weight)
    return G

# Função para destacar as rotas ideais
def highlight_routes(G, international_airports, national_airports, regional_airports):
    ideal_path_edges = set()
    for intl_airport in international_airports:
        if intl_airport not in G:
            continue
        try:
            min_total_weight = float('inf')
            best_path_to_regional = None
            for regional_airport in regional_airports:
                if regional_airport not in G:
                    continue
                for national_airport in national_airports:
                    if national_airport not in G:
                        continue
                    try:
                        path_to_national = nx.shortest_path(G, source=intl_airport, target=national_airport, weight='weight')
                        weight_to_national = nx.path_weight(G, path_to_national, weight='weight')
                        path_to_regional = nx.shortest_path(G, source=national_airport, target=regional_airport, weight='weight')
                        weight_to_regional = nx.path_weight(G, path_to_regional, weight='weight')
                        total_weight = weight_to_national + weight_to_regional
                        if total_weight < min_total_weight:
                            min_total_weight = total_weight
                            best_path_to_regional = path_to_national + path_to_regional[1:]
                    except nx.NetworkXNoPath:
                        continue
            if best_path_to_regional:
                for i in range(len(best_path_to_regional) - 1):
                    edge = (best_path_to_regional[i], best_path_to_regional[i + 1])
                    ideal_path_edges.add(edge)
        except nx.NetworkXNoPath:
            continue
    return list(ideal_path_edges)

# Função para plotar o grafo
def plot_clean_graph(G, ideal_path_edges, interest_airports, local_airports, title_suffix, save_path):
    pos = nx.circular_layout(G)
    plt.figure(figsize=(12, 10))
    node_colors = [
        'orange' if node in local_airports else 'lightgreen' if node in interest_airports else 'lightblue'
        for node in G.nodes
    ]
    node_labels = {
        node: aeroportos_nome[node] for node in G.nodes
    }
    nx.draw_networkx_nodes(G, pos, node_color=node_colors, node_size=800, alpha=0.9)
    regular_edges = [edge for edge in G.edges if edge not in ideal_path_edges]
    nx.draw_networkx_edges(G, pos, edgelist=regular_edges, edge_color='gray', alpha=0.5, width=1)
    nx.draw_networkx_edges(G, pos, edgelist=ideal_path_edges, edge_color='red', width=2.5)
    nx.draw_networkx_labels(G, pos, labels=node_labels, font_size=9, font_color='black')
    edge_labels = nx.get_edge_attributes(G, 'weight')
    highlighted_labels = {edge: f"{weight}" for edge, weight in edge_labels.items() if edge in ideal_path_edges}
    nx.draw_networkx_edge_labels(G, pos, edge_labels=highlighted_labels, font_size=8, font_color='red')
    plt.title(f'{title_suffix}')
    plt.axis('off')
    plt.savefig(save_path)  # Salva o gráfico em um arquivo
    plt.close()  # Fecha a figura para liberar memória

tabela_rotas = []
# Loop para processar aeroportos em lotes
for i in aeroportos_noHub.keys():
    batch_size = 30
    for j in range(0, len(aeroportos_rotas[i]), batch_size):
        subset_origem = aeroportos_rotas[i][j:j + batch_size]
        rotas = rotas_originais[
            (rotas_originais['Estado'] == i) & 
            (rotas_originais['Origem'].isin(subset_origem))
        ]
        aeroportos_intermediarios = []
        for _, linha in rotas.iterrows():
            aeroportos_intermediarios.append(linha['Aeroporto'])

        G = load_graph_from_df(df, rotas, subset_origem, aeroportos_intermediarios, aeroportos_noHub[i])
        ideal_path_edges = highlight_routes(G, subset_origem, aeroportos_intermediarios, aeroportos_noHub[i])        
        tabela_rotas = create_table(tabela_rotas,ideal_path_edges,subset_origem, aeroportos_noHub[i],i,df)
        save_path = f"grafos_rota_comercial/{i}_{j//batch_size + 1}.png"  # Define o caminho para salvar o gráfico
        plot_clean_graph(G, ideal_path_edges, aeroportos_intermediarios, aeroportos_noHub[i], title_suffix=f"{i}", save_path=save_path)

In [None]:
import pandas as pd
import networkx as nx
import matplotlib.pyplot as plt

# Função para calcular distâncias entre aeroportos
def achar_distancias(lista_nacionais, lista_interesse, df):
    df_filtrado = df[
        (df['InputID'].isin(lista_nacionais)) &
        (df['TargetID'].isin(lista_interesse))
    ]
    distancias = {}
    for nacional in lista_nacionais:
        distancias[nacional] = {}
        for interesse in lista_interesse:
            distancia = df_filtrado[
                (df_filtrado['InputID'] == nacional) & 
                (df_filtrado['TargetID'] == interesse)
            ]['Distância km']
            distancias[nacional][interesse] = distancia.values[0] if not distancia.empty else None
    return distancias

# Função para carregar o grafo a partir do DataFrame
def load_graph_from_df(df, rotas, source_airports, interest_airports, local_airport):
    distancia = achar_distancias(interest_airports, local_airport, df)

    G = nx.DiGraph()
    for _, linha in rotas.iterrows():
        source = linha['Origem']
        target = linha['Aeroporto']
        df_filtrado = df[(df['InputID'] == source) & (df['TargetID'] == target)]
        if not df_filtrado.empty:
            weight = 3.16 * (825 * df_filtrado['Distância km'].values[0]) * 5625
        else:
            weight = 0  # ou outro valor padrão

        G.add_edge(source, target, weight=weight)
    for airport in interest_airports:
        for local in local_airport:
            if not G.has_edge(airport, local):
                weight = 3.16 * (825 * (distancia.get(airport, {}).get(local, 0) or 0)) * 5625
                G.add_edge(airport, local, weight=weight)
    return G

# Função para destacar as rotas ideais
def highlight_routes(G, international_airports, national_airports, regional_airports):
    ideal_path_edges = set()
    for intl_airport in international_airports:
        if intl_airport not in G:
            continue
        try:
            min_total_weight = float('inf')
            best_path_to_regional = None
            for regional_airport in regional_airports:
                if regional_airport not in G:
                    continue
                for national_airport in national_airports:
                    if national_airport not in G:
                        continue
                    try:
                        path_to_national = nx.shortest_path(G, source=intl_airport, target=national_airport, weight='weight')
                        weight_to_national = nx.path_weight(G, path_to_national, weight='weight')
                        path_to_regional = nx.shortest_path(G, source=national_airport, target=regional_airport, weight='weight')
                        weight_to_regional = nx.path_weight(G, path_to_regional, weight='weight')
                        total_weight = weight_to_national + weight_to_regional
                        if total_weight < min_total_weight:
                            min_total_weight = total_weight
                            best_path_to_regional = path_to_national + path_to_regional[1:]
                    except nx.NetworkXNoPath:
                        continue
            if best_path_to_regional:
                for i in range(len(best_path_to_regional) - 1):
                    edge = (best_path_to_regional[i], best_path_to_regional[i + 1])
                    ideal_path_edges.add(edge)
        except nx.NetworkXNoPath:
            continue
    return list(ideal_path_edges)

# Função para plotar o grafo
def plot_clean_graph(G, ideal_path_edges, interest_airports, local_airports, title_suffix, save_path):
    pos = nx.circular_layout(G)
    plt.figure(figsize=(12, 10))
    node_colors = [
        'orange' if node in local_airports else 'lightgreen' if node in interest_airports else 'lightblue'
        for node in G.nodes
    ]
    node_labels = {
        node: aeroportos_nome[node] for node in G.nodes
    }
    nx.draw_networkx_nodes(G, pos, node_color=node_colors, node_size=800, alpha=0.9)
    regular_edges = [edge for edge in G.edges if edge not in ideal_path_edges]
    nx.draw_networkx_edges(G, pos, edgelist=regular_edges, edge_color='gray', alpha=0.5, width=1)
    nx.draw_networkx_edges(G, pos, edgelist=ideal_path_edges, edge_color='red', width=2.5)
    nx.draw_networkx_labels(G, pos, labels=node_labels, font_size=9, font_color='black')
    edge_labels = nx.get_edge_attributes(G, 'weight')
    highlighted_labels = {edge: f"{weight}" for edge, weight in edge_labels.items() if edge in ideal_path_edges}
    nx.draw_networkx_edge_labels(G, pos, edge_labels=highlighted_labels, font_size=8, font_color='red')
    plt.title(f'{title_suffix}')
    plt.axis('off')
    plt.savefig(save_path)  # Salva o gráfico em um arquivo
    plt.close()  # Fecha a figura para liberar memória

tabela_rotas = []
# Loop para processar aeroportos em lotes
for i in aeroportos_noHub.keys():
    batch_size = 30
    for j in range(0, len(aeroportos_rotas[i]), batch_size):
        subset_origem = aeroportos_rotas[i][j:j + batch_size]
        rotas = rotas_originais[
            (rotas_originais['Estado'] == i) & 
            (rotas_originais['Origem'].isin(subset_origem))
        ]
        aeroportos_intermediarios = []
        for _, linha in rotas.iterrows():
            aeroportos_intermediarios.append(linha['Aeroporto'])

        G = load_graph_from_df(df, rotas, subset_origem, aeroportos_intermediarios, aeroportos_noHub[i])
        ideal_path_edges = highlight_routes(G, subset_origem, aeroportos_intermediarios, aeroportos_noHub[i])        
        tabela_rotas = create_table(tabela_rotas,ideal_path_edges,subset_origem, aeroportos_noHub[i],i,df)
        save_path = f"grafos_rota_carga/{i}_{j//batch_size + 1}.png"  # Define o caminho para salvar o gráfico
        plot_clean_graph(G, ideal_path_edges, aeroportos_intermediarios, aeroportos_noHub[i], title_suffix=f"{i}", save_path=save_path)

In [86]:
tabela_rotas = pd.DataFrame(tabela_rotas)

# Exporta o DataFrame ordenado para um arquivo CSV
tabela_rotas.to_csv('./csv_gerado/Tabela_Rotas.csv', index=False)

tabela_rotas

Unnamed: 0,Destino,Origem,Intermerdiario,Final,Distancia
0,Alagoas,Aeroporto Internacional de Taiwan Taoyuan,*,Aeroporto Internacional de Maceió,17006
1,Alagoas,Aeroporto de Frankfurt,Aeroporto Internacional do Recife,Aeroporto Internacional de Maceió,7829
2,Alagoas,Aeroporto de Gatwick (Londres),Aeroporto Internacional de Guarulhos,Aeroporto Internacional de Maceió,11382
3,Alagoas,Aeroporto Internacional de Hong Kong,Aeroporto Internacional de Guarulhos,Aeroporto Internacional de Maceió,19979
4,Alagoas,Aeroporto Internacional de Pequim Capital,Aeroporto Internacional de Salvador,Aeroporto Internacional de Maceió,16643
...,...,...,...,...,...
449,Sergipe,Aeroporto Internacional de Narita (Tóquio),*,Aeroporto Internacional de Aracaju,17243
450,Sergipe,Aeroporto Internacional de Penang (Penang),Aeroporto Internacional de Salvador,Aeroporto Internacional de Aracaju,15671
451,Sergipe,Aeroporto Internacional de Kansai (Osaka),*,Aeroporto Internacional de Aracaju,17290
452,Sergipe,Aeroporto Internacional de Suvarnabhumi,Aeroporto Internacional do Rio de Janeiro,Aeroporto Internacional de Aracaju,17571


# Rotas pelo HUB

In [87]:
# Lista de aeroportos Hub (principais)
aeroportos_Hub = [
    "Aeroporto Internacional do Recife",
    "Aeroporto Internacional de Salvador",
    "Aeroporto Internacional de Natal",
    "Aeroporto Internacional de São Luís",
    "Aeroporto Internacional de Fortaleza"
]


In [88]:
# Dicionário para armazenar as rotas por estado
aeroportos_rotas = {}

# Preenche o dicionário com as rotas de cada estado
for i in lista_estados:
    df_aux = df_rotas.loc[df_rotas['Destino'] == i]
    u = df_aux['Origem'].unique()
    paises = u.tolist()
    aeroporto = []
    for j in paises:
        if j in aeroportos_exterior.keys():
            for k in aeroportos_exterior[j]:
                aeroporto.append(k)
    aeroportos_rotas[i] = aeroporto

In [107]:
import pandas as pd
import networkx as nx
import matplotlib.pyplot as plt

# Função para calcular distâncias entre aeroportos
def achar_distancias(lista_nacionais, lista_interesse, df):
    df_filtrado = df[
        (df['InputID'].isin(lista_nacionais)) &
        (df['TargetID'].isin(lista_interesse))
    ]
    distancias = {}
    for nacional in lista_nacionais:
        distancias[nacional] = {}
        for interesse in lista_interesse:
            distancia = df_filtrado[
                (df_filtrado['InputID'] == nacional) & 
                (df_filtrado['TargetID'] == interesse)
            ]['Distância km']
            distancias[nacional][interesse] = distancia.values[0] if not distancia.empty else None
    return distancias

# Função para carregar o grafo a partir do DataFrame
def load_graph_from_df(df, source_airports, interest_airports, local_airport):
    distancia = achar_distancias(interest_airports, local_airport, df)
    filtered_df = df[
        (df['InputID'].isin(source_airports)) & 
        (df['TargetID'].isin(interest_airports))
    ]
    G = nx.DiGraph()
    for _, linha in filtered_df.iterrows():
        source = linha['InputID']
        target = linha['TargetID']
        weight = 3.16 * (875 * (linha['Distância km'])) * 4412.5
        if target not in local_airport:
            for i in local_airport:
                G.add_edge(source, target, weight=weight)
    for airport in interest_airports:
        for local in local_airport:
            if not G.has_edge(airport, local):
                weight = 3.16 * (875 * (distancia.get(airport, {}).get(local, 0) or 0)) * 4412.5
                G.add_edge(airport, local, weight=weight)
    return G

# Função para destacar as rotas ideais
def highlight_routes(G, international_airports, national_airports, regional_airports):
    ideal_path_edges = set()
    for intl_airport in international_airports:
        if intl_airport not in G:
            continue
        try:
            min_total_weight = float('inf')
            best_path_to_regional = None
            for regional_airport in regional_airports:
                if regional_airport not in G:
                    continue
                for national_airport in national_airports:
                    if national_airport not in G:
                        continue
                    try:
                        path_to_national = nx.shortest_path(G, source=intl_airport, target=national_airport, weight='weight')
                        weight_to_national = nx.path_weight(G, path_to_national, weight='weight')
                        path_to_regional = nx.shortest_path(G, source=national_airport, target=regional_airport, weight='weight')
                        weight_to_regional = nx.path_weight(G, path_to_regional, weight='weight')
                        total_weight = weight_to_national + weight_to_regional
                        if total_weight < min_total_weight:
                            min_total_weight = total_weight
                            best_path_to_regional = path_to_national + path_to_regional[1:]
                    except nx.NetworkXNoPath:
                        continue
            if best_path_to_regional:
                for i in range(len(best_path_to_regional) - 1):
                    edge = (best_path_to_regional[i], best_path_to_regional[i + 1])
                    ideal_path_edges.add(edge)
        except nx.NetworkXNoPath:
            continue
    return list(ideal_path_edges)

# Função para plotar o grafo
def plot_clean_graph(G, ideal_path_edges, interest_airports, local_airports, title_suffix, save_path):
    pos = nx.circular_layout(G)
    plt.figure(figsize=(12, 10))
    node_colors = [
        'orange' if node in local_airports else 'lightgreen' if node in interest_airports else 'lightblue'
        for node in G.nodes
    ]
    node_labels = {
        node: aeroportos_nome[node] for node in G.nodes
    }
    nx.draw_networkx_nodes(G, pos, node_color=node_colors, node_size=800, alpha=0.9)
    regular_edges = [edge for edge in G.edges if edge not in ideal_path_edges]
    nx.draw_networkx_edges(G, pos, edgelist=regular_edges, edge_color='gray', alpha=0.5, width=1)
    nx.draw_networkx_edges(G, pos, edgelist=ideal_path_edges, edge_color='red', width=2.5)
    nx.draw_networkx_labels(G, pos, labels=node_labels, font_size=9, font_color='black')
    edge_labels = nx.get_edge_attributes(G, 'weight')
    highlighted_labels = {edge: f"{weight}" for edge, weight in edge_labels.items() if edge in ideal_path_edges}
    nx.draw_networkx_edge_labels(G, pos, edge_labels=highlighted_labels, font_size=8, font_color='red')
    plt.title(f'{title_suffix}')
    plt.axis('off')
    plt.savefig(save_path)  # Salva o gráfico em um arquivo
    plt.close()  # Fecha a figura para liberar memória

tabela_hub = []
# Loop para processar aeroportos em lotes
for i in aeroportos_noHub.keys():
    batch_size = 30
    for j in range(0, len(aeroportos_rotas[i]), batch_size):
        subset_origem = aeroportos_rotas[i][j:j + batch_size]
        G = load_graph_from_df(df, subset_origem, aeroportos_Hub, aeroportos_noHub[i])
        ideal_path_edges = highlight_routes(G, subset_origem, aeroportos_Hub, aeroportos_noHub[i])
        tabela_hub = create_table(tabela_hub, ideal_path_edges, subset_origem, aeroportos_noHub[i], i, df)
        save_path = f"grafos_hub_comercial/{i}_{j//batch_size + 1}.png"  # Define o caminho para salvar o gráfico
        plot_clean_graph(G, ideal_path_edges, aeroportos_Hub, aeroportos_noHub[i], title_suffix=f"{i}", save_path=save_path)

print('grafos gerados com sucesso')

grafos gerados com sucesso


In [108]:
import pandas as pd
import networkx as nx
import matplotlib.pyplot as plt

# Função para calcular distâncias entre aeroportos
def achar_distancias(lista_nacionais, lista_interesse, df):
    df_filtrado = df[
        (df['InputID'].isin(lista_nacionais)) &
        (df['TargetID'].isin(lista_interesse))
    ]
    distancias = {}
    for nacional in lista_nacionais:
        distancias[nacional] = {}
        for interesse in lista_interesse:
            distancia = df_filtrado[
                (df_filtrado['InputID'] == nacional) & 
                (df_filtrado['TargetID'] == interesse)
            ]['Distância km']
            distancias[nacional][interesse] = distancia.values[0] if not distancia.empty else None
    return distancias

# Função para carregar o grafo a partir do DataFrame
def load_graph_from_df(df, source_airports, interest_airports, local_airport):
    distancia = achar_distancias(interest_airports, local_airport, df)
    filtered_df = df[
        (df['InputID'].isin(source_airports)) & 
        (df['TargetID'].isin(interest_airports))
    ]
    G = nx.DiGraph()
    for _, linha in filtered_df.iterrows():
        source = linha['InputID']
        target = linha['TargetID']
        weight = 3.16 * (825 * (linha['Distância km'])) * 5625
        if target not in local_airport:
            for i in local_airport:
                G.add_edge(source, target, weight=weight)
    for airport in interest_airports:
        for local in local_airport:
            if not G.has_edge(airport, local):
                weight = 3.16 * (825 * (distancia.get(airport, {}).get(local, 0) or 0)) * 5625
                G.add_edge(airport, local, weight=weight)
    return G

# Função para destacar as rotas ideais
def highlight_routes(G, international_airports, national_airports, regional_airports):
    ideal_path_edges = set()
    for intl_airport in international_airports:
        if intl_airport not in G:
            continue
        try:
            min_total_weight = float('inf')
            best_path_to_regional = None
            for regional_airport in regional_airports:
                if regional_airport not in G:
                    continue
                for national_airport in national_airports:
                    if national_airport not in G:
                        continue
                    try:
                        path_to_national = nx.shortest_path(G, source=intl_airport, target=national_airport, weight='weight')
                        weight_to_national = nx.path_weight(G, path_to_national, weight='weight')
                        path_to_regional = nx.shortest_path(G, source=national_airport, target=regional_airport, weight='weight')
                        weight_to_regional = nx.path_weight(G, path_to_regional, weight='weight')
                        total_weight = weight_to_national + weight_to_regional
                        if total_weight < min_total_weight:
                            min_total_weight = total_weight
                            best_path_to_regional = path_to_national + path_to_regional[1:]
                    except nx.NetworkXNoPath:
                        continue
            if best_path_to_regional:
                for i in range(len(best_path_to_regional) - 1):
                    edge = (best_path_to_regional[i], best_path_to_regional[i + 1])
                    ideal_path_edges.add(edge)
        except nx.NetworkXNoPath:
            continue
    return list(ideal_path_edges)

# Função para plotar o grafo
def plot_clean_graph(G, ideal_path_edges, interest_airports, local_airports, title_suffix, save_path):
    pos = nx.circular_layout(G)
    plt.figure(figsize=(12, 10))
    node_colors = [
        'orange' if node in local_airports else 'lightgreen' if node in interest_airports else 'lightblue'
        for node in G.nodes
    ]
    node_labels = {
        node: aeroportos_nome[node] for node in G.nodes
    }
    nx.draw_networkx_nodes(G, pos, node_color=node_colors, node_size=800, alpha=0.9)
    regular_edges = [edge for edge in G.edges if edge not in ideal_path_edges]
    nx.draw_networkx_edges(G, pos, edgelist=regular_edges, edge_color='gray', alpha=0.5, width=1)
    nx.draw_networkx_edges(G, pos, edgelist=ideal_path_edges, edge_color='red', width=2.5)
    nx.draw_networkx_labels(G, pos, labels=node_labels, font_size=9, font_color='black')
    edge_labels = nx.get_edge_attributes(G, 'weight')
    highlighted_labels = {edge: f"{weight}" for edge, weight in edge_labels.items() if edge in ideal_path_edges}
    nx.draw_networkx_edge_labels(G, pos, edge_labels=highlighted_labels, font_size=8, font_color='red')
    plt.title(f'{title_suffix}')
    plt.axis('off')
    plt.savefig(save_path)  # Salva o gráfico em um arquivo
    plt.close()  # Fecha a figura para liberar memória

tabela_hub = []
# Loop para processar aeroportos em lotes
for i in aeroportos_noHub.keys():
    batch_size = 30
    for j in range(0, len(aeroportos_rotas[i]), batch_size):
        subset_origem = aeroportos_rotas[i][j:j + batch_size]
        G = load_graph_from_df(df, subset_origem, aeroportos_Hub, aeroportos_noHub[i])
        ideal_path_edges = highlight_routes(G, subset_origem, aeroportos_Hub, aeroportos_noHub[i])
        tabela_hub = create_table(tabela_hub, ideal_path_edges, subset_origem, aeroportos_noHub[i], i, df)
        save_path = f"grafos_hub_carga/{i}_{j//batch_size + 1}.png"  # Define o caminho para salvar o gráfico
        plot_clean_graph(G, ideal_path_edges, aeroportos_Hub, aeroportos_noHub[i], title_suffix=f"{i}", save_path=save_path)

print('grafos gerados com sucesso')

grafos gerados com sucesso


In [90]:
tabela_hub = pd.DataFrame(tabela_hub)

# Exporta o DataFrame ordenado para um arquivo CSV
tabela_hub.to_csv('./csv_gerado/Tabela_Hub.csv', index=False)

tabela_hub

Unnamed: 0,Destino,Origem,Intermerdiario,Final,Distancia
0,Alagoas,Aeroporto de Frankfurt,Aeroporto Internacional do Recife,Aeroporto Internacional de Maceió,7829
1,Alagoas,Aeroporto de Gatwick (Londres),Aeroporto Internacional do Recife,Aeroporto Internacional de Maceió,7501
2,Alagoas,Aeroporto Internacional de Hong Kong,Aeroporto Internacional do Recife,Aeroporto Internacional de Maceió,16479
3,Alagoas,Aeroporto Internacional de Taiwan Taoyuan,Aeroporto Internacional do Recife,Aeroporto Internacional de Maceió,17008
4,Alagoas,Aeroporto Internacional de Pequim Capital,Aeroporto Internacional do Recife,Aeroporto Internacional de Maceió,15619
...,...,...,...,...,...
449,Sergipe,Aeroporto Internacional de Budapeste Ferenc Liszt,Aeroporto Internacional do Recife,Aeroporto Internacional de Aracaju,8526
450,Sergipe,Aeroporto Internacional de Haneda (Tóquio),Aeroporto Internacional de Natal,Aeroporto Internacional de Aracaju,17274
451,Sergipe,Aeroporto Internacional de Narita (Tóquio),Aeroporto Internacional de Natal,Aeroporto Internacional de Aracaju,17260
452,Sergipe,Aeroporto Internacional de Suvarnabhumi,Aeroporto Internacional do Recife,Aeroporto Internacional de Aracaju,15548


# Tabela comparativa entre as rotas originais e as propostas

In [93]:
# Criando um novo dataset contendo apenas as colunas desejadas da tabela de rotas
tabela_comparativa = tabela_rotas[['Destino', 'Origem', 'Distancia']].copy()

# Renomeando as colunas para melhor compreensão
tabela_comparativa.rename(columns={'Destino': 'Estado', 'Distancia': 'Distância original'}, inplace=True)

# Agrupando a tabela_hub por 'Destino' e 'Origem', calculando a média das distâncias para cada grupo
tabela_hub = tabela_hub.groupby(['Destino', 'Origem'], as_index=False).agg({'Distancia': 'mean'})

# Mesclando a tabela_comparativa com a tabela_hub para obter a distância média por hub
tabela_comparativa = tabela_comparativa.merge(
    tabela_hub[['Destino', 'Origem', 'Distancia']],  # Seleciona apenas as colunas necessárias da tabela_hub
    left_on=['Estado', 'Origem'],  # Realiza o merge com base nessas colunas na tabela_comparativa
    right_on=['Destino', 'Origem'],  # Realiza o merge com base nessas colunas na tabela_hub
    how='left'  # Mantém todas as linhas da tabela_comparativa, mesmo que não haja correspondência na tabela_hub
)

# Renomeando a coluna de distância da rota proposta via hub
tabela_comparativa.rename(columns={'Distancia': 'Distância por hub'}, inplace=True)

# Removendo a coluna 'Destino', pois já foi renomeada para 'Estado'
tabela_comparativa.drop(columns=['Destino'], inplace=True)

# Convertendo a coluna 'Distância por hub' para valores inteiros
tabela_comparativa['Distância por hub'] = tabela_comparativa['Distância por hub'].astype(int)

# Salvando a tabela comparativa em um arquivo CSV
tabela_comparativa.to_csv('./csv_gerado/Tabela_Comparativa.csv', index=False)

# Exibindo a tabela gerada
tabela_comparativa

Unnamed: 0,Estado,Origem,Distância original,Distância por hub
0,Alagoas,Aeroporto Internacional de Taiwan Taoyuan,17006,17008
1,Alagoas,Aeroporto de Frankfurt,7829,7829
2,Alagoas,Aeroporto de Gatwick (Londres),11382,7501
3,Alagoas,Aeroporto Internacional de Hong Kong,19979,16479
4,Alagoas,Aeroporto Internacional de Pequim Capital,16643,15619
...,...,...,...,...
449,Sergipe,Aeroporto Internacional de Narita (Tóquio),17243,17260
450,Sergipe,Aeroporto Internacional de Penang (Penang),15671,15467
451,Sergipe,Aeroporto Internacional de Kansai (Osaka),17290,17291
452,Sergipe,Aeroporto Internacional de Suvarnabhumi,17571,15548


In [94]:
# Agrupando os dados por estado para análise comparativa
analise_por_estado = tabela_comparativa.groupby('Estado').apply(
    lambda x: pd.Series({
        'iguais': (x['Distância original'] == x['Distância por hub']).sum(),  # Contagem de distâncias iguais
        'hub_menor': (x['Distância por hub'] < x['Distância original']).sum(),  # Contagem de casos onde a rota via hub é menor
        'original_menor': (x['Distância original'] < x['Distância por hub']).sum()  # Contagem de casos onde a rota original é menor
    })
).reset_index()

# Determinando qual rota é melhor para cada estado
analise_por_estado['Melhor rota'] = analise_por_estado.apply(
    lambda x: 'Original' if x['original_menor'] >= x['hub_menor'] else 'Proposta',
    axis=1
)

# Exibindo a análise por estado
print(analise_por_estado)

# Verificando qual rota é melhor no geral, somando os casos onde a rota original ou via hub é menor
total_original_menor = analise_por_estado['original_menor'].sum()
total_hub_menor = analise_por_estado['hub_menor'].sum()

# Comparando os totais para determinar a conclusão geral
if total_original_menor >= total_hub_menor:
    print("\nConclusão geral: A distância original é melhor que a rota proposta.")
else:
    print("\nConclusão geral: A distância proposta é melhor que a rota original.")


               Estado  iguais  hub_menor  original_menor Melhor rota
0             Alagoas       3          5               1    Proposta
1               Amapá       0          0              10    Original
2            Amazonas       1          0              40    Original
3    Distrito Federal       2          7              21    Original
4      Espírito Santo       4          5              32    Original
5               Goiás       0         12              15    Original
6         Mato Grosso       0          2               2    Original
7        Minas Gerais       9          9              26    Original
8              Paraná       4          0              35    Original
9                Pará       0         10              14    Original
10  Rio Grande do Sul       6          1              32    Original
11     Rio de Janeiro       5          0              35    Original
12     Santa Catarina       6          6              27    Original
13            Sergipe       0     

  analise_por_estado = tabela_comparativa.groupby('Estado').apply(
