## Descrição

Notebook onde se cria um ficheiro para cada circuito com todos os pontos, identificados por id, latitude e longitude

In [1]:
import pandas as pd
import os

In [2]:
# Caminhos dos ficheiros
locais_path = "../data/raw/locais.xlsx"
seletiva_nivel_path = "../data/raw/seletiva_nivel.xlsx"
output_dir = "../data/sim_data"
os.makedirs(output_dir, exist_ok=True)

In [3]:
# Carregar os dados dos locais
locais_df = pd.read_excel(locais_path)

# Carregar as duas folhas do seletiva_nivel.xlsx
seletiva_nivel_df1 = pd.read_excel(seletiva_nivel_path, sheet_name='Result 1')
seletiva_nivel_df2 = pd.read_excel(seletiva_nivel_path, sheet_name='Result 2')

# Combinar as duas folhas
seletiva_nivel_combined = pd.concat([seletiva_nivel_df1, seletiva_nivel_df2])

In [4]:
# Substituições nos nomes dos circuitos
substituicoes = {
    'Circuito 03 32': 'Circuito 03',
    'Cricuito 08': 'Circuito 08',
    'Circ. Ilhas S': 'Circ. Ilhas',
    'circuito 05': 'Circuito 05',
    'Circ. Ilhas 04': 'Circ. Ilhas',
    'Circuito 09 92': 'Circuito 09',
    'Circuito Ilhas': 'Circ. Ilhas'
}

# Aplicar substituições
seletiva_nivel_combined['info_adicional'] = seletiva_nivel_combined['info_adicional'].replace(substituicoes)

# Remover entradas indesejadas
seletiva_nivel_combined = seletiva_nivel_combined[
    ~seletiva_nivel_combined['info_adicional'].isin(['via recolha', 'GP 91'])
]

# Remover o ID 6394
seletiva_nivel_combined = seletiva_nivel_combined[seletiva_nivel_combined['local_id'] != 6394]

# Renomear coluna 'id' para 'local_id' para fazer o merge
locais_df.rename(columns={'id': 'local_id'}, inplace=True)

# Merge entre os dois dataframes
resultado_df = pd.merge(seletiva_nivel_combined, locais_df, on='local_id', how='inner')

In [5]:
resultado_df.head(10)

Unnamed: 0,id,time,info_adicional,tipo,nivel,local_id,produto_id,local_uuid_id,codigolocal,local,...,numero,tipo_id,str_circuito_indiferenciado,str_circuito_seletivo,localizacao_id,observacoes,n_cais,n_fixadores,uuid,is_underground
0,5392957,2024-03-08 06:22:58+00,Circuito 11,Papel,4,3666,,,CAS0122,",",...,0,8,,"circuito_08_papel, circuito_08_plastico, papel...",4018329,",",0,0,6fffd3f1-6522-4059-9c27-e183a8802d7a,True
1,5392958,2024-03-08 06:22:58+00,Circuito 11,Embalagens,5,3666,,,CAS0122,",",...,0,8,,"circuito_08_papel, circuito_08_plastico, papel...",4018329,",",0,0,6fffd3f1-6522-4059-9c27-e183a8802d7a,True
2,5392959,2024-03-08 06:22:58+00,Circuito 11,Vidro,2,3666,,,CAS0122,",",...,0,8,,"circuito_08_papel, circuito_08_plastico, papel...",4018329,",",0,0,6fffd3f1-6522-4059-9c27-e183a8802d7a,True
3,5392960,2024-03-08 06:23:05+00,Circuito 11,Embalagens,0,3666,,,CAS0122,",",...,0,8,,"circuito_08_papel, circuito_08_plastico, papel...",4018329,",",0,0,6fffd3f1-6522-4059-9c27-e183a8802d7a,True
4,5392966,2024-03-08 06:25:38+00,Circuito 08,Vidro,0,3647,,,CAS0097,",",...,0,8,ind_121,"papel_circuito_6, circuito_08_papel, circuito_...",4003197,",",0,0,bb9d460b-57fe-4049-b482-86358dd0a4d2,True
5,5392968,2024-03-08 06:27:16+00,Circuito 03,Embalagens,2,3927,,,PAR0063,",",...,0,7,,"papel_circuito_5, plastico_circuito_5, circuit...",4012757,",",0,0,e995231d-3303-4d3b-b5a9-c9b14b93edff,False
6,5392969,2024-03-08 06:27:16+00,Circuito 03,Vidro,1,3927,,,PAR0063,",",...,0,7,,"papel_circuito_5, plastico_circuito_5, circuit...",4012757,",",0,0,e995231d-3303-4d3b-b5a9-c9b14b93edff,False
7,5392970,2024-03-08 06:28:01+00,Circuito 11,Embalagens,3,3712,,,CAS0194,",",...,0,8,ind_101,"circuito_08_papel, circuito_08_plastico, papel...",8339844,",",2,2,08ad0edd-6cb5-44af-b953-dc06aa579bca,False
8,5392971,2024-03-08 06:28:01+00,Circuito 11,Vidro,2,3712,,,CAS0194,",",...,0,8,ind_101,"circuito_08_papel, circuito_08_plastico, papel...",8339844,",",2,2,08ad0edd-6cb5-44af-b953-dc06aa579bca,False
9,5392972,2024-03-08 06:28:06+00,Circuito 11,Embalagens,0,3712,,,CAS0194,",",...,0,8,ind_101,"circuito_08_papel, circuito_08_plastico, papel...",8339844,",",2,2,08ad0edd-6cb5-44af-b953-dc06aa579bca,False


In [6]:
# Coordenadas fixas
estaleiro = {'id': 0, 'lat': 38.737235, 'lon': -9.387461}
tratolixo = {'id': 1, 'lat': 38.744940, 'lon': -9.327972}

# Criar ficheiros por circuito
circuitos_unicos = resultado_df['info_adicional'].unique()

for circuito in circuitos_unicos:
    df_circuito = resultado_df[resultado_df['info_adicional'] == circuito]
    
    # Selecionar e renomear colunas
    df_saida = df_circuito[['local_id', 'latitude', 'longitude']].drop_duplicates().rename(columns={
        'local_id': 'id',
        'latitude': 'lat',
        'longitude': 'lon'
    })

    df_saida = df_saida.sort_values(by='id')

    # Adicionar os pontos fixos
    df_final = pd.concat([
        pd.DataFrame([estaleiro, tratolixo]),
        df_saida
    ], ignore_index=True)

    # Guardar o ficheiro
    nome_ficheiro = f"{circuito.replace(' ', '_').replace('/', '-')}_pontos.csv"
    df_final.to_csv(os.path.join(output_dir, nome_ficheiro), index=False)

print("Ficheiros criados com sucesso.")

Ficheiros criados com sucesso.
