In [5]:
import pandas as pd
from datetime import datetime

# Função para converter datetime para tempo absoluto (segundos desde a epoch)
def datetime_to_absolute_seconds(dt_value):
    if isinstance(dt_value, str):
        dt = datetime.strptime(dt_value, "%Y-%m-%dT%H:%M:%SZ")
    else:
        dt = dt_value
    epoch = datetime(1970, 1, 1)
    return int((dt - epoch).total_seconds())

# Função para concatenar nomes das colunas 1 e 3
def concat_names(row):
    return ''.join(row.split())

# Ler o arquivo Excel e selecionar a planilha 'services'
#arquivo_excel = 'input_full.xlsx'
arquivo_excel = 'input_100_OK.xlsx'
df = pd.read_excel(arquivo_excel, sheet_name='services', usecols=[0, 1, 2, 3, 4])

# Converter colunas 0, 1 e 3 para minúsculas
df['id'] = df['id'].str.lower()
df['startLocation'] = df['startLocation'].str.lower()
df['endLocation'] = df['endLocation'].str.lower()

# Concatenar nomes das colunas 1 e 3
df['startLocation'] = df['startLocation'].apply(concat_names)
df['endLocation'] = df['endLocation'].apply(concat_names)

# Converter colunas 2 e 4 para tempo absoluto em segundos
df['startDatetime'] = df['startDatetime'].apply(datetime_to_absolute_seconds)
df['endDatetime'] = df['endDatetime'].apply(datetime_to_absolute_seconds)

# Encontrar o menor valor para normalização
min_time = min(df['startDatetime'].min(), df['endDatetime'].min())

# Normalizar os tempos
df['startDatetime'] = df['startDatetime'] - min_time
df['endDatetime'] = df['endDatetime'] - min_time

# Formatar a saída no formato desejado
output = "services([\n"
for _, row in df.iterrows():
    output += f"    ({row['id']},{row['startLocation']},{row['startDatetime']},{row['endLocation']},{row['endDatetime']}),\n"
output = output.rstrip(",\n") + "\n])."

# Escrever a saída em um arquivo texto
with open('service.txt', 'w') as f:
    f.write(output)

# Imprimir o resultado no console
print("Resultado final:" , len(output))
print(output)
print("\nProcessamento concluído e saída salva em 'service.txt'")
# testar se OK com : $ grep ",0," service.txt 

Resultado final: 3509
services([
    (a001,hgrd,37740,hesh,62700),
    (a002,hesh,128400,hcn,154800),
    (a003,hcn,318900,hbwk,348000),
    (a004,hbwk,389400,hsan,436200),
    (a005,hsan,472500,hcn,504600),
    (a006,hcn,551400,hgrd,571500),
    (a007,hgrd,642540,hesh,667500),
    (b001,bwur,68400,lks,93300),
    (b002,lks,126600,hclg,175800),
    (b003,hclg,227400,un,262200),
    (b004,un,307800,hclg,344700),
    (b005,hclg,388500,dro,433800),
    (b006,dro,574200,atk,608700),
    (c001,bwur,60600,wmo,96900),
    (c002,wmo,135900,lgs,174600),
    (c003,lgs,217800,hclp,275700),
    (c004,hclp,308100,bhc,366900),
    (c005,bhc,392700,atk,442800),
    (c006,atk,483000,lgs,524700),
    (d001,bhc,139200,bno,177000),
    (d002,bno,199500,bwur,207600),
    (d003,bwur,219300,lgs,249000),
    (d004,lgs,300000,bhul,325200),
    (d005,bhul,397200,bhc,432900),
    (d006,bhc,481800,bwur,522600),
    (d007,bwur,555900,bruh,558000),
    (d008,bruh,564900,bwur,572100),
    (e001,hbsr,53400,hloe,9960

In [7]:
import pandas as pd
from datetime import datetime

# Função para converter datetime para tempo absoluto (segundos desde a epoch)
def datetime_to_absolute_seconds(dt_value):
    if isinstance(dt_value, str):
        dt = datetime.strptime(dt_value, "%Y-%m-%dT%H:%M:%SZ")
    else:
        dt = dt_value
    epoch = datetime(1970, 1, 1)
    return int((dt - epoch).total_seconds())

# Função para limpar strings: remover espaços e converter para minúsculas
def clean_string(s):
    return s.replace(' ', '').lower()

# Ler o arquivo Excel e selecionar a planilha 'locomotives'
arquivo_excel = 'input_full.xlsx'
df = pd.read_excel(arquivo_excel, sheet_name='locomotives', usecols=[0, 1, 2, 3])

# Limpar as colunas 'id', 'locomotiveClass', e 'location'
df['id'] = df['id'].astype(str).apply(clean_string)
df['locomotiveClass'] = df['locomotiveClass'].astype(str).apply(clean_string)
df['location'] = df['location'].astype(str).apply(clean_string)

# Converter a coluna 'locationDatetime' para tempo absoluto em segundos
df['locationDatetime'] = df['locationDatetime'].apply(datetime_to_absolute_seconds)

# Encontrar o menor valor para normalização
min_time = df['locationDatetime'].min()

# Normalizar os tempos
df['locationDatetime'] = df['locationDatetime'] - min_time

'''
# Formatar a saída no formato desejado para a primeira parte
output = "locomotives([\n"
for _, row in df.iterrows():
    output += f"    ('{row['id']}', {row['locomotiveClass']}, '{row['location']}', {row['locationDatetime']}),\n"
output = output.rstrip(",\n") + "\n]).\n\n"
'''

# Salvar a coluna de 'id' no formato desejado
ids_output = "locomotives(["
ids_output += ', '.join(f"'{row['id']}'" for _, row in df.iterrows())
ids_output += "]).\n\n"

# Salvar a coluna de 'location' no formato desejado
locations_output = "init_location(["
locations_output += ', '.join(f"'{row['location']}'" for _, row in df.iterrows())
locations_output += "]).\n\n"

# Salvar a coluna de 'locationDatetime' no formato desejado
times_output = "init_time(["
times_output += ', '.join(f"{row['locationDatetime']}" for _, row in df.iterrows())
times_output += "]).\n"

# Combinar todos os outputs
final_output = ids_output + locations_output + times_output 
##+ "\n" + output

# Escrever a saída em um arquivo texto
with open('locomotives.txt', 'w') as f:
    f.write(final_output)

# Imprimir o resultado no console
print("Resultado final:")
print(final_output)
print("\nProcessamento concluído e saída salva em 'locomotives.txt'")


Resultado final:
locomotives(['159-001', '159-002', '159-003', '159-004', '159-005', '159-006', '159-007', '159-009', '159-010', '159-011', '159-219', '159-223', '246-001', '295-950', '203-144', '203-616']).

init_location(['hgrd', 'bwur', 'bwur', 'bhc', 'hbsr', 'hcn', 'bwur', 'bwur', 'bwur', 'lqb', 'bwur', 'hmg', 'lbkn', 'hcn', 'bwur', 'bwur']).

init_time([37740, 68400, 60600, 139200, 53400, 56100, 41700, 147900, 67200, 54600, 126600, 0, 187800, 21000, 299400, 88800]).


Processamento concluído e saída salva em 'locomotives.txt'


In [None]:
## juntar os 2 arquivos acima ... em algum .pi