<a href="https://colab.research.google.com/github/CesarDora/Exploration_of_data_generated_by_passenger_trains/blob/main/Vers%C3%A3o_GITHUB.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>



```
# Isto está formatado como código
```

Dissertação apresentada à Escola Politécnica da Universidade de São Paulo para obtenção do título de Mestre em Ciências

Título: Exploração de dados gerados em trens de passageiros: informações operacionais em estações

Autor: Cesar Augusto Doratiotto
Orientador: Prof. Dr. Claudio L. Marte


In [None]:
import pandas as pd
import os
#configura google colab pra ler arquivos no drive
from google.colab import drive
drive.mount('/content/gdrive', force_remount=True)

Mounted at /content/gdrive


In [None]:
def minha_funcao (df, file_name):
  try:
    #Cria coluna datetime juntando os valores de Data e Tempo
    df["datetime"] = df["Data"] + " " + df["Tempo"]

    #Converte formato de String para datetime
    df["datetime"] =  pd.to_datetime(df["datetime"])
    #df["datetime"]

    #ID do Registro, Data, Tempo e Tail_Car_Relay são desnecessários depois da criação de datetime e verificação do sentido do trem
    df = df.drop(columns=["ID do Registro", "Data", "Tempo", "Tail_Car_Relay"])
    #df.head

    #Renomeia colunas do dataframe para padronização
    column_mapping = {
      'Distância (km)': 'distance (km)',
      'Speed (km/h)': 'speed (km/h)',
      'All_Door_Closed': 'all_doors_closed',
      'TRAIN_WEIGHT (kg)': 'train_weight (kg)',
      'Head_Car_Relay': 'head_car_relay',
      'datetime': 'datetime'
    }

    #Renomeia as colunas do DataFrame com base no mapeamento
    df.columns = [column_mapping[col] if col in column_mapping else col for col in df.columns]

    # Garanti a ordem das colunas
    ordered_columns = ['distance (km)', 'datetime', 'speed (km/h)', 'head_car_relay', 'all_doors_closed', 'train_weight (kg)']
    df = df[ordered_columns]

    #Converte colunas de zeros e uns para True e False
    df['all_doors_closed'] = df['all_doors_closed'].astype('bool')
    df['head_car_relay'] = df['head_car_relay'].astype('bool')

    #Os registros com velocidades altas são desnecessários para nossa análise
    #Remove registros com velocidade > v_max (1km/h)
    v_max = 1
    df = df.drop(df[df["speed (km/h)"] > v_max].index)

    #Remove linhas duplicadas
    df = df.drop_duplicates()

    #Defino a função que diz o estado do trem, como variável categórica
    #Existem 3 possíveis estados:
    # Andando (A)
    # Parado com portas fechadas (PPF)
    # Parado com portas abertas (PPA)
    def evaluate_state(row):
      stopping_speed = 0.5 #ver extras no final do documento
      #Andando
      if row['speed (km/h)'] >= stopping_speed and row ['all_doors_closed'] == 1:
        return "A"
      #Parado com portas fechadas
      if row['speed (km/h)'] < stopping_speed and row['all_doors_closed'] == 1:
        return "PPF"
      #Parado com portas abertas
      if row['speed (km/h)'] < stopping_speed and row['all_doors_closed'] == 0:
        return "PPA"

        #Crio uma nova coluna com os valores baseados na função que defini acima
    df['train_state'] = df.apply(evaluate_state, axis=1)

    #Defino função que diz se houve transição de estado - se o valor da linha anterior e linha atual for diferente houve transição
    def evaluate_state_changes(row):
        index = df.index.get_loc(row.name)
        if index == 0:
          return False
        prev_row = df.iloc[index - 1]
        return (row['train_state'] != prev_row['train_state'])

        #Cria nova coluna com as mudanças de estado
    df['train_state_changed'] = df.apply(evaluate_state_changes, axis=1)

    #Em alguns casos temos velocidades próximas de 0 (todas menores que 0.5) em que o trem abre as portas
    #como as distâncias não mudam, sabemos que o trêm está parado e isto pode ser ruído do tacogerador ou irrelevantes deslocamentos
    df[(df['speed (km/h)'] < 1) & (df['speed (km/h)'] > 0) & (df['all_doors_closed'] == False)]

    df_stations1 = df[((df['train_state'] == "PPA") | (df['train_state'] == "A")) & (df['train_state_changed'] == True)]
    # Converta a coluna 'datetime' para o tipo datetime
    df_stations1['datetime'] = pd.to_datetime(df_stations1['datetime'])
    # Inicialize uma coluna para armazenar o tempo de abertura das portas
    df_stations1['Portas_abertas'] = 0
    # Inicialize uma variável para rastrear o tempo em segundos entre "PPA" e "A"
    tempo_abertura = 0
    # Percorra o DataFrame e calcule o tempo de abertura das portas
    for index, row in df_stations1.iterrows():
        if row['train_state'] == "PPA":
            # Encontre o próximo índice onde 'train_state' é 'A' após 'PPA'
            proximo_indice_a = df_stations1[(df_stations1['train_state'] == 'A') & (df_stations1.index > index)].index.min()
            if not pd.isna(proximo_indice_a):
                # Calcule o tempo de abertura das portas
                tempo_abertura = (df_stations1.at[proximo_indice_a, 'datetime'] - row['datetime']).total_seconds()
                df_stations1.at[index, 'Portas_abertas'] = tempo_abertura

    df_stations = df_stations1[(df['train_state'] == "PPA") & (df['train_state_changed'] == True)]

    #Defino função que diz se é inicio ou fim da linha
    def evaluate_start_or_end(row):
        index = df_stations.index.get_loc(row.name)
        if index == 0:
          return False
        prev_row = df_stations.iloc[index - 1]
        return (row['head_car_relay'] != prev_row['head_car_relay'])

    #Calcula distância percorrida desde a parada anterior
    df_stations['distance_from_previous (km)'] = df_stations['distance (km)'] - df_stations.shift(1)['distance (km)']

    #Como está em km, mas o registrador marca até 6 casas decimais, uso o arredondamento para na comparação com a referência criar comparação correta
    df_stations['distance_from_previous (km)'] = df_stations['distance_from_previous (km)'].round(3)

    # Filtra as linhas onde a distância seja superior ou igual a 0.8, por causa das voltas de comando
    df_stations = df_stations[(df_stations['distance_from_previous (km)'] >= 0.8)]

    #diz se é inicio ou fim da linha
    df_stations['start_or_end'] = df_stations.apply(evaluate_start_or_end, axis=1)
    df_stations

    #colocar localização do arquivo no Google drive, começando com /content/gdrive
    dir = "/content/gdrive/My Drive/teste dissertacao/Distânicas estações_elaborada DataSet_usp.xlsx"
    #lê arquivo e cria dataframe
    df_distances = pd.read_excel(dir)
    #utilizo somente as colunas que me importam
    df_distances = df_distances[['Estação Origem', 'Estação de destino', 'Distânica (km)']]
    #renomeia colunas do dataframe para padronização
    #nomes em Inglês, em snake_case e com unidades entre parênteses separadas por espaços
    df_distances = df_distances.set_axis(['origin_station', 'destination_station','distance (km)'], axis=1)
    #excluo linhas que não tem nome de estações. Na planilha são as linhas antes do total
    df_distances = df_distances.dropna()
    df_distances
    #manipula a lista de distâncias para gerar um dataframe do sentido oposto
    df_distances_opposite = df_distances[::-1]
    df_distances_opposite = df_distances_opposite.reset_index(drop=True)
    df_distances_opposite = df_distances_opposite.set_axis(['destination_station', 'origin_station', 'distance (km)'], axis=1)
    df_distances_opposite = df_distances_opposite[['origin_station', 'destination_station','distance (km)']]
    df_distances_opposite

  # Adicionar uma coluna para o nome das estações, se ainda não estiver presente
    df_stations['station_name'] = ""

    epsilon = 0.25  # variação de 250m para classificação
    epsilon2 = 0.15 # variação de 150m para validação
    first_station_dist = df_distances.at[0, 'distance (km)']
    first_station_dist_opposite = df_distances_opposite.at[0, 'distance (km)']
    start_found = False
    station_index = 0

    # Primeiro, mapeia as estações começando pelo primeiro "start_or_end=True"
    for i in df_stations.index:
        if df_stations.at[i, 'start_or_end']:
            station_index = 0
            station_dist = df_stations.at[i, 'distance_from_previous (km)']

            # Validação para a direção normal
            if first_station_dist - epsilon <= station_dist <= first_station_dist + epsilon:
                if station_index < len(df_distances):
                    df_stations.at[i, 'station_name'] = df_distances.at[station_index, 'destination_station']
                    print("Achei um início!")
                    start_found = True
                    opposite = False
            # Validação para a direção oposta
            elif first_station_dist_opposite - epsilon <= station_dist <= first_station_dist_opposite + epsilon:
                if station_index < len(df_distances_opposite):
                    df_stations.at[i, 'station_name'] = df_distances_opposite.at[station_index, 'destination_station']
                    print("Achei um início!")
                    start_found = True
                    opposite = True
        elif start_found and not opposite:
            station_index += 1
            if station_index < len(df_distances):  # Verificar se o índice é válido
                station_dist = df_stations.at[i, 'distance_from_previous (km)']
                ref_dist = df_distances.at[station_index, 'distance (km)']

                # Validação da distância
                if ref_dist - epsilon <= station_dist <= ref_dist + epsilon:
                    df_stations.at[i, 'station_name'] = df_distances.at[station_index, 'destination_station']
                else:
                    df_stations.at[i, 'station_name'] = "Não classificada"
            else:
                df_stations.at[i, 'station_name'] = "Não classificada"
        elif start_found and opposite:
            station_index += 1
            if station_index < len(df_distances_opposite):  # Verificar se o índice é válido
                station_dist = df_stations.at[i, 'distance_from_previous (km)']
                ref_dist = df_distances_opposite.at[station_index, 'distance (km)']

                # Validação da distância
                if ref_dist - epsilon <= station_dist <= ref_dist + epsilon:
                    df_stations.at[i, 'station_name'] = df_distances_opposite.at[station_index, 'destination_station']
                else:
                    df_stations.at[i, 'station_name'] = "Não classificada"
            else:
                df_stations.at[i, 'station_name'] = "Não classificada"

    # Validação final para linhas antes da primeira estação nomeada
    if not df_stations['station_name'].str.strip().any():  # Nenhuma estação foi mapeada
        print("Nenhuma estação foi mapeada. Verifique os dados de entrada ou ajuste os critérios.")
    else:
        # Identificar as linhas antes da primeira estação nomeada
        first_named_index = df_stations[df_stations['station_name'] != ""].index[0]

        # Calcular o número de linhas sem nome antes da primeira estação
        lines_to_fill = df_stations.loc[:first_named_index - 1]

        # Reverter a tabela de distâncias correspondente
        if 'opposite' in locals() and opposite:
            reversed_distances = df_distances_opposite[::-1]
        else:
            reversed_distances = df_distances[::-1]

        # Atribuir os nomes às linhas sem nome na ordem inversa
        for i, station_index in zip(lines_to_fill.index[::-1], range(len(lines_to_fill))):
            if station_index < len(reversed_distances):
                ref_dist = reversed_distances.iloc[station_index]['distance (km)']
                station_dist = df_stations.at[i, 'distance_from_previous (km)']

                # Validação da distância
                if ref_dist - epsilon <= station_dist <= ref_dist + epsilon:
                    df_stations.at[i, 'station_name'] = reversed_distances.iloc[station_index]['destination_station']
                else:
                    df_stations.at[i, 'station_name'] = "Não classificada"
            else:
                df_stations.at[i, 'station_name'] = "Não classificada"

    # Preencher todos os valores vazios como "Não classificada"
    df_stations['station_name'] = df_stations['station_name'].replace("", "Não classificada")

    # Garantir que os índices do DataFrame sejam contínuos
    df_stations = df_stations.reset_index(drop=True)

    # Continuar classificação das estações "Não classificadas"
    for i in df_stations.index:
        if df_stations.at[i, 'station_name'] == "Não classificada":
            station_dist = df_stations.at[i, 'distance_from_previous (km)']
            station_index = 0
            start_found = False
            opposite = False

            # Tentar encontrar a estação na tabela referencial
            for j in range(len(df_distances)):
                ref_dist = df_distances.at[j, 'distance (km)']

                if ref_dist - epsilon <= station_dist <= ref_dist + epsilon:
                    # Verificar as próximas duas estações sem ultrapassar os limites
                    if (
                        i + 1 in df_stations.index and
                        i + 2 in df_stations.index and
                        j + 1 < len(df_distances) and
                        j + 2 < len(df_distances) and
                        abs(df_distances.at[j + 1, 'distance (km)'] - df_stations.at[i + 1, 'distance_from_previous (km)']) <= epsilon2 and
                        abs(df_distances.at[j + 2, 'distance (km)'] - df_stations.at[i + 2, 'distance_from_previous (km)']) <= epsilon2
                    ):
                        # Estação encontrada e verificada
                        df_stations.at[i, 'station_name'] = df_distances.at[j, 'destination_station']
                        print(f"Classifiquei a estação na linha {i} como {df_stations.at[i, 'station_name']}.")
                        start_found = True
                        opposite = False
                        break

            # Verificar na tabela oposta, caso necessário
            if df_stations.at[i, 'station_name'] == "Não classificada":
                for j in range(len(df_distances_opposite)):
                    ref_dist = df_distances_opposite.at[j, 'distance (km)']

                    if ref_dist - epsilon <= station_dist <= ref_dist + epsilon:
                        # Verificar as próximas duas estações sem ultrapassar os limites
                        if (
                            i + 1 in df_stations.index and
                            i + 2 in df_stations.index and
                            j + 1 < len(df_distances_opposite) and
                            j + 2 < len(df_distances_opposite) and
                            abs(df_distances_opposite.at[j + 1, 'distance (km)'] - df_stations.at[i + 1, 'distance_from_previous (km)']) <= epsilon2 and
                            abs(df_distances_opposite.at[j + 2, 'distance (km)'] - df_stations.at[i + 2, 'distance_from_previous (km)']) <= epsilon2
                        ):
                            # Estação encontrada e verificada
                            df_stations.at[i, 'station_name'] = df_distances_opposite.at[j, 'destination_station']
                            print(f"Classifiquei a estação na linha {i} como {df_stations.at[i, 'station_name']} (tabela oposta).")
                            start_found = True
                            opposite = True
                            break

            # Classificar as estações subsequentes
            if start_found:
                for k in range(i + 1, len(df_stations)):
                    if df_stations.at[k, 'station_name'] == "Não classificada":
                        station_index += 1

                        try:
                            if not opposite:
                                if station_index < len(df_distances):
                                    station_dist = df_stations.at[k, 'distance_from_previous (km)']
                                    ref_dist = df_distances.at[station_index, 'distance (km)']

                                    if ref_dist - epsilon <= station_dist <= ref_dist + epsilon:
                                        candidate_station = df_distances.at[station_index, 'destination_station']
                                        prev_station = df_stations.at[k - 1, 'station_name']

                                        if prev_station in df_distances['origin_station'].values:
                                            valid_next_stations = df_distances.loc[
                                                df_distances['origin_station'] == prev_station, 'destination_station'
                                            ].values

                                            if candidate_station in valid_next_stations:
                                                df_stations.at[k, 'station_name'] = candidate_station
                                            else:
                                                print(f"A estação {candidate_station} não é válida após {prev_station}. Linha {k} classificada como 'Não classificada'.")
                                        else:
                                            print(f"A estação anterior {prev_station} não está na tabela de referências. Linha {k} classificada como 'Não classificada'.")
                                    else:
                                        break
                                else:
                                    break
                            else:
                                if station_index < len(df_distances_opposite):
                                    station_dist = df_stations.at[k, 'distance_from_previous (km)']
                                    ref_dist = df_distances_opposite.at[station_index, 'distance (km)']

                                    if ref_dist - epsilon <= station_dist <= ref_dist + epsilon:
                                        candidate_station = df_distances_opposite.at[station_index, 'destination_station']
                                        prev_station = df_stations.at[k - 1, 'station_name']

                                        if prev_station in df_distances_opposite['origin_station'].values:
                                            valid_next_stations = df_distances_opposite.loc[
                                                df_distances_opposite['origin_station'] == prev_station, 'destination_station'
                                            ].values

                                            if candidate_station in valid_next_stations:
                                                df_stations.at[k, 'station_name'] = candidate_station
                                            else:
                                                print(f"A estação {candidate_station} não é válida após {prev_station}. Linha {k} classificada como 'Não classificada'.")
                                        else:
                                            print(f"A estação anterior {prev_station} não está na tabela de referências oposta. Linha {k} classificada como 'Não classificada'.")
                                    else:
                                        break
                                else:
                                    break
                        except KeyError as e:
                            print(f"Erro ao acessar os índices para a estação {k} na linha {i}: {e}. Verifique os tamanhos das tabelas.")
                            break
    # Classificação das estações restantes verificando as duas estações anteriores
    for i in df_stations.index:
        if df_stations.at[i, 'station_name'] == "Não classificada":
            station_dist = df_stations.at[i, 'distance_from_previous (km)']
            classified = False  # Flag para verificar se a estação foi classificada

            # Verificar as duas estações anteriores na tabela referencial normal
            for j in range(len(df_distances) - 1, -1, -1):  # Iterar de trás para frente
                ref_dist = df_distances.at[j, 'distance (km)']

                if ref_dist - epsilon <= station_dist <= ref_dist + epsilon:
                    # Verificar as duas estações anteriores
                    if (
                        i - 1 in df_stations.index and
                        i - 2 in df_stations.index and
                        j - 1 >= 0 and
                        j - 2 >= 0 and
                        abs(df_distances.at[j - 1, 'distance (km)'] - df_stations.at[i - 1, 'distance_from_previous (km)']) <= epsilon2 and
                        abs(df_distances.at[j - 2, 'distance (km)'] - df_stations.at[i - 2, 'distance_from_previous (km)']) <= epsilon2
                    ):
                        df_stations.at[i, 'station_name'] = df_distances.at[j, 'destination_station']
                        print(f"Classifiquei a estação na linha {i} como {df_stations.at[i, 'station_name']} (baseando-se nas anteriores).")
                        classified = True
                        break

            # Verificar na tabela referencial oposta, caso ainda não tenha sido classificada
            if not classified:
                for j in range(len(df_distances_opposite) - 1, -1, -1):
                    ref_dist = df_distances_opposite.at[j, 'distance (km)']

                    if ref_dist - epsilon <= station_dist <= ref_dist + epsilon:
                        # Verificar as duas estações anteriores
                        if (
                            i - 1 in df_stations.index and
                            i - 2 in df_stations.index and
                            j - 1 >= 0 and
                            j - 2 >= 0 and
                            abs(df_distances_opposite.at[j - 1, 'distance (km)'] - df_stations.at[i - 1, 'distance_from_previous (km)']) <= epsilon2 and
                            abs(df_distances_opposite.at[j - 2, 'distance (km)'] - df_stations.at[i - 2, 'distance_from_previous (km)']) <= epsilon2
                        ):
                            df_stations.at[i, 'station_name'] = df_distances_opposite.at[j, 'destination_station']
                            print(f"Classifiquei a estação na linha {i} como {df_stations.at[i, 'station_name']} (baseando-se nas anteriores - tabela oposta).")
                            classified = True
                            break

            # Caso nenhuma correspondência seja encontrada, manter como "Não classificada"
            if not classified:
                print(f"A estação na linha {i} permaneceu como 'Não classificada'.")

    # Exibir o DataFrame atualizado
    print(df_stations)

    # Preencher todos os valores vazios como "Não classificada"
    df_stations['station_name'] = df_stations['station_name'].replace("", "Não classificada")

    # Exibir o DataFrame atualizado
    print(df_stations)


    from datetime import datetime
    import pytz
    local_timezone = pytz.timezone('America/Sao_Paulo')
    data_hora_atual = datetime.now(local_timezone)
    nome_arquivo = data_hora_atual.strftime("%Y-%m-%d-%H-%M-%S")
    nome_arquivo = os.path.splitext(file_name)[0] + "_" + nome_arquivo + ".xlsx"

    # Adiciona a coluna "file_name" antes de salvar
    df_stations["file_name"] = file_name

    df_stations.to_excel(nome_arquivo)
    df_stations.to_excel("/content/gdrive/My Drive/teste dissertacao/automatico/" + nome_arquivo, index=False)

    df_stations.to_excel("output.xlsx")

    return

  except Exception as e:
        # Cria o nome do arquivo de erro com "_error.txt"
        error_file_name = os.path.splitext(file_name)[0] + "_error.txt"

        # Define o caminho do diretório correto para salvar o log de erro
        error_log_path = f"/content/gdrive/My Drive/teste dissertacao/automatico/{error_file_name}"

        # Salva a mensagem de erro no arquivo
        with open(error_log_path, "w") as log_file:
            log_file.write(f"Erro ao processar o arquivo {file_name}:\n{e}")

        print(f"Erro ao processar o arquivo {file_name}: {e}")
        return None

dir = "/content/gdrive/My Drive/teste dissertacao/Base_automatica"
arquivos = os.listdir(dir)

# Função para consolidar todas as abas de um arquivo Excel
def consolidar_abas(caminho_arquivo):
    # Carrega todas as abas do arquivo em um dicionário
    todas_abas = pd.read_excel(caminho_arquivo, sheet_name=None)

    # Lista para armazenar os DataFrames consolidados
    dataframes = []

    for idx, (nome_aba, df_aba) in enumerate(todas_abas.items()):
        if idx == 0:
            # Na primeira aba, mantém o cabeçalho
            dataframes.append(df_aba)
        else:
            # Nas demais abas, remove a primeira linha antes de adicionar
            df_aba_sem_cabecalho = df_aba.iloc[1:].reset_index(drop=True)
            dataframes.append(df_aba_sem_cabecalho)

    # Concatena todas as abas em um único DataFrame
    return pd.concat(dataframes, ignore_index=True)

# Processa todos os arquivos Excel no diretório
for arquivo in arquivos:
    if arquivo.endswith('.xls') or arquivo.endswith('.xlsx'):
        caminho_arquivo = os.path.join(dir, arquivo)
        df_consolidado = consolidar_abas(caminho_arquivo)

        # Chama a função para processar o DataFrame consolidado
        minha_funcao(df_consolidado, arquivo)


  df["datetime"] =  pd.to_datetime(df["datetime"])
A value is trying to be set on a copy of a slice from a DataFrame.
Try using .loc[row_indexer,col_indexer] = value instead

See the caveats in the documentation: https://pandas.pydata.org/pandas-docs/stable/user_guide/indexing.html#returning-a-view-versus-a-copy
  df_stations1['datetime'] = pd.to_datetime(df_stations1['datetime'])
A value is trying to be set on a copy of a slice from a DataFrame.
Try using .loc[row_indexer,col_indexer] = value instead

See the caveats in the documentation: https://pandas.pydata.org/pandas-docs/stable/user_guide/indexing.html#returning-a-view-versus-a-copy
  df_stations1['Portas_abertas'] = 0
  df_stations = df_stations1[(df['train_state'] == "PPA") & (df['train_state_changed'] == True)]
A value is trying to be set on a copy of a slice from a DataFrame.
Try using .loc[row_indexer,col_indexer] = value instead

See the caveats in the documentation: https://pandas.pydata.org/pandas-docs/stable/user_guide/i

Achei um início!
Classifiquei a estação na linha 1 como Jaraguá.
Classifiquei a estação na linha 2 como Vila Aurora.
Classifiquei a estação na linha 3 como Perus .
A estação Guapituba não é válida após Perus . Linha 4 classificada como 'Não classificada'.
Classifiquei a estação na linha 4 como Caieiras.
Classifiquei a estação na linha 5 como Franco da Rocha.
Classifiquei a estação na linha 6 como Baltazar Fidélis (baseando-se nas anteriores).
Classifiquei a estação na linha 7 como Franscico Morato (baseando-se nas anteriores).
Classifiquei a estação na linha 8 como Botujuru (baseando-se nas anteriores).
A estação na linha 9 permaneceu como 'Não classificada'.
A estação na linha 10 permaneceu como 'Não classificada'.
    distance (km)            datetime  speed (km/h)  head_car_relay  \
0    1.028560e+06 2024-06-05 07:13:59           0.0           False   
1    1.028563e+06 2024-06-05 07:16:46           0.0           False   
2    1.028565e+06 2024-06-05 07:19:53           0.0          

  df["datetime"] =  pd.to_datetime(df["datetime"])
A value is trying to be set on a copy of a slice from a DataFrame.
Try using .loc[row_indexer,col_indexer] = value instead

See the caveats in the documentation: https://pandas.pydata.org/pandas-docs/stable/user_guide/indexing.html#returning-a-view-versus-a-copy
  df['train_state'] = df.apply(evaluate_state, axis=1)
A value is trying to be set on a copy of a slice from a DataFrame.
Try using .loc[row_indexer,col_indexer] = value instead

See the caveats in the documentation: https://pandas.pydata.org/pandas-docs/stable/user_guide/indexing.html#returning-a-view-versus-a-copy
  df_stations1['datetime'] = pd.to_datetime(df_stations1['datetime'])
A value is trying to be set on a copy of a slice from a DataFrame.
Try using .loc[row_indexer,col_indexer] = value instead

See the caveats in the documentation: https://pandas.pydata.org/pandas-docs/stable/user_guide/indexing.html#returning-a-view-versus-a-copy
  df_stations1['Portas_abertas'] = 

Achei um início!
Achei um início!
    distance (km)            datetime  speed (km/h)  head_car_relay  \
0    1.028629e+06 2024-06-05 09:07:11           0.0            True   
1    1.028633e+06 2024-06-05 09:11:13           0.0            True   
2    1.028635e+06 2024-06-05 09:15:55           0.0            True   
3    1.028640e+06 2024-06-05 09:21:18           0.0            True   
4    1.028645e+06 2024-06-05 09:25:35           0.0            True   
..            ...                 ...           ...             ...   
60   1.028826e+06 2024-06-05 13:41:13           0.0            True   
61   1.028830e+06 2024-06-05 13:45:21           0.0            True   
62   1.028832e+06 2024-06-05 13:48:39           0.0            True   
63   1.028837e+06 2024-06-05 13:54:03           0.0            True   
64   1.028842e+06 2024-06-05 13:58:22           0.0            True   

    all_doors_closed  train_weight (kg) train_state  train_state_changed  \
0              False             3773

  df["datetime"] =  pd.to_datetime(df["datetime"])
A value is trying to be set on a copy of a slice from a DataFrame.
Try using .loc[row_indexer,col_indexer] = value instead

See the caveats in the documentation: https://pandas.pydata.org/pandas-docs/stable/user_guide/indexing.html#returning-a-view-versus-a-copy
  df_stations1['datetime'] = pd.to_datetime(df_stations1['datetime'])
A value is trying to be set on a copy of a slice from a DataFrame.
Try using .loc[row_indexer,col_indexer] = value instead

See the caveats in the documentation: https://pandas.pydata.org/pandas-docs/stable/user_guide/indexing.html#returning-a-view-versus-a-copy
  df_stations1['Portas_abertas'] = 0
  df_stations = df_stations1[(df['train_state'] == "PPA") & (df['train_state_changed'] == True)]
A value is trying to be set on a copy of a slice from a DataFrame.
Try using .loc[row_indexer,col_indexer] = value instead

See the caveats in the documentation: https://pandas.pydata.org/pandas-docs/stable/user_guide/i

Nenhuma estação foi mapeada. Verifique os dados de entrada ou ajuste os critérios.
Classifiquei a estação na linha 0 como Baltazar Fidélis (tabela oposta).
Classifiquei a estação na linha 1 como Franco da Rocha (tabela oposta).
Classifiquei a estação na linha 2 como Caieiras (tabela oposta).
Classifiquei a estação na linha 6 como Pirituba.
Classifiquei a estação na linha 7 como Vila Clarice.
Classifiquei a estação na linha 8 como Piqueri (tabela oposta).
Classifiquei a estação na linha 9 como Lapa (tabela oposta).
Classifiquei a estação na linha 10 como Brás.
Classifiquei a estação na linha 11 como Luz.
Classifiquei a estação na linha 12 como Barra-Funda.
Classifiquei a estação na linha 13 como Brás (tabela oposta).
Classifiquei a estação na linha 14 como Mooca (tabela oposta).
Classifiquei a estação na linha 15 como Ipiranga (tabela oposta).
Classifiquei a estação na linha 16 como Tamanduateí (tabela oposta).
Classifiquei a estação na linha 17 como São Caetano do Sul (tabela oposta).


  df["datetime"] =  pd.to_datetime(df["datetime"])
A value is trying to be set on a copy of a slice from a DataFrame.
Try using .loc[row_indexer,col_indexer] = value instead

See the caveats in the documentation: https://pandas.pydata.org/pandas-docs/stable/user_guide/indexing.html#returning-a-view-versus-a-copy
  df_stations1['datetime'] = pd.to_datetime(df_stations1['datetime'])
A value is trying to be set on a copy of a slice from a DataFrame.
Try using .loc[row_indexer,col_indexer] = value instead

See the caveats in the documentation: https://pandas.pydata.org/pandas-docs/stable/user_guide/indexing.html#returning-a-view-versus-a-copy
  df_stations1['Portas_abertas'] = 0
  df_stations = df_stations1[(df['train_state'] == "PPA") & (df['train_state_changed'] == True)]
A value is trying to be set on a copy of a slice from a DataFrame.
Try using .loc[row_indexer,col_indexer] = value instead

See the caveats in the documentation: https://pandas.pydata.org/pandas-docs/stable/user_guide/i

Achei um início!
Classifiquei a estação na linha 0 como Lapa.
Classifiquei a estação na linha 1 como Piqueri.
Classifiquei a estação na linha 3 como Vila Clarice.
Classifiquei a estação na linha 4 como Jaraguá.
Classifiquei a estação na linha 5 como Vila Aurora.
Classifiquei a estação na linha 6 como Perus .
A estação Guapituba não é válida após Perus . Linha 7 classificada como 'Não classificada'.
Classifiquei a estação na linha 7 como Caieiras.
Classifiquei a estação na linha 8 como Franco da Rocha.
Classifiquei a estação na linha 9 como Baltazar Fidélis.
Classifiquei a estação na linha 10 como Franscico Morato.
Classifiquei a estação na linha 11 como Botujuru.
Classifiquei a estação na linha 12 como Campo Limpo Paulista.
Classifiquei a estação na linha 13 como Várzea Paulista (baseando-se nas anteriores).
Classifiquei a estação na linha 14 como Jundiaí (baseando-se nas anteriores).
A estação na linha 33 permaneceu como 'Não classificada'.
    distance (km)            datetime  speed

  df["datetime"] =  pd.to_datetime(df["datetime"])
A value is trying to be set on a copy of a slice from a DataFrame.
Try using .loc[row_indexer,col_indexer] = value instead

See the caveats in the documentation: https://pandas.pydata.org/pandas-docs/stable/user_guide/indexing.html#returning-a-view-versus-a-copy
  df_stations1['datetime'] = pd.to_datetime(df_stations1['datetime'])
A value is trying to be set on a copy of a slice from a DataFrame.
Try using .loc[row_indexer,col_indexer] = value instead

See the caveats in the documentation: https://pandas.pydata.org/pandas-docs/stable/user_guide/indexing.html#returning-a-view-versus-a-copy
  df_stations1['Portas_abertas'] = 0
  df_stations = df_stations1[(df['train_state'] == "PPA") & (df['train_state_changed'] == True)]
A value is trying to be set on a copy of a slice from a DataFrame.
Try using .loc[row_indexer,col_indexer] = value instead

See the caveats in the documentation: https://pandas.pydata.org/pandas-docs/stable/user_guide/i

Achei um início!
Achei um início!
    distance (km)            datetime  speed (km/h)  head_car_relay  \
0    1.178873e+06 2024-06-05 04:18:56           0.0            True   
1    1.178876e+06 2024-06-05 04:23:07           0.0            True   
2    1.178879e+06 2024-06-05 04:26:27           0.0            True   
3    1.178884e+06 2024-06-05 04:32:16           0.0            True   
4    1.178888e+06 2024-06-05 04:36:29           0.0            True   
..            ...                 ...           ...             ...   
60   1.179066e+06 2024-06-05 08:33:16           0.0            True   
61   1.179070e+06 2024-06-05 08:39:27           0.0            True   
62   1.179073e+06 2024-06-05 08:45:06           0.0            True   
63   1.179078e+06 2024-06-05 08:52:02           0.0            True   
64   1.179082e+06 2024-06-05 08:56:23           0.0            True   

    all_doors_closed  train_weight (kg) train_state  train_state_changed  \
0              False             3688

  df["datetime"] =  pd.to_datetime(df["datetime"])
A value is trying to be set on a copy of a slice from a DataFrame.
Try using .loc[row_indexer,col_indexer] = value instead

See the caveats in the documentation: https://pandas.pydata.org/pandas-docs/stable/user_guide/indexing.html#returning-a-view-versus-a-copy
  df_stations1['datetime'] = pd.to_datetime(df_stations1['datetime'])
A value is trying to be set on a copy of a slice from a DataFrame.
Try using .loc[row_indexer,col_indexer] = value instead

See the caveats in the documentation: https://pandas.pydata.org/pandas-docs/stable/user_guide/indexing.html#returning-a-view-versus-a-copy
  df_stations1['Portas_abertas'] = 0
  df_stations = df_stations1[(df['train_state'] == "PPA") & (df['train_state_changed'] == True)]
A value is trying to be set on a copy of a slice from a DataFrame.
Try using .loc[row_indexer,col_indexer] = value instead

See the caveats in the documentation: https://pandas.pydata.org/pandas-docs/stable/user_guide/i

Achei um início!
Classifiquei a estação na linha 1 como Pirituba.
Classifiquei a estação na linha 2 como Vila Clarice.
Classifiquei a estação na linha 3 como Piqueri (tabela oposta).
Classifiquei a estação na linha 4 como Lapa (tabela oposta).
Classifiquei a estação na linha 5 como Brás.
Classifiquei a estação na linha 6 como Luz.
Classifiquei a estação na linha 7 como Barra-Funda.
Classifiquei a estação na linha 9 como Mooca (tabela oposta).
Classifiquei a estação na linha 10 como Ipiranga (tabela oposta).
Classifiquei a estação na linha 11 como Tamanduateí (tabela oposta).
Classifiquei a estação na linha 12 como São Caetano do Sul (tabela oposta).
Classifiquei a estação na linha 13 como Utinga (tabela oposta).
Classifiquei a estação na linha 14 como Prefeito Saladino (tabela oposta).
Classifiquei a estação na linha 15 como Santo André (tabela oposta).
Classifiquei a estação na linha 16 como Capuava (tabela oposta).
Classifiquei a estação na linha 17 como Mauá (tabela oposta).
Classif

  df["datetime"] =  pd.to_datetime(df["datetime"])
A value is trying to be set on a copy of a slice from a DataFrame.
Try using .loc[row_indexer,col_indexer] = value instead

See the caveats in the documentation: https://pandas.pydata.org/pandas-docs/stable/user_guide/indexing.html#returning-a-view-versus-a-copy
  df_stations1['datetime'] = pd.to_datetime(df_stations1['datetime'])
A value is trying to be set on a copy of a slice from a DataFrame.
Try using .loc[row_indexer,col_indexer] = value instead

See the caveats in the documentation: https://pandas.pydata.org/pandas-docs/stable/user_guide/indexing.html#returning-a-view-versus-a-copy
  df_stations1['Portas_abertas'] = 0
  df_stations = df_stations1[(df['train_state'] == "PPA") & (df['train_state_changed'] == True)]
A value is trying to be set on a copy of a slice from a DataFrame.
Try using .loc[row_indexer,col_indexer] = value instead

See the caveats in the documentation: https://pandas.pydata.org/pandas-docs/stable/user_guide/i

Nenhuma estação foi mapeada. Verifique os dados de entrada ou ajuste os critérios.
Classifiquei a estação na linha 0 como Franco da Rocha (tabela oposta).
Classifiquei a estação na linha 1 como Caieiras (tabela oposta).
Classifiquei a estação na linha 5 como Pirituba.
Classifiquei a estação na linha 6 como Vila Clarice.
Classifiquei a estação na linha 7 como Piqueri (tabela oposta).
Classifiquei a estação na linha 8 como Lapa (tabela oposta).
Classifiquei a estação na linha 9 como Brás.
Classifiquei a estação na linha 10 como Luz.
Classifiquei a estação na linha 11 como Barra-Funda.
Classifiquei a estação na linha 12 como Brás (tabela oposta).
Classifiquei a estação na linha 13 como Mooca (tabela oposta).
Classifiquei a estação na linha 14 como Ipiranga (tabela oposta).
Classifiquei a estação na linha 15 como Tamanduateí (tabela oposta).
Classifiquei a estação na linha 16 como São Caetano do Sul (tabela oposta).
Classifiquei a estação na linha 17 como Utinga (tabela oposta).
Classifiqu

  df["datetime"] =  pd.to_datetime(df["datetime"])
A value is trying to be set on a copy of a slice from a DataFrame.
Try using .loc[row_indexer,col_indexer] = value instead

See the caveats in the documentation: https://pandas.pydata.org/pandas-docs/stable/user_guide/indexing.html#returning-a-view-versus-a-copy
  df_stations1['datetime'] = pd.to_datetime(df_stations1['datetime'])
A value is trying to be set on a copy of a slice from a DataFrame.
Try using .loc[row_indexer,col_indexer] = value instead

See the caveats in the documentation: https://pandas.pydata.org/pandas-docs/stable/user_guide/indexing.html#returning-a-view-versus-a-copy
  df_stations1['Portas_abertas'] = 0
  df_stations = df_stations1[(df['train_state'] == "PPA") & (df['train_state_changed'] == True)]
A value is trying to be set on a copy of a slice from a DataFrame.
Try using .loc[row_indexer,col_indexer] = value instead

See the caveats in the documentation: https://pandas.pydata.org/pandas-docs/stable/user_guide/i

Nenhuma estação foi mapeada. Verifique os dados de entrada ou ajuste os critérios.
Classifiquei a estação na linha 0 como Brás.
Classifiquei a estação na linha 1 como Luz.
Classifiquei a estação na linha 2 como Barra-Funda.
Classifiquei a estação na linha 3 como Água Branca.
Classifiquei a estação na linha 4 como Lapa.
Classifiquei a estação na linha 5 como Piqueri.
Classifiquei a estação na linha 6 como Pirituba.
Classifiquei a estação na linha 7 como Vila Clarice.
Classifiquei a estação na linha 8 como Jaraguá.
Classifiquei a estação na linha 9 como Vila Aurora.
Classifiquei a estação na linha 10 como Perus .
A estação Guapituba não é válida após Perus . Linha 11 classificada como 'Não classificada'.
Classifiquei a estação na linha 11 como Caieiras.
Classifiquei a estação na linha 12 como Franco da Rocha.
Classifiquei a estação na linha 13 como Baltazar Fidélis (baseando-se nas anteriores).
Classifiquei a estação na linha 14 como Franscico Morato (baseando-se nas anteriores).
A estaç

  df["datetime"] =  pd.to_datetime(df["datetime"])
A value is trying to be set on a copy of a slice from a DataFrame.
Try using .loc[row_indexer,col_indexer] = value instead

See the caveats in the documentation: https://pandas.pydata.org/pandas-docs/stable/user_guide/indexing.html#returning-a-view-versus-a-copy
  df_stations1['datetime'] = pd.to_datetime(df_stations1['datetime'])
A value is trying to be set on a copy of a slice from a DataFrame.
Try using .loc[row_indexer,col_indexer] = value instead

See the caveats in the documentation: https://pandas.pydata.org/pandas-docs/stable/user_guide/indexing.html#returning-a-view-versus-a-copy
  df_stations1['Portas_abertas'] = 0
  df_stations = df_stations1[(df['train_state'] == "PPA") & (df['train_state_changed'] == True)]
A value is trying to be set on a copy of a slice from a DataFrame.
Try using .loc[row_indexer,col_indexer] = value instead

See the caveats in the documentation: https://pandas.pydata.org/pandas-docs/stable/user_guide/i

Achei um início!
Achei um início!
    distance (km)            datetime  speed (km/h)  head_car_relay  \
0    1.179287e+06 2024-06-05 14:06:10      0.000000           False   
1    1.179291e+06 2024-06-05 14:12:15      0.480763           False   
2    1.179293e+06 2024-06-05 14:17:03      0.000000           False   
3    1.179294e+06 2024-06-05 14:19:11      0.000000           False   
4    1.179297e+06 2024-06-05 14:23:47      0.000000           False   
..            ...                 ...           ...             ...   
60   1.179480e+06 2024-06-05 18:43:32      0.000000           False   
61   1.179484e+06 2024-06-05 18:49:18      0.000000           False   
62   1.179486e+06 2024-06-05 18:54:05      0.000000           False   
63   1.179488e+06 2024-06-05 18:56:04      0.000000           False   
64   1.179491e+06 2024-06-05 18:59:42      0.000000           False   

    all_doors_closed  train_weight (kg) train_state  train_state_changed  \
0              False             3770

  df["datetime"] =  pd.to_datetime(df["datetime"])
A value is trying to be set on a copy of a slice from a DataFrame.
Try using .loc[row_indexer,col_indexer] = value instead

See the caveats in the documentation: https://pandas.pydata.org/pandas-docs/stable/user_guide/indexing.html#returning-a-view-versus-a-copy
  df_stations1['datetime'] = pd.to_datetime(df_stations1['datetime'])
A value is trying to be set on a copy of a slice from a DataFrame.
Try using .loc[row_indexer,col_indexer] = value instead

See the caveats in the documentation: https://pandas.pydata.org/pandas-docs/stable/user_guide/indexing.html#returning-a-view-versus-a-copy
  df_stations1['Portas_abertas'] = 0
  df_stations = df_stations1[(df['train_state'] == "PPA") & (df['train_state_changed'] == True)]
A value is trying to be set on a copy of a slice from a DataFrame.
Try using .loc[row_indexer,col_indexer] = value instead

See the caveats in the documentation: https://pandas.pydata.org/pandas-docs/stable/user_guide/i

Nenhuma estação foi mapeada. Verifique os dados de entrada ou ajuste os critérios.
Classifiquei a estação na linha 1 como Pirituba.
Classifiquei a estação na linha 2 como Vila Clarice.
Classifiquei a estação na linha 3 como Piqueri (tabela oposta).
Classifiquei a estação na linha 4 como Lapa (tabela oposta).
Classifiquei a estação na linha 5 como Brás.
Classifiquei a estação na linha 6 como Luz.
Classifiquei a estação na linha 7 como Barra-Funda.
Classifiquei a estação na linha 8 como Brás (tabela oposta).
Classifiquei a estação na linha 9 como Mooca (tabela oposta).
Classifiquei a estação na linha 10 como Ipiranga (tabela oposta).
Classifiquei a estação na linha 11 como Tamanduateí (tabela oposta).
Classifiquei a estação na linha 12 como São Caetano do Sul (tabela oposta).
Classifiquei a estação na linha 13 como Utinga (tabela oposta).
Classifiquei a estação na linha 14 como Prefeito Saladino (tabela oposta).
Classifiquei a estação na linha 15 como Santo André (tabela oposta).
Classif

  df["datetime"] =  pd.to_datetime(df["datetime"])
A value is trying to be set on a copy of a slice from a DataFrame.
Try using .loc[row_indexer,col_indexer] = value instead

See the caveats in the documentation: https://pandas.pydata.org/pandas-docs/stable/user_guide/indexing.html#returning-a-view-versus-a-copy
  df_stations1['datetime'] = pd.to_datetime(df_stations1['datetime'])
A value is trying to be set on a copy of a slice from a DataFrame.
Try using .loc[row_indexer,col_indexer] = value instead

See the caveats in the documentation: https://pandas.pydata.org/pandas-docs/stable/user_guide/indexing.html#returning-a-view-versus-a-copy
  df_stations1['Portas_abertas'] = 0
  df_stations = df_stations1[(df['train_state'] == "PPA") & (df['train_state_changed'] == True)]
A value is trying to be set on a copy of a slice from a DataFrame.
Try using .loc[row_indexer,col_indexer] = value instead

See the caveats in the documentation: https://pandas.pydata.org/pandas-docs/stable/user_guide/i

Achei um início!
Achei um início!
    distance (km)            datetime  speed (km/h)  head_car_relay  \
0    1.179495e+06 2024-06-05 19:05:06           0.0           False   
1    1.179498e+06 2024-06-05 19:08:26           0.0           False   
2    1.179500e+06 2024-06-05 19:11:48           0.0           False   
3    1.179502e+06 2024-06-05 19:15:18           0.0           False   
4    1.179506e+06 2024-06-05 19:19:53           0.0           False   
..            ...                 ...           ...             ...   
61   1.179692e+06 2024-06-05 23:44:16           0.0           False   
62   1.179693e+06 2024-06-05 23:47:19           0.0           False   
63   1.179696e+06 2024-06-05 23:50:27           0.0           False   
64   1.179699e+06 2024-06-05 23:55:32           0.0           False   
65   1.179702e+06 2024-06-05 23:59:00           0.0           False   

    all_doors_closed  train_weight (kg) train_state  train_state_changed  \
0              False             4208

  df["datetime"] =  pd.to_datetime(df["datetime"])
A value is trying to be set on a copy of a slice from a DataFrame.
Try using .loc[row_indexer,col_indexer] = value instead

See the caveats in the documentation: https://pandas.pydata.org/pandas-docs/stable/user_guide/indexing.html#returning-a-view-versus-a-copy
  df_stations1['datetime'] = pd.to_datetime(df_stations1['datetime'])
A value is trying to be set on a copy of a slice from a DataFrame.
Try using .loc[row_indexer,col_indexer] = value instead

See the caveats in the documentation: https://pandas.pydata.org/pandas-docs/stable/user_guide/indexing.html#returning-a-view-versus-a-copy
  df_stations1['Portas_abertas'] = 0
  df_stations = df_stations1[(df['train_state'] == "PPA") & (df['train_state_changed'] == True)]
A value is trying to be set on a copy of a slice from a DataFrame.
Try using .loc[row_indexer,col_indexer] = value instead

See the caveats in the documentation: https://pandas.pydata.org/pandas-docs/stable/user_guide/i

Nenhuma estação foi mapeada. Verifique os dados de entrada ou ajuste os critérios.
Classifiquei a estação na linha 0 como Piqueri.
Classifiquei a estação na linha 1 como Pirituba.
Classifiquei a estação na linha 2 como Vila Clarice.
Classifiquei a estação na linha 3 como Jaraguá.
Classifiquei a estação na linha 4 como Vila Aurora.
Classifiquei a estação na linha 5 como Perus .
A estação Guapituba não é válida após Perus . Linha 6 classificada como 'Não classificada'.
Classifiquei a estação na linha 6 como Caieiras.
Classifiquei a estação na linha 7 como Franco da Rocha.
Classifiquei a estação na linha 8 como Baltazar Fidélis (baseando-se nas anteriores).
Classifiquei a estação na linha 9 como Franscico Morato (baseando-se nas anteriores).
   distance (km)            datetime  speed (km/h)  head_car_relay  \
0   1.179705e+06 2024-07-05 00:03:45           0.0           False   
1   1.179707e+06 2024-07-05 00:06:12           0.0           False   
2   1.179710e+06 2024-07-05 00:10:20     

  df["datetime"] =  pd.to_datetime(df["datetime"])
A value is trying to be set on a copy of a slice from a DataFrame.
Try using .loc[row_indexer,col_indexer] = value instead

See the caveats in the documentation: https://pandas.pydata.org/pandas-docs/stable/user_guide/indexing.html#returning-a-view-versus-a-copy
  df_stations1['datetime'] = pd.to_datetime(df_stations1['datetime'])
A value is trying to be set on a copy of a slice from a DataFrame.
Try using .loc[row_indexer,col_indexer] = value instead

See the caveats in the documentation: https://pandas.pydata.org/pandas-docs/stable/user_guide/indexing.html#returning-a-view-versus-a-copy
  df_stations1['Portas_abertas'] = 0
  df_stations = df_stations1[(df['train_state'] == "PPA") & (df['train_state_changed'] == True)]
A value is trying to be set on a copy of a slice from a DataFrame.
Try using .loc[row_indexer,col_indexer] = value instead

See the caveats in the documentation: https://pandas.pydata.org/pandas-docs/stable/user_guide/i

Achei um início!
Classifiquei a estação na linha 0 como Baltazar Fidélis (tabela oposta).
Classifiquei a estação na linha 1 como Franco da Rocha (tabela oposta).
Classifiquei a estação na linha 2 como Caieiras (tabela oposta).
Classifiquei a estação na linha 6 como Pirituba.
Classifiquei a estação na linha 7 como Vila Clarice.
Classifiquei a estação na linha 8 como Piqueri (tabela oposta).
Classifiquei a estação na linha 9 como Lapa (tabela oposta).
Classifiquei a estação na linha 10 como Brás.
Classifiquei a estação na linha 11 como Luz.
Classifiquei a estação na linha 12 como Barra-Funda.
Classifiquei a estação na linha 13 como Brás (tabela oposta).
Classifiquei a estação na linha 14 como Mooca (tabela oposta).
Classifiquei a estação na linha 15 como Ipiranga (tabela oposta).
Classifiquei a estação na linha 16 como Tamanduateí (tabela oposta).
Classifiquei a estação na linha 17 como São Caetano do Sul (tabela oposta).
Classifiquei a estação na linha 18 como Utinga (tabela oposta).
Cl

  df["datetime"] =  pd.to_datetime(df["datetime"])
A value is trying to be set on a copy of a slice from a DataFrame.
Try using .loc[row_indexer,col_indexer] = value instead

See the caveats in the documentation: https://pandas.pydata.org/pandas-docs/stable/user_guide/indexing.html#returning-a-view-versus-a-copy
  df_stations1['datetime'] = pd.to_datetime(df_stations1['datetime'])
A value is trying to be set on a copy of a slice from a DataFrame.
Try using .loc[row_indexer,col_indexer] = value instead

See the caveats in the documentation: https://pandas.pydata.org/pandas-docs/stable/user_guide/indexing.html#returning-a-view-versus-a-copy
  df_stations1['Portas_abertas'] = 0
  df_stations = df_stations1[(df['train_state'] == "PPA") & (df['train_state_changed'] == True)]
A value is trying to be set on a copy of a slice from a DataFrame.
Try using .loc[row_indexer,col_indexer] = value instead

See the caveats in the documentation: https://pandas.pydata.org/pandas-docs/stable/user_guide/i

Achei um início!
Achei um início!
    distance (km)            datetime  speed (km/h)  head_car_relay  \
0    1.028848e+06 2024-06-05 14:05:35           0.0            True   
1    1.028850e+06 2024-06-05 14:09:11           0.0            True   
2    1.028853e+06 2024-06-05 14:12:47           0.0            True   
3    1.028855e+06 2024-06-05 14:16:22           0.0            True   
4    1.028857e+06 2024-06-05 14:19:00           0.0            True   
..            ...                 ...           ...             ...   
63   1.029052e+06 2024-06-05 18:45:06           0.0            True   
64   1.029054e+06 2024-06-05 18:47:38           0.0            True   
65   1.029056e+06 2024-06-05 18:50:16           0.0            True   
66   1.029058e+06 2024-06-05 18:54:32           0.0            True   
67   1.029062e+06 2024-06-05 18:59:47           0.0            True   

    all_doors_closed  train_weight (kg) train_state  train_state_changed  \
0              False             3866

  df["datetime"] =  pd.to_datetime(df["datetime"])
A value is trying to be set on a copy of a slice from a DataFrame.
Try using .loc[row_indexer,col_indexer] = value instead

See the caveats in the documentation: https://pandas.pydata.org/pandas-docs/stable/user_guide/indexing.html#returning-a-view-versus-a-copy
  df_stations1['datetime'] = pd.to_datetime(df_stations1['datetime'])
A value is trying to be set on a copy of a slice from a DataFrame.
Try using .loc[row_indexer,col_indexer] = value instead

See the caveats in the documentation: https://pandas.pydata.org/pandas-docs/stable/user_guide/indexing.html#returning-a-view-versus-a-copy
  df_stations1['Portas_abertas'] = 0
  df_stations = df_stations1[(df['train_state'] == "PPA") & (df['train_state_changed'] == True)]
A value is trying to be set on a copy of a slice from a DataFrame.
Try using .loc[row_indexer,col_indexer] = value instead

See the caveats in the documentation: https://pandas.pydata.org/pandas-docs/stable/user_guide/i

Nenhuma estação foi mapeada. Verifique os dados de entrada ou ajuste os critérios.
Classifiquei a estação na linha 0 como Mooca (tabela oposta).
Classifiquei a estação na linha 1 como Tamanduateí.
Classifiquei a estação na linha 2 como Tamanduateí (tabela oposta).
Classifiquei a estação na linha 3 como São Caetano do Sul (tabela oposta).
Classifiquei a estação na linha 4 como Utinga (tabela oposta).
Classifiquei a estação na linha 5 como Prefeito Saladino (tabela oposta).
Classifiquei a estação na linha 6 como Santo André (tabela oposta).
Classifiquei a estação na linha 8 como Mauá.
Classifiquei a estação na linha 9 como Capuava.
Classifiquei a estação na linha 10 como Santo André.
Classifiquei a estação na linha 11 como Prefeito Saladino.
Classifiquei a estação na linha 12 como Utinga.
Classifiquei a estação na linha 13 como São Caetano do Sul.
Classifiquei a estação na linha 14 como Tamanduateí.
Classifiquei a estação na linha 15 como Ipiranga.
Classifiquei a estação na linha 16 como

  df["datetime"] =  pd.to_datetime(df["datetime"])
A value is trying to be set on a copy of a slice from a DataFrame.
Try using .loc[row_indexer,col_indexer] = value instead

See the caveats in the documentation: https://pandas.pydata.org/pandas-docs/stable/user_guide/indexing.html#returning-a-view-versus-a-copy
  df_stations1['datetime'] = pd.to_datetime(df_stations1['datetime'])
A value is trying to be set on a copy of a slice from a DataFrame.
Try using .loc[row_indexer,col_indexer] = value instead

See the caveats in the documentation: https://pandas.pydata.org/pandas-docs/stable/user_guide/indexing.html#returning-a-view-versus-a-copy
  df_stations1['Portas_abertas'] = 0
  df_stations = df_stations1[(df['train_state'] == "PPA") & (df['train_state_changed'] == True)]
A value is trying to be set on a copy of a slice from a DataFrame.
Try using .loc[row_indexer,col_indexer] = value instead

See the caveats in the documentation: https://pandas.pydata.org/pandas-docs/stable/user_guide/i

Achei um início!
Classifiquei a estação na linha 0 como Água Branca.
Classifiquei a estação na linha 1 como Lapa.
Classifiquei a estação na linha 2 como Piqueri.
Classifiquei a estação na linha 4 como Vila Clarice.
Classifiquei a estação na linha 5 como Jaraguá.
Classifiquei a estação na linha 6 como Vila Aurora.
Classifiquei a estação na linha 7 como Perus .
A estação Guapituba não é válida após Perus . Linha 8 classificada como 'Não classificada'.
Classifiquei a estação na linha 8 como Caieiras.
Classifiquei a estação na linha 9 como Franco da Rocha.
Classifiquei a estação na linha 10 como Baltazar Fidélis.
Classifiquei a estação na linha 11 como Franscico Morato.
Classifiquei a estação na linha 12 como Botujuru.
Classifiquei a estação na linha 13 como Campo Limpo Paulista.
Classifiquei a estação na linha 14 como Várzea Paulista (baseando-se nas anteriores).
Classifiquei a estação na linha 15 como Jundiaí (baseando-se nas anteriores).
    distance (km)            datetime  speed (km/

  df["datetime"] =  pd.to_datetime(df["datetime"])
A value is trying to be set on a copy of a slice from a DataFrame.
Try using .loc[row_indexer,col_indexer] = value instead

See the caveats in the documentation: https://pandas.pydata.org/pandas-docs/stable/user_guide/indexing.html#returning-a-view-versus-a-copy
  df_stations1['datetime'] = pd.to_datetime(df_stations1['datetime'])
A value is trying to be set on a copy of a slice from a DataFrame.
Try using .loc[row_indexer,col_indexer] = value instead

See the caveats in the documentation: https://pandas.pydata.org/pandas-docs/stable/user_guide/indexing.html#returning-a-view-versus-a-copy
  df_stations1['Portas_abertas'] = 0
  df_stations = df_stations1[(df['train_state'] == "PPA") & (df['train_state_changed'] == True)]
A value is trying to be set on a copy of a slice from a DataFrame.
Try using .loc[row_indexer,col_indexer] = value instead

See the caveats in the documentation: https://pandas.pydata.org/pandas-docs/stable/user_guide/i

Nenhuma estação foi mapeada. Verifique os dados de entrada ou ajuste os critérios.
Classifiquei a estação na linha 0 como Botujuru.
Classifiquei a estação na linha 1 como Campo Limpo Paulista.
Classifiquei a estação na linha 2 como Várzea Paulista (baseando-se nas anteriores).
Classifiquei a estação na linha 3 como Jundiaí (baseando-se nas anteriores).
   distance (km)            datetime  speed (km/h)  head_car_relay  \
0   1.192444e+06 2024-07-05 00:14:09           0.0           False   
1   1.192448e+06 2024-07-05 00:18:12           0.0           False   
2   1.192453e+06 2024-07-05 00:23:45           0.0           False   
3   1.192459e+06 2024-07-05 00:32:11           0.0           False   

   all_doors_closed  train_weight (kg) train_state  train_state_changed  \
0             False             366680         PPA                 True   
1             False             366120         PPA                 True   
2             False             365550         PPA                 Tr

  df["datetime"] =  pd.to_datetime(df["datetime"])
A value is trying to be set on a copy of a slice from a DataFrame.
Try using .loc[row_indexer,col_indexer] = value instead

See the caveats in the documentation: https://pandas.pydata.org/pandas-docs/stable/user_guide/indexing.html#returning-a-view-versus-a-copy
  df_stations1['datetime'] = pd.to_datetime(df_stations1['datetime'])
A value is trying to be set on a copy of a slice from a DataFrame.
Try using .loc[row_indexer,col_indexer] = value instead

See the caveats in the documentation: https://pandas.pydata.org/pandas-docs/stable/user_guide/indexing.html#returning-a-view-versus-a-copy
  df_stations1['Portas_abertas'] = 0
  df_stations = df_stations1[(df['train_state'] == "PPA") & (df['train_state_changed'] == True)]
A value is trying to be set on a copy of a slice from a DataFrame.
Try using .loc[row_indexer,col_indexer] = value instead

See the caveats in the documentation: https://pandas.pydata.org/pandas-docs/stable/user_guide/i

Achei um início!
Classifiquei a estação na linha 27 como Baltazar Fidélis (tabela oposta).
Classifiquei a estação na linha 28 como Franco da Rocha (tabela oposta).
Classifiquei a estação na linha 29 como Caieiras (tabela oposta).
Classifiquei a estação na linha 33 como Pirituba.
Classifiquei a estação na linha 34 como Vila Clarice.
Classifiquei a estação na linha 35 como Piqueri (tabela oposta).
Classifiquei a estação na linha 36 como Lapa (tabela oposta).
Classifiquei a estação na linha 37 como Brás.
Classifiquei a estação na linha 38 como Luz.
Classifiquei a estação na linha 39 como Barra-Funda.
Classifiquei a estação na linha 40 como Brás (tabela oposta).
Classifiquei a estação na linha 41 como Mooca (tabela oposta).
Classifiquei a estação na linha 42 como Ipiranga (tabela oposta).
Classifiquei a estação na linha 43 como Tamanduateí (tabela oposta).
Classifiquei a estação na linha 44 como São Caetano do Sul (tabela oposta).
Classifiquei a estação na linha 45 como Utinga (tabela opos

  df["datetime"] =  pd.to_datetime(df["datetime"])
A value is trying to be set on a copy of a slice from a DataFrame.
Try using .loc[row_indexer,col_indexer] = value instead

See the caveats in the documentation: https://pandas.pydata.org/pandas-docs/stable/user_guide/indexing.html#returning-a-view-versus-a-copy
  df_stations1['datetime'] = pd.to_datetime(df_stations1['datetime'])
A value is trying to be set on a copy of a slice from a DataFrame.
Try using .loc[row_indexer,col_indexer] = value instead

See the caveats in the documentation: https://pandas.pydata.org/pandas-docs/stable/user_guide/indexing.html#returning-a-view-versus-a-copy
  df_stations1['Portas_abertas'] = 0
  df_stations = df_stations1[(df['train_state'] == "PPA") & (df['train_state_changed'] == True)]
A value is trying to be set on a copy of a slice from a DataFrame.
Try using .loc[row_indexer,col_indexer] = value instead

See the caveats in the documentation: https://pandas.pydata.org/pandas-docs/stable/user_guide/i

Achei um início!
Achei um início!
Achei um início!
A estação na linha 0 permaneceu como 'Não classificada'.
    distance (km)            datetime  speed (km/h)  head_car_relay  \
0    808347.46387 2024-06-05 04:09:17           0.0            True   
1    808352.62187 2024-06-05 04:16:30           0.0           False   
2    808358.48329 2024-06-05 04:22:16           0.0           False   
3    808362.44013 2024-06-05 04:26:35           0.0           False   
4    808369.09150 2024-06-05 04:35:43           0.0           False   
..            ...                 ...           ...             ...   
63   808558.47129 2024-06-05 08:37:12           0.0           False   
64   808565.11960 2024-06-05 08:45:15           0.0           False   
65   808568.96087 2024-06-05 08:49:03           0.0           False   
66   808571.48532 2024-06-05 08:52:30           0.0           False   
67   808576.47863 2024-06-05 08:58:06           0.0           False   

    all_doors_closed  train_weight (kg)

  df["datetime"] =  pd.to_datetime(df["datetime"])
A value is trying to be set on a copy of a slice from a DataFrame.
Try using .loc[row_indexer,col_indexer] = value instead

See the caveats in the documentation: https://pandas.pydata.org/pandas-docs/stable/user_guide/indexing.html#returning-a-view-versus-a-copy
  df_stations1['datetime'] = pd.to_datetime(df_stations1['datetime'])
A value is trying to be set on a copy of a slice from a DataFrame.
Try using .loc[row_indexer,col_indexer] = value instead

See the caveats in the documentation: https://pandas.pydata.org/pandas-docs/stable/user_guide/indexing.html#returning-a-view-versus-a-copy
  df_stations1['Portas_abertas'] = 0
  df_stations = df_stations1[(df['train_state'] == "PPA") & (df['train_state_changed'] == True)]
A value is trying to be set on a copy of a slice from a DataFrame.
Try using .loc[row_indexer,col_indexer] = value instead

See the caveats in the documentation: https://pandas.pydata.org/pandas-docs/stable/user_guide/i

Achei um início!
Classifiquei a estação na linha 2 como Pirituba.
Classifiquei a estação na linha 3 como Vila Clarice.
Classifiquei a estação na linha 4 como Piqueri (tabela oposta).
Classifiquei a estação na linha 5 como Lapa (tabela oposta).
Classifiquei a estação na linha 6 como Brás.
Classifiquei a estação na linha 7 como Luz.
Classifiquei a estação na linha 8 como Barra-Funda.
Classifiquei a estação na linha 10 como Mooca (tabela oposta).
Classifiquei a estação na linha 11 como Ipiranga (tabela oposta).
Classifiquei a estação na linha 12 como Tamanduateí (tabela oposta).
Classifiquei a estação na linha 13 como São Caetano do Sul (tabela oposta).
Classifiquei a estação na linha 14 como Utinga (tabela oposta).
Classifiquei a estação na linha 15 como Prefeito Saladino (tabela oposta).
Classifiquei a estação na linha 16 como Santo André (tabela oposta).
Classifiquei a estação na linha 17 como Capuava (tabela oposta).
Classifiquei a estação na linha 18 como Mauá (tabela oposta).
Classi

  df["datetime"] =  pd.to_datetime(df["datetime"])
A value is trying to be set on a copy of a slice from a DataFrame.
Try using .loc[row_indexer,col_indexer] = value instead

See the caveats in the documentation: https://pandas.pydata.org/pandas-docs/stable/user_guide/indexing.html#returning-a-view-versus-a-copy
  df_stations1['datetime'] = pd.to_datetime(df_stations1['datetime'])
A value is trying to be set on a copy of a slice from a DataFrame.
Try using .loc[row_indexer,col_indexer] = value instead

See the caveats in the documentation: https://pandas.pydata.org/pandas-docs/stable/user_guide/indexing.html#returning-a-view-versus-a-copy
  df_stations1['Portas_abertas'] = 0
  df_stations = df_stations1[(df['train_state'] == "PPA") & (df['train_state_changed'] == True)]
A value is trying to be set on a copy of a slice from a DataFrame.
Try using .loc[row_indexer,col_indexer] = value instead

See the caveats in the documentation: https://pandas.pydata.org/pandas-docs/stable/user_guide/i

Nenhuma estação foi mapeada. Verifique os dados de entrada ou ajuste os critérios.
Classifiquei a estação na linha 0 como Ribeirão Pires.
Classifiquei a estação na linha 26 como Baltazar Fidélis (tabela oposta).
Classifiquei a estação na linha 27 como Franco da Rocha (tabela oposta).
Classifiquei a estação na linha 28 como Caieiras (tabela oposta).
Classifiquei a estação na linha 32 como Pirituba.
Classifiquei a estação na linha 33 como Vila Clarice.
Classifiquei a estação na linha 34 como Piqueri (tabela oposta).
Classifiquei a estação na linha 35 como Lapa (tabela oposta).
Classifiquei a estação na linha 36 como Brás.
Classifiquei a estação na linha 37 como Luz.
Classifiquei a estação na linha 38 como Barra-Funda.
Classifiquei a estação na linha 39 como Brás (tabela oposta).
Classifiquei a estação na linha 40 como Mooca (tabela oposta).
Classifiquei a estação na linha 41 como Ipiranga (tabela oposta).
Classifiquei a estação na linha 42 como Tamanduateí (tabela oposta).
Classifiquei a

  df["datetime"] =  pd.to_datetime(df["datetime"])
A value is trying to be set on a copy of a slice from a DataFrame.
Try using .loc[row_indexer,col_indexer] = value instead

See the caveats in the documentation: https://pandas.pydata.org/pandas-docs/stable/user_guide/indexing.html#returning-a-view-versus-a-copy
  df_stations1['datetime'] = pd.to_datetime(df_stations1['datetime'])
A value is trying to be set on a copy of a slice from a DataFrame.
Try using .loc[row_indexer,col_indexer] = value instead

See the caveats in the documentation: https://pandas.pydata.org/pandas-docs/stable/user_guide/indexing.html#returning-a-view-versus-a-copy
  df_stations1['Portas_abertas'] = 0
  df_stations = df_stations1[(df['train_state'] == "PPA") & (df['train_state_changed'] == True)]
A value is trying to be set on a copy of a slice from a DataFrame.
Try using .loc[row_indexer,col_indexer] = value instead

See the caveats in the documentation: https://pandas.pydata.org/pandas-docs/stable/user_guide/i

Achei um início!
Achei um início!
    distance (km)            datetime  speed (km/h)  head_car_relay  \
0    1.113022e+06 2024-06-05 04:14:13           0.0           False   
1    1.113027e+06 2024-06-05 04:20:51           0.0           False   
2    1.113032e+06 2024-06-05 04:34:19           0.0            True   
3    1.113038e+06 2024-06-05 04:39:43           0.0            True   
4    1.113042e+06 2024-06-05 04:43:43           0.0            True   
..            ...                 ...           ...             ...   
57   1.113201e+06 2024-06-05 08:10:28           0.0           False   
58   1.113208e+06 2024-06-05 08:20:27           0.0           False   
59   1.113211e+06 2024-06-05 08:24:13           0.0           False   
60   1.113217e+06 2024-06-05 08:29:38           0.0           False   
61   1.113223e+06 2024-06-05 08:38:15           0.0           False   

    all_doors_closed  train_weight (kg) train_state  train_state_changed  \
0              False             3666

  df["datetime"] =  pd.to_datetime(df["datetime"])
A value is trying to be set on a copy of a slice from a DataFrame.
Try using .loc[row_indexer,col_indexer] = value instead

See the caveats in the documentation: https://pandas.pydata.org/pandas-docs/stable/user_guide/indexing.html#returning-a-view-versus-a-copy
  df_stations1['datetime'] = pd.to_datetime(df_stations1['datetime'])
A value is trying to be set on a copy of a slice from a DataFrame.
Try using .loc[row_indexer,col_indexer] = value instead

See the caveats in the documentation: https://pandas.pydata.org/pandas-docs/stable/user_guide/indexing.html#returning-a-view-versus-a-copy
  df_stations1['Portas_abertas'] = 0
  df_stations = df_stations1[(df['train_state'] == "PPA") & (df['train_state_changed'] == True)]
A value is trying to be set on a copy of a slice from a DataFrame.
Try using .loc[row_indexer,col_indexer] = value instead

See the caveats in the documentation: https://pandas.pydata.org/pandas-docs/stable/user_guide/i

Nenhuma estação foi mapeada. Verifique os dados de entrada ou ajuste os critérios.
Classifiquei a estação na linha 0 como Piqueri (tabela oposta).
Classifiquei a estação na linha 1 como Lapa (tabela oposta).
Classifiquei a estação na linha 2 como Brás.
Classifiquei a estação na linha 3 como Luz.
Classifiquei a estação na linha 4 como Barra-Funda.
Classifiquei a estação na linha 5 como Brás (tabela oposta).
Classifiquei a estação na linha 6 como Mooca (tabela oposta).
Classifiquei a estação na linha 7 como Ipiranga (tabela oposta).
Classifiquei a estação na linha 8 como Tamanduateí (tabela oposta).
Classifiquei a estação na linha 9 como São Caetano do Sul (tabela oposta).
Classifiquei a estação na linha 10 como Utinga (tabela oposta).
Classifiquei a estação na linha 11 como Prefeito Saladino (tabela oposta).
Classifiquei a estação na linha 12 como Santo André (tabela oposta).
Classifiquei a estação na linha 14 como Mauá.
Classifiquei a estação na linha 15 como Capuava.
Classifiquei a es

  df["datetime"] =  pd.to_datetime(df["datetime"])
A value is trying to be set on a copy of a slice from a DataFrame.
Try using .loc[row_indexer,col_indexer] = value instead

See the caveats in the documentation: https://pandas.pydata.org/pandas-docs/stable/user_guide/indexing.html#returning-a-view-versus-a-copy
  df_stations1['datetime'] = pd.to_datetime(df_stations1['datetime'])
A value is trying to be set on a copy of a slice from a DataFrame.
Try using .loc[row_indexer,col_indexer] = value instead

See the caveats in the documentation: https://pandas.pydata.org/pandas-docs/stable/user_guide/indexing.html#returning-a-view-versus-a-copy
  df_stations1['Portas_abertas'] = 0
  df_stations = df_stations1[(df['train_state'] == "PPA") & (df['train_state_changed'] == True)]
A value is trying to be set on a copy of a slice from a DataFrame.
Try using .loc[row_indexer,col_indexer] = value instead

See the caveats in the documentation: https://pandas.pydata.org/pandas-docs/stable/user_guide/i

Nenhuma estação foi mapeada. Verifique os dados de entrada ou ajuste os critérios.
Classifiquei a estação na linha 0 como Baltazar Fidélis (tabela oposta).
Classifiquei a estação na linha 1 como Franco da Rocha (tabela oposta).
Classifiquei a estação na linha 2 como Caieiras (tabela oposta).
Classifiquei a estação na linha 6 como Pirituba.
Classifiquei a estação na linha 7 como Vila Clarice.
Classifiquei a estação na linha 8 como Piqueri (tabela oposta).
Classifiquei a estação na linha 9 como Lapa (tabela oposta).
Classifiquei a estação na linha 10 como Brás.
Classifiquei a estação na linha 11 como Luz.
Classifiquei a estação na linha 12 como Barra-Funda.
Classifiquei a estação na linha 13 como Brás (tabela oposta).
Classifiquei a estação na linha 14 como Mooca (tabela oposta).
Classifiquei a estação na linha 15 como Ipiranga (tabela oposta).
Classifiquei a estação na linha 16 como Tamanduateí (tabela oposta).
Classifiquei a estação na linha 17 como São Caetano do Sul (tabela oposta).


  df["datetime"] =  pd.to_datetime(df["datetime"])
A value is trying to be set on a copy of a slice from a DataFrame.
Try using .loc[row_indexer,col_indexer] = value instead

See the caveats in the documentation: https://pandas.pydata.org/pandas-docs/stable/user_guide/indexing.html#returning-a-view-versus-a-copy
  df_stations1['datetime'] = pd.to_datetime(df_stations1['datetime'])
A value is trying to be set on a copy of a slice from a DataFrame.
Try using .loc[row_indexer,col_indexer] = value instead

See the caveats in the documentation: https://pandas.pydata.org/pandas-docs/stable/user_guide/indexing.html#returning-a-view-versus-a-copy
  df_stations1['Portas_abertas'] = 0
  df_stations = df_stations1[(df['train_state'] == "PPA") & (df['train_state_changed'] == True)]
A value is trying to be set on a copy of a slice from a DataFrame.
Try using .loc[row_indexer,col_indexer] = value instead

See the caveats in the documentation: https://pandas.pydata.org/pandas-docs/stable/user_guide/i

Achei um início!
Classifiquei a estação na linha 0 como Prefeito Saladino (tabela oposta).
Classifiquei a estação na linha 1 como Santo André (tabela oposta).
Classifiquei a estação na linha 2 como Capuava (tabela oposta).
Classifiquei a estação na linha 3 como Mauá (tabela oposta).
Classifiquei a estação na linha 4 como Guapituba (tabela oposta).
Classifiquei a estação na linha 33 como Baltazar Fidélis (tabela oposta).
Classifiquei a estação na linha 34 como Franco da Rocha (tabela oposta).
Classifiquei a estação na linha 35 como Caieiras (tabela oposta).
Classifiquei a estação na linha 39 como Pirituba.
Classifiquei a estação na linha 40 como Vila Clarice.
Classifiquei a estação na linha 41 como Piqueri (tabela oposta).
Classifiquei a estação na linha 42 como Lapa (tabela oposta).
Classifiquei a estação na linha 43 como Brás.
Classifiquei a estação na linha 44 como Luz.
Classifiquei a estação na linha 45 como Barra-Funda.
Classifiquei a estação na linha 46 como Brás (tabela oposta).


  df["datetime"] =  pd.to_datetime(df["datetime"])
A value is trying to be set on a copy of a slice from a DataFrame.
Try using .loc[row_indexer,col_indexer] = value instead

See the caveats in the documentation: https://pandas.pydata.org/pandas-docs/stable/user_guide/indexing.html#returning-a-view-versus-a-copy
  df_stations1['datetime'] = pd.to_datetime(df_stations1['datetime'])
A value is trying to be set on a copy of a slice from a DataFrame.
Try using .loc[row_indexer,col_indexer] = value instead

See the caveats in the documentation: https://pandas.pydata.org/pandas-docs/stable/user_guide/indexing.html#returning-a-view-versus-a-copy
  df_stations1['Portas_abertas'] = 0
  df_stations = df_stations1[(df['train_state'] == "PPA") & (df['train_state_changed'] == True)]
A value is trying to be set on a copy of a slice from a DataFrame.
Try using .loc[row_indexer,col_indexer] = value instead

See the caveats in the documentation: https://pandas.pydata.org/pandas-docs/stable/user_guide/i

Achei um início!
Achei um início!
    distance (km)            datetime  speed (km/h)  head_car_relay  \
0    1.098052e+06 2024-06-05 14:05:27           0.0           False   
1    1.098056e+06 2024-06-05 14:11:58           0.0           False   
2    1.098058e+06 2024-06-05 14:15:10           0.0           False   
3    1.098060e+06 2024-06-05 14:17:23           0.0           False   
4    1.098062e+06 2024-06-05 14:20:06           0.0           False   
..            ...                 ...           ...             ...   
57   1.098241e+06 2024-06-05 18:45:30           0.0           False   
58   1.098244e+06 2024-06-05 18:48:49           0.0           False   
59   1.098245e+06 2024-06-05 18:51:49           0.0           False   
60   1.098248e+06 2024-06-05 18:55:16           0.0           False   
61   1.098251e+06 2024-06-05 18:59:51           0.0           False   

    all_doors_closed  train_weight (kg) train_state  train_state_changed  \
0              False             3922

  df["datetime"] =  pd.to_datetime(df["datetime"])
A value is trying to be set on a copy of a slice from a DataFrame.
Try using .loc[row_indexer,col_indexer] = value instead

See the caveats in the documentation: https://pandas.pydata.org/pandas-docs/stable/user_guide/indexing.html#returning-a-view-versus-a-copy
  df_stations1['datetime'] = pd.to_datetime(df_stations1['datetime'])
A value is trying to be set on a copy of a slice from a DataFrame.
Try using .loc[row_indexer,col_indexer] = value instead

See the caveats in the documentation: https://pandas.pydata.org/pandas-docs/stable/user_guide/indexing.html#returning-a-view-versus-a-copy
  df_stations1['Portas_abertas'] = 0
  df_stations = df_stations1[(df['train_state'] == "PPA") & (df['train_state_changed'] == True)]
A value is trying to be set on a copy of a slice from a DataFrame.
Try using .loc[row_indexer,col_indexer] = value instead

See the caveats in the documentation: https://pandas.pydata.org/pandas-docs/stable/user_guide/i

Nenhuma estação foi mapeada. Verifique os dados de entrada ou ajuste os critérios.
Classifiquei a estação na linha 0 como Lapa.
Classifiquei a estação na linha 1 como Piqueri.
Classifiquei a estação na linha 2 como Pirituba.
Classifiquei a estação na linha 3 como Vila Clarice.
Classifiquei a estação na linha 4 como Jaraguá.
Classifiquei a estação na linha 5 como Vila Aurora.
Classifiquei a estação na linha 6 como Perus .
A estação Guapituba não é válida após Perus . Linha 7 classificada como 'Não classificada'.
Classifiquei a estação na linha 7 como Caieiras.
Classifiquei a estação na linha 8 como Franco da Rocha.
Classifiquei a estação na linha 9 como Baltazar Fidélis.
Classifiquei a estação na linha 10 como Franscico Morato (baseando-se nas anteriores).
Classifiquei a estação na linha 11 como Botujuru (baseando-se nas anteriores).
    distance (km)            datetime  speed (km/h)  head_car_relay  \
0    1.098255e+06 2024-06-05 19:05:08           0.0           False   
1    1.098257

  df["datetime"] =  pd.to_datetime(df["datetime"])
A value is trying to be set on a copy of a slice from a DataFrame.
Try using .loc[row_indexer,col_indexer] = value instead

See the caveats in the documentation: https://pandas.pydata.org/pandas-docs/stable/user_guide/indexing.html#returning-a-view-versus-a-copy
  df_stations1['datetime'] = pd.to_datetime(df_stations1['datetime'])
A value is trying to be set on a copy of a slice from a DataFrame.
Try using .loc[row_indexer,col_indexer] = value instead

See the caveats in the documentation: https://pandas.pydata.org/pandas-docs/stable/user_guide/indexing.html#returning-a-view-versus-a-copy
  df_stations1['Portas_abertas'] = 0
  df_stations = df_stations1[(df['train_state'] == "PPA") & (df['train_state_changed'] == True)]
A value is trying to be set on a copy of a slice from a DataFrame.
Try using .loc[row_indexer,col_indexer] = value instead

See the caveats in the documentation: https://pandas.pydata.org/pandas-docs/stable/user_guide/i

Achei um início!
Achei um início!
    distance (km)            datetime  speed (km/h)  head_car_relay  \
0    1.017328e+06 2024-06-05 00:05:16      0.000000            True   
1    1.017331e+06 2024-06-05 00:08:40      0.000000            True   
2    1.017332e+06 2024-06-05 00:10:35      0.000000            True   
3    1.017335e+06 2024-06-05 00:13:36      0.472077            True   
4    1.017338e+06 2024-06-05 00:17:22      0.490590            True   
5    1.017340e+06 2024-06-05 00:19:17      0.000000            True   
6    1.017342e+06 2024-06-05 00:21:37      0.000000            True   
7    1.017346e+06 2024-06-05 00:26:00      0.000000            True   
8    1.017349e+06 2024-06-05 00:29:33      0.000000            True   
9    1.017352e+06 2024-06-05 00:33:18      0.000000            True   
10   1.017357e+06 2024-06-05 00:38:04      0.499846            True   
11   1.017361e+06 2024-06-05 00:45:16      0.000000            True   
12   1.017365e+06 2024-06-05 00:55:09      

  df["datetime"] =  pd.to_datetime(df["datetime"])
A value is trying to be set on a copy of a slice from a DataFrame.
Try using .loc[row_indexer,col_indexer] = value instead

See the caveats in the documentation: https://pandas.pydata.org/pandas-docs/stable/user_guide/indexing.html#returning-a-view-versus-a-copy
  df_stations1['datetime'] = pd.to_datetime(df_stations1['datetime'])
A value is trying to be set on a copy of a slice from a DataFrame.
Try using .loc[row_indexer,col_indexer] = value instead

See the caveats in the documentation: https://pandas.pydata.org/pandas-docs/stable/user_guide/indexing.html#returning-a-view-versus-a-copy
  df_stations1['Portas_abertas'] = 0
  df_stations = df_stations1[(df['train_state'] == "PPA") & (df['train_state_changed'] == True)]
A value is trying to be set on a copy of a slice from a DataFrame.
Try using .loc[row_indexer,col_indexer] = value instead

See the caveats in the documentation: https://pandas.pydata.org/pandas-docs/stable/user_guide/i

Achei um início!
Achei um início!
    distance (km)            datetime  speed (km/h)  head_car_relay  \
0    1.007980e+06 2024-06-05 04:12:11           0.0           False   
1    1.007983e+06 2024-06-05 04:14:51           0.0           False   
2    1.007987e+06 2024-06-05 04:18:32           0.0           False   
3    1.007993e+06 2024-06-05 04:28:07           0.0           False   
4    1.007997e+06 2024-06-05 04:31:55           0.0           False   
..            ...                 ...           ...             ...   
60   1.008175e+06 2024-06-05 08:29:08           0.0           False   
61   1.008177e+06 2024-06-05 08:31:48           0.0           False   
62   1.008181e+06 2024-06-05 08:37:10           0.0           False   
63   1.008188e+06 2024-06-05 08:51:08           0.0           False   
64   1.008192e+06 2024-06-05 08:54:54           0.0           False   

    all_doors_closed  train_weight (kg) train_state  train_state_changed  \
0              False             3651

  df["datetime"] =  pd.to_datetime(df["datetime"])
A value is trying to be set on a copy of a slice from a DataFrame.
Try using .loc[row_indexer,col_indexer] = value instead

See the caveats in the documentation: https://pandas.pydata.org/pandas-docs/stable/user_guide/indexing.html#returning-a-view-versus-a-copy
  df_stations1['datetime'] = pd.to_datetime(df_stations1['datetime'])
A value is trying to be set on a copy of a slice from a DataFrame.
Try using .loc[row_indexer,col_indexer] = value instead

See the caveats in the documentation: https://pandas.pydata.org/pandas-docs/stable/user_guide/indexing.html#returning-a-view-versus-a-copy
  df_stations1['Portas_abertas'] = 0
  df_stations = df_stations1[(df['train_state'] == "PPA") & (df['train_state_changed'] == True)]
A value is trying to be set on a copy of a slice from a DataFrame.
Try using .loc[row_indexer,col_indexer] = value instead

See the caveats in the documentation: https://pandas.pydata.org/pandas-docs/stable/user_guide/i

Achei um início!
Achei um início!
    distance (km)            datetime  speed (km/h)  head_car_relay  \
0    1.008203e+06 2024-06-05 09:06:26           0.0           False   
1    1.008208e+06 2024-06-05 09:15:03           0.0            True   
2    1.008214e+06 2024-06-05 09:20:25           0.0            True   
3    1.008218e+06 2024-06-05 09:24:27           0.0            True   
4    1.008224e+06 2024-06-05 09:34:06           0.0            True   
5    1.008228e+06 2024-06-05 09:38:38           0.0            True   
6    1.008230e+06 2024-06-05 09:41:55           0.0            True   
7    1.008235e+06 2024-06-05 09:47:22           0.0            True   
8    1.008240e+06 2024-06-05 09:51:49           0.0            True   
9    1.008244e+06 2024-06-05 09:56:11           0.0            True   
10   1.008246e+06 2024-06-05 09:59:54           0.0            True   
11   1.008248e+06 2024-06-05 10:04:06           0.0            True   
12   1.008251e+06 2024-06-05 10:08:46      

  df["datetime"] =  pd.to_datetime(df["datetime"])
A value is trying to be set on a copy of a slice from a DataFrame.
Try using .loc[row_indexer,col_indexer] = value instead

See the caveats in the documentation: https://pandas.pydata.org/pandas-docs/stable/user_guide/indexing.html#returning-a-view-versus-a-copy
  df_stations1['datetime'] = pd.to_datetime(df_stations1['datetime'])
A value is trying to be set on a copy of a slice from a DataFrame.
Try using .loc[row_indexer,col_indexer] = value instead

See the caveats in the documentation: https://pandas.pydata.org/pandas-docs/stable/user_guide/indexing.html#returning-a-view-versus-a-copy
  df_stations1['Portas_abertas'] = 0
  df_stations = df_stations1[(df['train_state'] == "PPA") & (df['train_state_changed'] == True)]
A value is trying to be set on a copy of a slice from a DataFrame.
Try using .loc[row_indexer,col_indexer] = value instead

See the caveats in the documentation: https://pandas.pydata.org/pandas-docs/stable/user_guide/i

Nenhuma estação foi mapeada. Verifique os dados de entrada ou ajuste os critérios.
Classifiquei a estação na linha 0 como Baltazar Fidélis (tabela oposta).
Classifiquei a estação na linha 1 como Franco da Rocha (tabela oposta).
Classifiquei a estação na linha 2 como Caieiras (tabela oposta).
Classifiquei a estação na linha 6 como Pirituba.
Classifiquei a estação na linha 7 como Vila Clarice.
Classifiquei a estação na linha 8 como Piqueri (tabela oposta).
Classifiquei a estação na linha 9 como Lapa (tabela oposta).
Classifiquei a estação na linha 10 como Brás.
Classifiquei a estação na linha 11 como Luz.
Classifiquei a estação na linha 12 como Barra-Funda.
Classifiquei a estação na linha 13 como Brás (tabela oposta).
Classifiquei a estação na linha 14 como Mooca (tabela oposta).
Classifiquei a estação na linha 15 como Ipiranga (tabela oposta).
Classifiquei a estação na linha 16 como Tamanduateí (tabela oposta).
Classifiquei a estação na linha 17 como São Caetano do Sul (tabela oposta).


  df["datetime"] =  pd.to_datetime(df["datetime"])
A value is trying to be set on a copy of a slice from a DataFrame.
Try using .loc[row_indexer,col_indexer] = value instead

See the caveats in the documentation: https://pandas.pydata.org/pandas-docs/stable/user_guide/indexing.html#returning-a-view-versus-a-copy
  df_stations1['datetime'] = pd.to_datetime(df_stations1['datetime'])
A value is trying to be set on a copy of a slice from a DataFrame.
Try using .loc[row_indexer,col_indexer] = value instead

See the caveats in the documentation: https://pandas.pydata.org/pandas-docs/stable/user_guide/indexing.html#returning-a-view-versus-a-copy
  df_stations1['Portas_abertas'] = 0
  df_stations = df_stations1[(df['train_state'] == "PPA") & (df['train_state_changed'] == True)]
A value is trying to be set on a copy of a slice from a DataFrame.
Try using .loc[row_indexer,col_indexer] = value instead

See the caveats in the documentation: https://pandas.pydata.org/pandas-docs/stable/user_guide/i

Achei um início!
Achei um início!
    distance (km)            datetime  speed (km/h)  head_car_relay  \
0    1.017512e+06 2024-06-05 04:04:12      0.000000            True   
1    1.017514e+06 2024-06-05 04:08:08      0.000000            True   
2    1.017518e+06 2024-06-05 04:12:47      0.000000            True   
3    1.017520e+06 2024-06-05 04:17:02      0.472077            True   
4    1.017522e+06 2024-06-05 04:21:05      0.000000            True   
..            ...                 ...           ...             ...   
65   1.017718e+06 2024-06-05 08:46:47      0.000000            True   
66   1.017719e+06 2024-06-05 08:48:52      0.000000            True   
67   1.017722e+06 2024-06-05 08:52:49      0.000000            True   
68   1.017725e+06 2024-06-05 08:57:13      0.000000            True   
69   1.017727e+06 2024-06-05 08:59:18      0.000000            True   

    all_doors_closed  train_weight (kg) train_state  train_state_changed  \
0              False             4963

  df["datetime"] =  pd.to_datetime(df["datetime"])
A value is trying to be set on a copy of a slice from a DataFrame.
Try using .loc[row_indexer,col_indexer] = value instead

See the caveats in the documentation: https://pandas.pydata.org/pandas-docs/stable/user_guide/indexing.html#returning-a-view-versus-a-copy
  df_stations1['datetime'] = pd.to_datetime(df_stations1['datetime'])
A value is trying to be set on a copy of a slice from a DataFrame.
Try using .loc[row_indexer,col_indexer] = value instead

See the caveats in the documentation: https://pandas.pydata.org/pandas-docs/stable/user_guide/indexing.html#returning-a-view-versus-a-copy
  df_stations1['Portas_abertas'] = 0
  df_stations = df_stations1[(df['train_state'] == "PPA") & (df['train_state_changed'] == True)]
A value is trying to be set on a copy of a slice from a DataFrame.
Try using .loc[row_indexer,col_indexer] = value instead

See the caveats in the documentation: https://pandas.pydata.org/pandas-docs/stable/user_guide/i

Achei um início!
Achei um início!
    distance (km)            datetime  speed (km/h)  head_car_relay  \
0    1.017733e+06 2024-06-05 09:06:00           0.0            True   
1    1.017736e+06 2024-06-05 09:10:41           0.0            True   
2    1.017739e+06 2024-06-05 09:16:22           0.0            True   
3    1.017744e+06 2024-06-05 09:23:38           0.0            True   
4    1.017748e+06 2024-06-05 09:33:29           0.0            True   
..            ...                 ...           ...             ...   
58   1.017920e+06 2024-06-05 13:37:26           0.0            True   
59   1.017922e+06 2024-06-05 13:40:17           0.0            True   
60   1.017926e+06 2024-06-05 13:44:55           0.0            True   
61   1.017930e+06 2024-06-05 13:48:49           0.0            True   
62   1.017933e+06 2024-06-05 13:55:19           0.0            True   

    all_doors_closed  train_weight (kg) train_state  train_state_changed  \
0              False             3964

  df["datetime"] =  pd.to_datetime(df["datetime"])
A value is trying to be set on a copy of a slice from a DataFrame.
Try using .loc[row_indexer,col_indexer] = value instead

See the caveats in the documentation: https://pandas.pydata.org/pandas-docs/stable/user_guide/indexing.html#returning-a-view-versus-a-copy
  df_stations1['datetime'] = pd.to_datetime(df_stations1['datetime'])
A value is trying to be set on a copy of a slice from a DataFrame.
Try using .loc[row_indexer,col_indexer] = value instead

See the caveats in the documentation: https://pandas.pydata.org/pandas-docs/stable/user_guide/indexing.html#returning-a-view-versus-a-copy
  df_stations1['Portas_abertas'] = 0
  df_stations = df_stations1[(df['train_state'] == "PPA") & (df['train_state_changed'] == True)]
A value is trying to be set on a copy of a slice from a DataFrame.
Try using .loc[row_indexer,col_indexer] = value instead

See the caveats in the documentation: https://pandas.pydata.org/pandas-docs/stable/user_guide/i

Achei um início!
Achei um início!
    distance (km)            datetime  speed (km/h)  head_car_relay  \
0    1.017941e+06 2024-06-05 14:08:42           0.0            True   
1    1.017946e+06 2024-06-05 14:21:33           0.0           False   
2    1.017950e+06 2024-06-05 14:26:13           0.0           False   
3    1.017953e+06 2024-06-05 14:32:04           0.0           False   
4    1.017957e+06 2024-06-05 14:35:49           0.0           False   
..            ...                 ...           ...             ...   
56   1.018120e+06 2024-06-05 18:24:02           0.0            True   
57   1.018123e+06 2024-06-05 18:28:54           0.0            True   
58   1.018126e+06 2024-06-05 18:34:01           0.0            True   
59   1.018131e+06 2024-06-05 18:39:12           0.0            True   
60   1.018135e+06 2024-06-05 18:50:31           0.0            True   

    all_doors_closed  train_weight (kg) train_state  train_state_changed  \
0              False             3902

  df["datetime"] =  pd.to_datetime(df["datetime"])
A value is trying to be set on a copy of a slice from a DataFrame.
Try using .loc[row_indexer,col_indexer] = value instead

See the caveats in the documentation: https://pandas.pydata.org/pandas-docs/stable/user_guide/indexing.html#returning-a-view-versus-a-copy
  df_stations1['datetime'] = pd.to_datetime(df_stations1['datetime'])
A value is trying to be set on a copy of a slice from a DataFrame.
Try using .loc[row_indexer,col_indexer] = value instead

See the caveats in the documentation: https://pandas.pydata.org/pandas-docs/stable/user_guide/indexing.html#returning-a-view-versus-a-copy
  df_stations1['Portas_abertas'] = 0
  df_stations = df_stations1[(df['train_state'] == "PPA") & (df['train_state_changed'] == True)]
A value is trying to be set on a copy of a slice from a DataFrame.
Try using .loc[row_indexer,col_indexer] = value instead

See the caveats in the documentation: https://pandas.pydata.org/pandas-docs/stable/user_guide/i

Nenhuma estação foi mapeada. Verifique os dados de entrada ou ajuste os critérios.
Classifiquei a estação na linha 0 como Guapituba.
Classifiquei a estação na linha 1 como Mauá.
Classifiquei a estação na linha 2 como Capuava.
Classifiquei a estação na linha 3 como Santo André.
Classifiquei a estação na linha 4 como Prefeito Saladino.
Classifiquei a estação na linha 5 como Utinga.
Classifiquei a estação na linha 6 como São Caetano do Sul.
Classifiquei a estação na linha 7 como Tamanduateí.
Classifiquei a estação na linha 8 como Ipiranga.
Classifiquei a estação na linha 9 como Mooca.
Classifiquei a estação na linha 10 como Brás.
Classifiquei a estação na linha 11 como Luz.
Classifiquei a estação na linha 12 como Barra-Funda.
Classifiquei a estação na linha 13 como Água Branca.
Classifiquei a estação na linha 14 como Lapa.
Classifiquei a estação na linha 15 como Piqueri.
Classifiquei a estação na linha 16 como Pirituba.
Classifiquei a estação na linha 17 como Vila Clarice.
Classifiquei a 

  df["datetime"] =  pd.to_datetime(df["datetime"])


Achei um início!
Classifiquei a estação na linha 0 como Caieiras.
Classifiquei a estação na linha 1 como Franco da Rocha.
Classifiquei a estação na linha 2 como Baltazar Fidélis.
Classifiquei a estação na linha 3 como Franscico Morato.
Classifiquei a estação na linha 4 como Botujuru.
Classifiquei a estação na linha 5 como Campo Limpo Paulista.
Classifiquei a estação na linha 6 como Várzea Paulista (baseando-se nas anteriores).
Classifiquei a estação na linha 7 como Jundiaí (baseando-se nas anteriores).
A estação na linha 38 permaneceu como 'Não classificada'.
A estação na linha 39 permaneceu como 'Não classificada'.
    distance (km)            datetime  speed (km/h)  head_car_relay  \
0    1.008495e+06 2024-06-05 19:11:30        0.0000           False   
1    1.008500e+06 2024-06-05 19:18:51        0.0000           False   
2    1.008502e+06 2024-06-05 19:28:49        0.4935           False   
3    1.008506e+06 2024-06-05 19:32:41        0.0000           False   
4    1.008513e+06 202

A value is trying to be set on a copy of a slice from a DataFrame.
Try using .loc[row_indexer,col_indexer] = value instead

See the caveats in the documentation: https://pandas.pydata.org/pandas-docs/stable/user_guide/indexing.html#returning-a-view-versus-a-copy
  df_stations1['datetime'] = pd.to_datetime(df_stations1['datetime'])
A value is trying to be set on a copy of a slice from a DataFrame.
Try using .loc[row_indexer,col_indexer] = value instead

See the caveats in the documentation: https://pandas.pydata.org/pandas-docs/stable/user_guide/indexing.html#returning-a-view-versus-a-copy
  df_stations1['Portas_abertas'] = 0
  df_stations = df_stations1[(df['train_state'] == "PPA") & (df['train_state_changed'] == True)]
A value is trying to be set on a copy of a slice from a DataFrame.
Try using .loc[row_indexer,col_indexer] = value instead

See the caveats in the documentation: https://pandas.pydata.org/pandas-docs/stable/user_guide/indexing.html#returning-a-view-versus-a-copy
  df_st