In [65]:
import pandas as pd

# Define the file path
file_path = "Data/sr_rs_uzol_zoznam_2023-01-01.xlsx"

# Load the Excel data into a DataFrame
df_excel = pd.read_excel(file_path)

# Now, df_excel contains your data from the Excel file.

In [103]:
df_nodes = df_excel.copy()
df_nodes.columns

Index(['Číslo uzla', 'Charakter uzla', 'Hranica okresu', 'Hranica spravcu',
       'Hranica vlastnika', 'Hraničný priechod', 'Je samostatný',
       'X / zemepisná dĺžka', 'Y /zemepisná šírka', 'Popis uzla / podrobný',
       'Popis Uzla - okres/obec', 'Križovatka -číslo', 'Typ križovatky',
       'Tvar križovatky', 'Riadenie dopravy', 'Číslo exitu',
       'Názov križovatky'],
      dtype='object')

In [104]:
# Define a dictionary to map the old column names to new ones for df_nodes
column_mapping_nodes = {
    'Číslo uzla': 'Číslo_uzla',
    'Charakter uzla': 'Charakter_uzla',
    'Hranica okresu': 'Hranica_okresu',
    'Hranica spravcu': 'Hranica_spravcu',
    'Hranica vlastnika': 'Hranica_vlastnika',
    'Hraničný priechod': 'Hraničný_priechod',
    'Je samostatný': 'Je_samostatný',
    'X / zemepisná dĺžka': 'Zemepisná_dĺžka',
    'Y /zemepisná šírka': 'Zemepisná_šírka',
    'Popis uzla / podrobný': 'Popis_uzla_podrobný',
    'Popis Uzla - okres/obec': 'Popis_Uzla_okres_obec',
    'Križovatka -číslo': 'Križovatka_číslo',
    'Typ križovatky': 'Typ_križovatky',
    'Tvar križovatky': 'Tvar_križovatky',
    'Riadenie dopravy': 'Riadenie_dopravy',
    'Číslo exitu': 'Číslo_exitu',
    'Názov križovatky': 'Názov_križovatky'
}
# Rename the columns in the DataFrame
df_nodes.rename(columns=column_mapping_nodes, inplace=True)

In [105]:
# Convert Zemepisná_šírka and Zemepisná_dĺžka columns to strings
df_nodes['Zemepisná_šírka'] = df_nodes['Zemepisná_šírka'].astype(str)
df_nodes['Zemepisná_dĺžka'] = df_nodes['Zemepisná_dĺžka'].astype(str)

# Insert a decimal point after the second digit from the beginning
df_nodes['Zemepisná_šírka'] = df_nodes['Zemepisná_šírka'].apply(
    lambda x: x[:2] + '.' + x[2:])
df_nodes['Zemepisná_dĺžka'] = df_nodes['Zemepisná_dĺžka'].apply(
    lambda x: x[:2] + '.' + x[2:])

# Convert the columns back to float
df_nodes['Zemepisná_šírka'] = df_nodes['Zemepisná_šírka'].astype(float)
df_nodes['Zemepisná_dĺžka'] = df_nodes['Zemepisná_dĺžka'].astype(float)

In [106]:
df_nodes["Zemepisná_šírka"], df_nodes["Zemepisná_dĺžka"]

(0         49.383795
 1         49.382995
 2         49.383090
 3         49.404849
 4         49.405007
             ...    
 112517    48.326855
 112518    48.328228
 112519    48.328526
 112520    48.328948
 112521    48.329170
 Name: Zemepisná_šírka, Length: 112522, dtype: float64,
 0         18.411860
 1         18.412381
 2         18.411040
 3         18.621185
 4         18.621036
             ...    
 112517    20.343427
 112518    20.341883
 112519    20.341539
 112520    20.341037
 112521    20.340808
 Name: Zemepisná_dĺžka, Length: 112522, dtype: float64)

In [107]:
# Remove the single quote from the "Číslo_uzla" column
df_nodes['Číslo_uzla'] = df_nodes['Číslo_uzla'].str.replace("'", '')

In [108]:
# Define the file path for saving the CSV
output_csv_path = "Data/Nodes_processed.csv"

# Save the DataFrame to a CSV file
df_nodes.to_csv(output_csv_path, index=False, encoding='utf-8')

# Now, the DataFrame has been saved as a CSV file at the specified path.

In [109]:
df_nodes.iloc[0]

Číslo_uzla                                               2524A00601
Charakter_uzla                  križovatkový uzlový bod (D,C s D,C)
Hranica_okresu                                                  nie
Hranica_spravcu                                                 nie
Hranica_vlastnika                                               nie
Hraničný_priechod                                               NaN
Je_samostatný                                                     N
Zemepisná_dĺžka                                            18.41186
Zemepisná_šírka                                           49.383795
Popis_uzla_podrobný                 križ. I/10 x II/487, okr. Čadca
Popis_Uzla_okres_obec                                    okr. Čadca
Križovatka_číslo                                           2524A006
Typ_križovatky                                     zložitá úrovňová
Tvar_križovatky                                             Styková
Riadenie_dopravy         zvislé a/alebo vodorovn

In [110]:
# Identify the road with "Úsek_ID" equal to 259391
desired_node = df_nodes[df_nodes['Číslo_uzla'] == "3424A11500"]

# Print the information about the identified road
desired_node

Unnamed: 0,Číslo_uzla,Charakter_uzla,Hranica_okresu,Hranica_spravcu,Hranica_vlastnika,Hraničný_priechod,Je_samostatný,Zemepisná_dĺžka,Zemepisná_šírka,Popis_uzla_podrobný,Popis_Uzla_okres_obec,Križovatka_číslo,Typ_križovatky,Tvar_križovatky,Riadenie_dopravy,Číslo_exitu,Názov_križovatky
24775,3424A11500,"križovatkový uzlový bod (D,C s MC)",nie,nie,nie,,A,17.125,48.790804,"križ. I/2 x MK, Kopčany, okr. Skalica","Kopčany, okr. Skalica",3424A115,neznámy,neznámy,neznámy,,


In [None]:
ok so we need to find df_routes["Počiatočný_uzol"] in df_nodes["Číslo_uzla"]