In [6]:
import pandas as pd
import os

def process_and_save_data(input_mbajk_file, input_weather_file, output_folder):

    # Load data for mbajk and weather
    mbajk = pd.read_csv(input_mbajk_file)
    weather = pd.read_csv(input_weather_file)

    #Rename last_update to date
    mbajk.rename(columns={'last_update':'date'}, inplace=True)

    # Rename station_name to name
    weather.rename(columns={'station_name':'name'}, inplace=True)

    #Merge mbajk and weather data 
    merged = pd.merge(mbajk, weather, on=['date','name'])

    #Aggregate data 
    aggregated_data = merged.groupby(['name','date']).agg({
        'available_bikes': 'mean',
        'available_bike_stands': 'mean',
        'temperature_2m': 'mean',
        'relative_humidity_2m': 'mean',
        'dew_point_2m': 'mean',
        'apparent_temperature': 'mean',
        'precipitation_probability': 'mean',
        'precipitation': 'mean',
        'surface_pressure': 'mean'
    }).reset_index()


    # List of all stations
    stations = aggregated_data['name'].unique()
    
    for station in stations:
        # Filtriramo podatke za trenutno postajališče
        filtered_data = aggregated_data[aggregated_data['name'] == station]
        print(filtered_data.head())
        
        # Ime datoteke za shranjevanje podatkov
        station_path = os.path.join(output_folder, f"{station.replace(' ', '_')}.csv")
        
        # Shranimo filtrirane podatke v CSV datoteko
        filtered_data.to_csv(station_path, mode="a", header=not os.path.exists(station_path), index =False)

        print(f"Podatki za postajališče {station} so bili uspešno prepisani v datoteko {filtered_data}")


input_mbajk_file = '../data/raw/fetch_mbajk.csv'
input_weather_file = '../data/raw/weather/weather.csv'
output_folder = '../data/processed'

output_folder_test="../data/process"

process_and_save_data(input_mbajk_file,input_weather_file, output_folder_test)

            name                       date  available_bikes  \
0  DVORANA TABOR  2024-04-18 19:00:00+00:00              4.0   

   available_bike_stands  temperature_2m  relative_humidity_2m  dew_point_2m  \
0                   16.0          7.3045                  71.0       2.39191   

   apparent_temperature  precipitation_probability  precipitation  \
0              4.380426                       59.0            0.0   

   surface_pressure  
0         980.78314  
Podatki za postajališče DVORANA TABOR so bili uspešno prepisani v datoteko             name                       date  available_bikes  \
0  DVORANA TABOR  2024-04-18 19:00:00+00:00              4.0   

   available_bike_stands  temperature_2m  relative_humidity_2m  dew_point_2m  \
0                   16.0          7.3045                  71.0       2.39191   

   apparent_temperature  precipitation_probability  precipitation  \
0              4.380426                       59.0            0.0   

   surface_pressure  
0

In [1]:
import pandas as pd
import os

def process_and_save_data(input_mbajk_file, input_weather_file, output_folder):
    # Preberemo podatke iz CSV datoteke
    data = pd.read_csv(input_mbajk_file)

    wdata = pd.read_csv(input_weather_file)
    

    # Pretvorimo časovne žige v stolpcu "last_update" v časovni tip podatka
    data['last_update'] = pd.to_datetime(data['last_update'], unit='ms')
    
    # Zaokrožimo časovne žige na urni interval
    data['datetime'] = data['last_update'].dt.floor('H')

    # Združimo podatke po postajališčih in urah
    aggregated_data = data.groupby(['name', 'datetime']).agg({
        'available_bikes': 'mean',
        'available_bike_stands': 'mean'
    }).reset_index()

    # Seznam vseh postajališč
    stations = aggregated_data['name'].unique()

    for postajalisce in stations:
        # Filtriramo podatke za trenutno postajališče
        filtered_data = aggregated_data[aggregated_data['name'] == postajalisce]
        
        # Ime datoteke za shranjevanje podatkov
        ime_datoteke = os.path.join(output_folder, f"{postajalisce.replace(' ', '_')}.csv")
        
        # Shranimo filtrirane podatke v CSV datoteko
        # z načinom 'w' za pisanje, da se podatki prepišejo
        filtered_data.to_csv(ime_datoteke, mode='w', index=False)

        print(f"Podatki za postajališče {postajalisce} so bili uspešno prepisani v datoteko {ime_datoteke}")

# Uporaba funkcije
input_mbajk_file = '../data/raw/fetch_mbajk.csv'
input_weather_file = '../data/raw/fetch_weather.csv'
output_folder = '../data/processed'
process_and_save_data(input_mbajk_file,input_weather_file, output_folder)


Podatki za postajališče DVORANA TABOR so bili uspešno prepisani v datoteko ../data/processed\DVORANA_TABOR.csv
Podatki za postajališče EUROPARK - POBREŠKA C. so bili uspešno prepisani v datoteko ../data/processed\EUROPARK_-_POBREŠKA_C..csv
Podatki za postajališče GORKEGA UL. - OŠ FRANCETA PREŠERNA so bili uspešno prepisani v datoteko ../data/processed\GORKEGA_UL._-_OŠ_FRANCETA_PREŠERNA.csv
Podatki za postajališče GOSPOSVETSKA C. - III. GIMNAZIJA so bili uspešno prepisani v datoteko ../data/processed\GOSPOSVETSKA_C._-_III._GIMNAZIJA.csv
Podatki za postajališče GOSPOSVETSKA C. - TURNERJEVA UL. so bili uspešno prepisani v datoteko ../data/processed\GOSPOSVETSKA_C._-_TURNERJEVA_UL..csv
Podatki za postajališče GOSPOSVETSKA C. - VRBANSKA C. so bili uspešno prepisani v datoteko ../data/processed\GOSPOSVETSKA_C._-_VRBANSKA_C..csv
Podatki za postajališče JHMB – DVOETAŽNI MOST so bili uspešno prepisani v datoteko ../data/processed\JHMB_–_DVOETAŽNI_MOST.csv
Podatki za postajališče KOROŠKA C. - KO