In [12]:
import pandas as pd
import glob
import numpy as np
import os

**Ημερομηνία εκκίνησης και Path αρχείων**

In [16]:
# Path αρχείων
data_directory = r"C:\Users\KDrakonakis\Downloads\2024\2024\12"

 # Η ημερομηνία εκκίνησης
target_day = "2024-12-31"

***Diesel 3 Days Mean***

In [14]:
def calculate_diesel_mean_by_station_threed(data_dir, target_date):

    # Μετατροπή της ημερομηνίας που έδωσα σε datetime για να είναι διαχειρίσιμη.
    target_date = pd.to_datetime(target_date)
    
    # Φτιάχνω τη λίστα με τον αριθμό των ημερών που θέλω να επεξεργαστώ. Δηλαδή των τελευταίψν τριών ημερών.
    date_range = [(target_date - pd.Timedelta(days=i)).strftime('%Y-%m-%d') for i in range(3)]

    # Βρίσκω τα αρχεία που αναφέρονται στο range ημερών που επιθυμώ και ελέγχω για το αν βρέθηκαν τα αρχεία ή όχι.
    files_to_read = [f for f in glob.glob(os.path.join(data_dir, '*.csv')) if any(date in f for date in date_range)]

    if not files_to_read:
        raise ValueError("Δεν βρέθηκαν αρχεία για τις τελευταίες 3 ημέρες")

   # Διαβάζω και ενσωματώνω τα δεδομένα σε ένα dataframe. 
    df_list = [pd.read_csv(file) for file in files_to_read]
    three_days_df = pd.concat(df_list, ignore_index=True)

   # Μετατροπή της ημερομηνίας σε datetime για να μπορώ να διαχειριστώ τις ημερομηνίες.
    three_days_df['date'] = pd.to_datetime(three_days_df['date'], format='%Y-%m-%d %H:%M:%S%z')

    # Κρατάω μόνο τις στήλες που χρειάζομαι.
    three_days_df = three_days_df[['station_uuid', 'diesel', 'dieselchange']]
    
    # Εκκαθαρίζω το dataframe σε περίπτωση μη μεταβολής της τιμής.
    three_days_df = three_days_df[three_days_df['dieselchange'] == 1]

    # Θέτω τη στήλη με τις τιμές ώς float
    three_days_df['diesel'] = three_days_df['diesel'].astype(float)

    # Υπολογισμός του μέσου όρου της τιμής diesel για κάθε πρατήριο
    mean_by_station_threed = three_days_df.groupby('station_uuid')['diesel'].mean()

    return mean_by_station_threed

In [18]:
mean_diesel_by_station_threed = calculate_diesel_mean_by_station_threed(data_directory, target_day)
print(mean_diesel_by_station_threed)


station_uuid
00006210-0037-4444-8888-acdc00006210    1.599652
00016899-3247-4444-8888-acdc00000007    1.635923
00041414-208c-4444-8888-acdc00000414    1.569000
00041450-0002-4444-8888-acdc00000002    1.558000
00047369-0001-4444-8888-acdc00000001    1.604667
                                          ...   
ffe9e5f3-1451-4af4-ab59-fdfbf4b9b757    1.608524
fff05f62-7e1e-42e4-8d71-6e2c9c963a8b    2.165667
fff261ef-ff00-4d2b-8669-ec2f7c57cd93    1.605400
fffb0617-e77d-48dd-838c-f43a945f6f70    1.648225
fffd3828-c4e3-1035-8eef-40618651be9a    1.555923
Name: diesel, Length: 14443, dtype: float64


***Diesel 5 Days Mean***

In [31]:
def calculate_diesel_mean_by_station_fived(data_dir, target_date):

    target_date = pd.to_datetime(target_date)
    
    # Πρέπει να αλλάξω το range σε σχέση με τον παραπάνω κώδικα, έτσι ώστε να υπολογίσει για 5 μέρες.
    date_range = [(target_date - pd.Timedelta(days=i)).strftime('%Y-%m-%d') for i in range(5)]

    files_to_read = [f for f in glob.glob(os.path.join(data_dir, '*.csv')) if any(date in f for date in date_range)]
    if not files_to_read:
        raise ValueError("Δεν βρέθηκαν αρχεία για τις τελευταίες 3 ημέρες")
 
    df_list = [pd.read_csv(file) for file in files_to_read]
    five_days_df = pd.concat(df_list, ignore_index=True)

    five_days_df['date'] = pd.to_datetime(five_days_df['date'], format='%Y-%m-%d %H:%M:%S%z')

    five_days_df = five_days_df[['station_uuid', 'diesel', 'dieselchange']]
    
    five_days_df = five_days_df[five_days_df['dieselchange'] == 1]

    five_days_df['diesel'] = five_days_df['diesel'].astype(float)

    mean_by_station_fived = five_days_df.groupby('station_uuid')['diesel'].mean()

    return mean_by_station_fived

In [33]:
mean_diesel_by_station_fived = calculate_diesel_mean_by_station_fived(data_directory, target_day)
print(mean_diesel_by_station_fived)


station_uuid
00006210-0037-4444-8888-acdc00006210    1.600042
00016899-3247-4444-8888-acdc00000007    1.630739
00041414-208c-4444-8888-acdc00000414    1.549000
00041450-0002-4444-8888-acdc00000002    1.543000
00047369-0001-4444-8888-acdc00000001    1.612286
                                          ...   
ffe9e5f3-1451-4af4-ab59-fdfbf4b9b757    1.607125
fff05f62-7e1e-42e4-8d71-6e2c9c963a8b    2.165667
fff261ef-ff00-4d2b-8669-ec2f7c57cd93    1.605905
fffb0617-e77d-48dd-838c-f43a945f6f70    1.642410
fffd3828-c4e3-1035-8eef-40618651be9a    1.553545
Name: diesel, Length: 14600, dtype: float64


***Diesel 7 Days Mean***

In [42]:
def calculate_diesel_mean_by_station_sevend(data_dir, target_date):

    target_date = pd.to_datetime(target_date)
    
    # Πρέπει να αλλάξω το range σε σχέση με τον παραπάνω κώδικα, έτσι ώστε να υπολογίσει για 7 μέρες.
    date_range = [(target_date - pd.Timedelta(days=i)).strftime('%Y-%m-%d') for i in range(7)]

    files_to_read = [f for f in glob.glob(os.path.join(data_dir, '*.csv')) if any(date in f for date in date_range)]
    if not files_to_read:
        raise ValueError("Δεν βρέθηκαν αρχεία για τις τελευταίες 3 ημέρες")
 
    df_list = [pd.read_csv(file) for file in files_to_read]
    seven_days_df = pd.concat(df_list, ignore_index=True)

    seven_days_df['date'] = pd.to_datetime(seven_days_df['date'], format='%Y-%m-%d %H:%M:%S%z')

    seven_days_df = seven_days_df[['station_uuid', 'diesel', 'dieselchange']]
    
    seven_days_df = seven_days_df[seven_days_df['dieselchange'] == 1]

    seven_days_df['diesel'] = seven_days_df['diesel'].astype(float)

    mean_by_station_sevend = seven_days_df.groupby('station_uuid')['diesel'].mean()

    return mean_by_station_sevend

In [44]:
mean_diesel_by_station_sevend = calculate_diesel_mean_by_station_sevend(data_directory, target_day)
print(mean_diesel_by_station_sevend)

station_uuid
00006210-0037-4444-8888-acdc00006210    1.598800
00016899-3247-4444-8888-acdc00000007    1.627438
00041414-208c-4444-8888-acdc00000414    1.549000
00041450-0002-4444-8888-acdc00000002    1.543000
00047369-0001-4444-8888-acdc00000001    1.612286
                                          ...   
ffe9e5f3-1451-4af4-ab59-fdfbf4b9b757    1.606143
fff05f62-7e1e-42e4-8d71-6e2c9c963a8b    2.165667
fff261ef-ff00-4d2b-8669-ec2f7c57cd93    1.604781
fffb0617-e77d-48dd-838c-f43a945f6f70    1.643258
fffd3828-c4e3-1035-8eef-40618651be9a    1.552333
Name: diesel, Length: 14614, dtype: float64
