In [1]:
import pandas as pd

In [1]:
import pandas as pd
import warnings
warnings.filterwarnings("ignore")

def summarize_traffic_data(input_file, output_file, resample_period):
    """
    Функция за обобщение на данни за трафик.

    :param input_file: Път до входния CSV файл с оригинални данни.
    :param output_file: Път до изходния CSV файл със съкратени данни.
    :param resample_period: Период за агрегация (например '30min', '1H', '2H').
    """
    # Зареждане на данните
    df = pd.read_csv(input_file, parse_dates=['date'], dayfirst=True)
    
    # Проверка дали колоната "дата" е налична
    if 'date' not in df.columns:
        raise ValueError("Колоната 'Дата' не е намерена в файла. Уверете се, че имената на колоните са правилни.")
    
    # Задаване на колоната "дата" като индекс
    df.set_index('date', inplace=True)
    
    # Проверка за правилен формат на времето
    if not pd.api.types.is_datetime64_any_dtype(df.index):
        raise ValueError("Колоната 'Дата' трябва да е във формат на дата и час.")
    
    # Групиране на данните по зададения период
    summary = df.resample(resample_period).agg({
        'Скорост': 'mean',  # Средна скорост
        'Рег. номер': 'count'  # Брой автомобили (чрез броя на регистрационните номера)
    }).rename(columns={'Скорост': 'Средна скорост', 'Рег. номер': 'Брой автомобили'})

    # Запис на съкратените данни в нов файл
    summary.to_csv(output_file)
    print(f"Обобщените данни са записани в {output_file}.")


In [2]:
# Входен файл с оригинални данни
input_file = "../data_files/combined.csv"

# Изходен файл със съкратени данни
output_file = "../result_data_files/summarized_traffic_data_1H.csv"

# Период за агрегация (напр. '30min' за половин час, '1H' за час, '2H' за два часа)
resample_period = '1H'

# Изпълнение на функцията
summarize_traffic_data(input_file, output_file, resample_period)


Обобщените данни са записани в ../result_data_files/summarized_traffic_data_1H.csv.
