In [1]:
import pandas as pd
import os
from datetime import datetime

In [62]:
def load_and_merge_data(folder_path):
    '''Функція для завантаження та об'єднання даних'''
    # Отримання списку всіх файлів у папці
    files = os.listdir(folder_path)

    # Списки для зберігання файлів продажу та оренди
    sell_files = [file for file in files if 'apartments_pl' in file]
    rent_files = [file for file in files if 'apartments_rent_pl' in file]

    # Завантаження та об'єднання даних про продаж житла
    sell_dataframes = [pd.read_csv(os.path.join(folder_path, file)) for file in sell_files]
    sell_df = pd.concat(sell_dataframes, ignore_index=True)

    # Завантаження та об'єднання даних про оренду житла
    rent_dataframes = [pd.read_csv(os.path.join(folder_path, file)) for file in rent_files]
    rent_df = pd.concat(rent_dataframes, ignore_index=True)

    return sell_df, rent_df

In [63]:
def filter_data_by_city(df, city):
    '''Фільтруємо дані та залишаємо лише для міста, яке вибрано'''
    return df[df['city'].str.lower() == city.lower()]

In [64]:
def save_sell_data_by_city(df, city, output_folder):
    '''Збереження даних про продаж житла для заданого міста'''
    city_folder = os.path.join(output_folder, city)
    os.makedirs(city_folder, exist_ok=True)
    timestamp = datetime.now().strftime('%Y%m%d_%H%M%S')
    file_path = os.path.join(city_folder, f'{city}_sell_raw_{timestamp}.csv')
    df.to_csv(file_path, index=False)

In [65]:
def save_rent_data_by_city(df, city, output_folder):
    '''Збереження даних про оренду житла для заданого міста'''
    city_folder = os.path.join(output_folder, city)
    os.makedirs(city_folder, exist_ok=True)
    timestamp = datetime.now().strftime('%Y%m%d_%H%M%S')
    file_path = os.path.join(city_folder, f'{city}_rent_raw_{timestamp}.csv')
    df.to_csv(file_path, index=False)

In [66]:
def main():
  folder_path = r'C:\Users\KrisMur\Desktop\PetProjekt1\Apartment_Prices_in_KR-PL-\raw_data'
  city = 'Krakow'
  output_folder = r'C:\Users\KrisMur\Desktop\PetProjekt1\Apartment_Prices_in_KR-PL-\raw_city_data'

  sell_df, rent_df = load_and_merge_data(folder_path)

  # Фільтрація даних для вказаного міста
  city_sell_df = filter_data_by_city(sell_df, city)
  city_rent_df = filter_data_by_city(rent_df, city)

  # Збереження даних для вказаного міста у окремі файли
  save_sell_data_by_city(city_sell_df, city, output_folder)
  save_rent_data_by_city(city_rent_df, city, output_folder)



In [67]:
if __name__ == "__main__":
  main()