In [1]:
from src.data.collectors import get_hourly_weather_data

# Şehirler ve koordinatları
cities = {
    "Istanbul": (41.0082, 28.9784),
    "Izmir": (38.4192, 27.1287),
    "Samsun": (41.2867, 36.33),
    "Antalya": (36.8969, 30.7133),
    "Sivas": (39.7500, 37.0161),
    "Diyarbakır": (37.9254, 40.2114),
    "Erzurum": (39.9042, 41.2670)
}

# Tarih aralığı
start_date = "2019-01-01"
end_date = "2023-08-28"

# Saatlik verileri çek
hourly_weather_data = get_hourly_weather_data(cities, start_date, end_date)

# İlk birkaç satırı kontrol et
print(hourly_weather_data.head())

# Verileri CSV olarak kaydet
hourly_weather_data.to_csv('hourly_weather_data.csv', index=False)


In [1]:
import pandas as pd

# CSV dosyalarını yükleyin
hourly_weather_data = pd.read_csv('hourly_weather_data.csv')
smfdb_data = pd.read_csv('smfdb.csv')

# Tarih sütunlarını datetime formatına dönüştürün
hourly_weather_data['datetime'] = pd.to_datetime(hourly_weather_data['datetime'])  # Format belirtmeye gerek yok
smfdb_data['Tarih'] = pd.to_datetime(smfdb_data['Tarih'], format='%d/%m/%Y %H:%M')  # Bu format uygun görünüyor

# Tarihe göre birleştirme
merged_data = pd.merge(hourly_weather_data, smfdb_data, left_on='datetime', right_on='Tarih', how='inner')

# Birleştirilen veri setini kaydedin
merged_data.to_csv('merged_dataset.csv', index=False)

# İlk birkaç satırı kontrol edin
print(merged_data.head())


In [1]:
import pandas as pd

# Birleştirilmiş veri setini yükleyin
merged_data = pd.read_csv('merged_dataset.csv')

# datetime ve Tarih sütunlarının eşit olup olmadığını kontrol edin
if merged_data['datetime'].equals(merged_data['Tarih']):
    # Eğer eşitse 'Tarih' sütununu kaldır
    merged_data.drop(columns=['Tarih'], inplace=True)
else:
    print("datetime ve Tarih sütunları farklı değerler içeriyor!")

# Yeni veri setini kaydet
merged_data.to_csv('merged_dataset_cleaned.csv', index=False)

# İlk birkaç satırı kontrol et
print(merged_data.head())


In [1]:
import pandas as pd

# Birleştirilmiş veri setini yükleyin
merged_data = pd.read_csv('merged_dataset.csv')

# datetime ve Tarih sütunlarının eşit olup olmadığını kontrol et
if merged_data['datetime'].equals(merged_data['Tarih']):
    # 'datetime' sütununu kaldır, çünkü 'Tarih' zaten var
    merged_data.drop(columns=['datetime'], inplace=True)

# 'Tarih' sütununu en başa taşı
columns_order = ['Tarih'] + [col for col in merged_data.columns if col != 'Tarih']

# Sütun sıralamasını SMF veri setindeki sütunlar önce, hava durumu sütunları sonra olacak şekilde düzenle
smf_columns = [col for col in merged_data.columns if col not in ['Tarih'] and 'temp' not in col and 'rhum' not in col and 'wspd' not in col and 'wdir' not in col]
weather_columns = [col for col in merged_data.columns if col not in smf_columns and col != 'Tarih']

columns_order = ['Tarih'] + smf_columns + weather_columns
merged_data = merged_data[columns_order]

# Yeni veri setini kaydet
merged_data.to_csv('merged_dataset_inorder.csv', index=False)

# İlk birkaç satırı kontrol et
print(merged_data.head())
