In [59]:
from sqlalchemy import create_engine, text
import pandas as pd
import numpy as np

In [60]:
# PostgreSQL bağlantısını oluşturur.
DATABASE_URL = "postgresql://postgres:Silasila.17@localhost:5432/GYK2Northwind"
engine = create_engine(DATABASE_URL)

In [61]:
# Verilen SQL sorgusunu çalıştırır ve sonucu bir DataFrame olarak döndürür.
def fetch_data(query):
    print(f"Sorgu çalıştırılıyor: {query}")
    with engine.connect() as connection:
        df = pd.read_sql(text(query), connection)
    df.replace("[null]", np.nan, inplace=True) # '[null]' değerlerini NaN ile değiştirir.
    
    print(f"İlk veri yüklendi:\n{df.head()}\n{'-' * 20}\n")
    return df

# DataFrame'deki eksik değerleri kontrol eder ve ekrana yazdırır.
def check_missing_values(df, table_name):
    print(f"{table_name} tablosundaki eksik veriler kontrol ediliyor...")
    missing = df.isnull().sum()
    print(f"Eksik veriler:\n{missing}\n{'-' * 20}\n")

# DataFrame içindeki sayısal ve metin sütunlarını ayırır ve ekrana yazdırır.
def categorize_columns(df, table_name):
    numeric_cols = df.select_dtypes(include=[np.number]).columns.tolist()
    text_cols = df.select_dtypes(include=['object']).columns.tolist()

    if 'picture' in text_cols:  # 'picture' sütununu metin sütunlarından çıkarır.
        text_cols.remove('picture')
    
    print(f"{table_name} tablosunda Sayısal Sütunlar: {numeric_cols}")
    print(f"{table_name} tablosunda Metin Sütunlar: {text_cols}\n{'-' * 20}\n")
    return numeric_cols, text_cols

# Eksik verileri doldurur: Sayısal sütunları medyan ile, metin sütunlarını mod ile tamamlar.
def fill_missing_values(df, numeric_cols, text_cols, table_name):
    print(f"{table_name} tablosundaki eksik veriler dolduruluyor...")
    if numeric_cols:
        df[numeric_cols] = df[numeric_cols].fillna(df[numeric_cols].median())
    if text_cols:
        df[text_cols] = df[text_cols].fillna(df[text_cols].mode().iloc[0])
    print(f"Eksik veriler dolduruldu.\n{'-' * 20}\n")
    return df

# İşlenen verileri veritabanına günceller. Öncelikle foreign key kontrollerini devre dışı bırakır, ardından verileri günceller.
def update_database(engine, data):
    """Veritabanı tablolarını güvenli bir şekilde günceller."""
    update_order = ['categories', 'products', 'customers', 'orders', 'order_details']  
    try:
        with engine.begin() as connection:
            # Foreign key kontrollerini geçici olarak devre dışı bırakır.
            connection.execute(text("SET session_replication_role = 'replica'"))
            for table in update_order:
                df = data[table]
                
                # Tabloyu temizler (ancak ID sequence korur).
                connection.execute(text(f"TRUNCATE TABLE {table} CONTINUE IDENTITY CASCADE"))
                
                # Verileri yeniden yükler.
                df.to_sql(table,con=connection,if_exists='append', index=False,chunksize=1000)
                print(f"{table} tablosu başarıyla güncellendi.")
            
            # Foreign key kontrollerini tekrar aktif eder.
            connection.execute(text("SET session_replication_role = 'origin'"))
        
    except Exception as e:
        print(f"Veritabanı güncellemesi başarısız: {e}")
        return False
    return True

In [62]:
# Tüm işlemleri yöneten ana fonksiyon. Verileri çeker, eksik değerleri doldurur ve veritabanını günceller.
def main():
    try:
        tables = ["categories", "products", "customers", "orders", "order_details"]
        processed_data = {}
        
        for table in tables:
            print(f"==> {table} Tablosu İşleniyor <==")
            df = fetch_data(f"SELECT * FROM {table}")
            
            check_missing_values(df, table)
            numeric_cols, text_cols = categorize_columns(df, table)
            df = fill_missing_values(df, numeric_cols, text_cols, table)
            
            check_missing_values(df, table)
            processed_data[table] = df
            print(f"{table} tablosu tamamlandı.\n{'=' * 40}\n")
        
        # Veritabanını günceller.
        if update_database(engine, processed_data):
            print("Tüm veritabanı güncellemesi başarıyla tamamlandı!")
        else:
            print("Veritabanı güncellemesinde hata oluştu!")
        
    except Exception as e:
        print(f"Bağlantı hatası: {e}")

In [63]:
# Programın başlangıç noktası
if __name__ == "__main__":
    main()


==> categories Tablosu İşleniyor <==
Sorgu çalıştırılıyor: SELECT * FROM categories
İlk veri yüklendi:
   category_id   category_name  \
0            1       Beverages   
1            2      Condiments   
2            3     Confections   
3            4  Dairy Products   
4            5  Grains/Cereals   

                                         description picture  
0        Soft drinks, coffees, teas, beers, and ales      []  
1  Sweet and savory sauces, relishes, spreads, an...      []  
2                Desserts, candies, and sweet breads      []  
3                                            Cheeses      []  
4                Breads, crackers, pasta, and cereal      []  
--------------------

categories tablosundaki eksik veriler kontrol ediliyor...
Eksik veriler:
category_id      0
category_name    0
description      0
picture          0
dtype: int64
--------------------

categories tablosunda Sayısal Sütunlar: ['category_id']
categories tablosunda Metin Sütunlar: ['category_nam