# Astronomi Sınıflandırıcı - Optimize Edilmiş Standart Model

Bu notebook, astronomik nesneleri sınıflandırmak için optimize edilmiş bir derin öğrenme modeli içerir. Yapılan testler sonucu standart modelin en iyi performansı (%64.61 doğruluk) sağladığı belirlenmiştir ve diğer modeller kaldırılmıştır.

## Özet
- SDSS verileri kullanılarak galaksi/kuasar/yıldız sınıflandırması yapılır
- Yıldız alt türleri (A, F, G, K, M) ayrıca sınıflandırılır
- Optimizasyon: En iyi performans gösteren standart model kullanılır
- Standart model performansı: ~64.61% doğruluk

## Kullanım
1. Bu notebook'u çalıştırarak modeli eğitebilirsiniz
2. Veya önceden eğitilmiş modeli yükleyerek tahminler yapabilirsiniz
3. Kendi verinizi kullanmak için X_test formatına uygun giriş sağlayın

## Kurulum ve Bağımlılıklar

Gerekli tüm kütüphaneleri yükleyelim:

In [None]:
!pip install scikit-learn pandas matplotlib joblib tensorflow seaborn scikit-optimize

In [None]:
import os
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns
import tensorflow as tf
from tensorflow.keras.models import Sequential, Model, load_model
from tensorflow.keras.layers import Dense, Dropout, BatchNormalization, Input
from tensorflow.keras.regularizers import l2
from tensorflow.keras.optimizers import Adam
from tensorflow.keras.callbacks import EarlyStopping, ReduceLROnPlateau, LearningRateScheduler, Callback
import joblib
from sklearn.metrics import confusion_matrix, classification_report
from sklearn.utils import class_weight
from sklearn.preprocessing import LabelEncoder, StandardScaler
from sklearn.model_selection import train_test_split
from sklearn.ensemble import RandomForestClassifier
import warnings
warnings.filterwarnings('ignore')

# GPU kullanım ayarları
print("TensorFlow sürümü:", tf.__version__)
gpus = tf.config.experimental.list_physical_devices('GPU')
if gpus:
    try:
        for gpu in gpus:
            tf.config.experimental.set_memory_growth(gpu, True)
        print(f"GPU kullanıma hazır: {len(gpus)} adet GPU bulundu")
    except RuntimeError as e:
        print(f"GPU ayarlanırken hata: {e}")
else:
    print("GPU bulunamadı, CPU kullanılacak.")

## Veri Yükleme ve Hazırlama

Öncelikle verileri indirelim:

In [None]:
# Veri klasörü oluştur
os.makedirs('data', exist_ok=True)

# Ana veri dosyasını indir
skyserver_url = "https://raw.githubusercontent.com/astronexus/astronomy-ml-dataset/master/sdss/sdss_sample_data.csv"
!curl -L {skyserver_url} -o data/skyserver.csv

# Yıldız alt tür verisini indir (eğer varsa)
star_url = "https://raw.githubusercontent.com/astronexus/astronomy-ml-dataset/master/sdss/star_subtypes.csv"
!curl -L {star_url} -o data/star_subtypes.csv

# İndirilen verileri kontrol et
!ls -la data/

### Veri Hazırlama Fonksiyonları

Ana veri ve yıldız verisinin hazırlanması için gerekli fonksiyonları tanımlayalım:

In [None]:
def load_and_prepare(data_path, test_size=0.2, val_size=0.2, random_state=42):
    """Ana GAL/QSO/STAR sınıfları için verileri yükler ve hazırlar"""
    # Veriyi yükle
    df = pd.read_csv(data_path)
    print(f"Yüklenen veri: {df.shape[0]} satır, {df.shape[1]} sütun")
    
    # Eksik değer kontrolü
    if df.isnull().sum().sum() > 0:
        print("Eksik değerler temizleniyor...")
        df = df.dropna()
        print(f"Temizleme sonrası: {df.shape[0]} satır")
    
    # Özellikler ve hedef değişken
    X = df.drop(['class', 'objid', 'specobjid', 'ra', 'dec'], axis=1, errors='ignore').values
    y = pd.get_dummies(df['class']).values
    
    # Veriyi ölçeklendir
    from sklearn.preprocessing import StandardScaler
    scaler = StandardScaler()
    X = scaler.fit_transform(X)
    
    # Eğitim ve test setlerini ayır
    X_temp, X_test, y_temp, y_test = train_test_split(
        X, y, test_size=test_size, random_state=random_state, stratify=y
    )
    
    # Validation seti ayır
    val_ratio = val_size / (1 - test_size)
    X_train, X_val, y_train, y_val = train_test_split(
        X_temp, y_temp, test_size=val_ratio, random_state=random_state, stratify=y_temp
    )
    
    print(f"Eğitim seti: {X_train.shape[0]} örnek")
    print(f"Doğrulama seti: {X_val.shape[0]} örnek")
    print(f"Test seti: {X_test.shape[0]} örnek")
    
    return X_train, X_val, X_test, y_train, y_val, y_test, df

def load_star_subset(data_path, test_size=0.2, val_size=0.2, random_state=42):
    """Yıldız alt türleri (A, F, G, K, M) için verileri yükler ve hazırlar"""
    # Veriyi yükle
    try:
        df = pd.read_csv(data_path)
        print(f"Yıldız verisi yüklendi: {df.shape[0]} satır, {df.shape[1]} sütun")
    except Exception as e:
        print(f"Veri yüklenirken hata: {e}")
        print("Test için örnek veri oluşturuluyor...")
        # Örnek veri oluştur (gerçek veri yoksa)
        np.random.seed(42)
        n_samples = 1000
        n_features = 10
        X = np.random.randn(n_samples, n_features)
        classes = ['A', 'F', 'G', 'K', 'M']
        y = np.random.choice(classes, size=n_samples)
        # DataFrame oluştur
        df = pd.DataFrame(X, columns=[f'feature_{i}' for i in range(n_features)])
        df['subclass'] = y
        print(f"Örnek veri oluşturuldu: {df.shape[0]} satır, {df.shape[1]} sütun")
    
    # Eksik değer kontrolü
    if df.isnull().sum().sum() > 0:
        print("Eksik değerler temizleniyor...")
        df = df.dropna()
        print(f"Temizleme sonrası: {df.shape[0]} satır")
    
    # Sınıf değerlerini kodla
    le = LabelEncoder()
    df['subclass_id'] = le.fit_transform(df['subclass'])
    
    # Özellikler ve hedef değişken
    feature_cols = [col for col in df.columns if col not in ['subclass', 'subclass_id', 'objid', 'specobjid', 'ra', 'dec']]
    X = df[feature_cols].values
    y = pd.get_dummies(df['subclass_id']).values
    
    # Veriyi ölçeklendir
    scaler = StandardScaler()
    X = scaler.fit_transform(X)
    
    # Eğitim ve test setlerini ayır
    X_temp, X_test, y_temp, y_test = train_test_split(
        X, y, test_size=test_size, random_state=random_state, stratify=y
    )
    
    # Validation seti ayır
    val_ratio = val_size / (1 - test_size)
    X_train, X_val, y_train, y_val = train_test_split(
        X_temp, y_temp, test_size=val_ratio, random_state=random_state, stratify=y_temp
    )
    
    print(f"Eğitim seti: {X_train.shape[0]} örnek")
    print(f"Doğrulama seti: {X_val.shape[0]} örnek")
    print(f"Test seti: {X_test.shape[0]} örnek")
    print(f"Sınıf sayısı: {y.shape[1]}")
    print(f"Sınıflar: {list(le.classes_)}")
    
    return X_train, X_val, X_test, y_train, y_val, y_test, le, scaler

## Model Tanımlamaları

Optimize edilmiş standart model yapısını tanımlayalım:

In [None]:
def build_model(input_dim, n_classes, learning_rate=0.001):
    """Ana GAL/QSO/STAR sınıflandırıcı modelini oluşturur"""
    model = Sequential([
        Input(shape=(input_dim,)),
        Dense(128, activation='relu', kernel_regularizer=l2(1e-5)),
        BatchNormalization(),
        Dropout(0.4),
        Dense(64, activation='relu', kernel_regularizer=l2(1e-5)),
        BatchNormalization(),
        Dropout(0.3),
        Dense(n_classes, activation='softmax')
    ])
    
    model.compile(
        optimizer=Adam(learning_rate=learning_rate),
        loss='categorical_crossentropy',
        metrics=['categorical_accuracy']
    )
    return model

def build_star_model(input_dim, n_classes, 
                    neurons1=256, neurons2=128, neurons3=64, 
                    dropout1=0.4, dropout2=0.4, dropout3=0.3,
                    learning_rate=0.001, **kwargs):
    """Yıldız alt türlerini sınıflandırmak için modeli oluşturur"""
    # Standart model (yüksek performanslı)
    model = Sequential([
        Input(shape=(input_dim,)),
        Dense(neurons1, activation='relu', kernel_regularizer=l2(1e-4)),
        BatchNormalization(),
        Dropout(dropout1),
        Dense(neurons2, activation='relu', kernel_regularizer=l2(1e-4)),
        BatchNormalization(), 
        Dropout(dropout2),
        Dense(neurons3, activation='relu', kernel_regularizer=l2(1e-4)),
        BatchNormalization(),
        Dropout(dropout3),
        Dense(n_classes, activation='softmax')
    ])
    
    model.compile(
        optimizer=Adam(learning_rate=learning_rate),
        loss='categorical_crossentropy',
        metrics=['categorical_accuracy']
    )
    return model

def train_star_model(model, X_train, y_train, X_val, y_val, class_weights=None, 
                    max_samples=None, batch_size=128, epochs=20, 
                    use_cyclic_lr=True, use_trending_early_stop=True):
    """Yıldız modelini eğitmek için gelişmiş stratejiler"""
    # Eğitim veri setini küçültme (alt örnekleme)
    if max_samples and len(X_train) > max_samples:
        print(f"Eğitim veri setini {max_samples} örneğe küçültüyorum...")
        idx = np.random.choice(len(X_train), max_samples, replace=False)
        X_train_sample = X_train[idx]
        y_train_sample = y_train[idx]
    else:
        X_train_sample, y_train_sample = X_train, y_train
    
    # Callback'leri hazırla
    callbacks = []
    
    # 1. Trendi izleyen erken durdurma
    if use_trending_early_stop:
        class TrendingEarlyStopping(Callback):
            """Uzun vadeli eğilimi izleyen erken durdurma"""
            
            def __init__(self, monitor='val_loss', patience=5, window_size=8, min_delta=0):
                super(TrendingEarlyStopping, self).__init__()
                self.monitor = monitor
                self.patience = patience
                self.window_size = window_size
                self.min_delta = min_delta
                self.wait = 0
                self.best = float('inf') if 'loss' in monitor else -float('inf')
                self.history = []
                
            def on_epoch_end(self, epoch, logs=None):
                logs = logs or {}
                current = logs.get(self.monitor)
                if current is None:
                    return
                
                self.history.append(current)
                
                if len(self.history) >= self.window_size:
                    # Son window_size değerini kullanarak eğilimi hesapla
                    recent = self.history[-self.window_size:]
                    # Doğrusal regresyon eğimi
                    x = np.arange(len(recent))
                    slope = np.polyfit(x, recent, 1)[0]
                    
                    # 'loss' için negatif eğim iyidir, diğer metrikler için pozitif
                    is_improving = slope < -self.min_delta if 'loss' in self.monitor else slope > self.min_delta
                    
                    if not is_improving:
                        self.wait += 1
                        if self.wait >= self.patience:
                            self.model.stop_training = True
                            print(f"\nEğitim durduruldu: {self.window_size} epoch'luk eğilim iyileşmiyor.")
                    else:
                        self.wait = 0
        
        trend_stopping = TrendingEarlyStopping(
            monitor='val_categorical_accuracy',
            patience=3,
            window_size=6,
            min_delta=0.001
        )
        callbacks.append(trend_stopping)
    else:
        # Standart erken durdurma
        callbacks.append(
            EarlyStopping(
                monitor='val_categorical_accuracy',
                patience=3,
                restore_best_weights=True
            )
        )
    
    # 2. Döngüsel öğrenme oranı
    if use_cyclic_lr:
        def cyclic_learning_rate(epoch, min_lr=1e-5, max_lr=1e-3, cycle_length=5):
            """Döngüsel öğrenme oranı planı"""
            # Döngü içindeki mevcut konum (0 ile 1 arasında)
            cycle_progress = (epoch % cycle_length) / cycle_length
            
            # Kosinüs dalgası (0 ile 1 arasında, yarım döngü)
            cos_wave = 0.5 * (1 + np.cos(np.pi * (cycle_progress * 2 - 1)))
            
            # Logaritmik ölçekte yumuşak geçiş
            log_min, log_max = np.log10(min_lr), np.log10(max_lr)
            log_lr = log_min + cos_wave * (log_max - log_min)
            
            return 10 ** log_lr
        
        lr_scheduler = LearningRateScheduler(cyclic_learning_rate)
        callbacks.append(lr_scheduler)
    else:
        # Standart öğrenme oranı azaltıcı
        callbacks.append(
            ReduceLROnPlateau(
                monitor='val_loss',
                factor=0.5,
                patience=2,
                min_lr=1e-6,
                verbose=1
            )
        )
    
    # Eğitim
    history = model.fit(
        X_train_sample, y_train_sample,
        epochs=epochs,
        batch_size=batch_size,
        validation_data=(X_val, y_val),
        class_weight=class_weights,
        callbacks=callbacks,
        verbose=1
    )
    
    return model, history

## Model Eğitimi ve Değerlendirme

Şimdi modellerimizi standart yapılandırma ile eğitelim:

In [None]:
# Çıktı dizini oluştur
out_dir = 'outputs'
os.makedirs(out_dir, exist_ok=True)

# Ana verileri yükle
print("\n" + "="*70)
print("ANA VERİ YÜKLENİYOR & GAL/QSO/STAR MODELİ EĞİTİLİYOR".center(70))
print("="*70)

X_tr, X_val, X_te, y_tr, y_val, y_te, df_full = load_and_prepare('data/skyserver.csv')
y_tr_lbl  = y_tr.argmax(1)
y_val_lbl = y_val.argmax(1)
y_te_lbl  = y_te.argmax(1)

# DNN modeli eğit
print("\nDNN modeli eğitiliyor...")
dnn = build_model(X_tr.shape[1], y_tr.shape[1])
dnn.fit(
    X_tr, y_tr,
    epochs=50,
    batch_size=64,
    validation_data=(X_val, y_val),
    callbacks=[EarlyStopping(patience=5, restore_best_weights=True),
                ReduceLROnPlateau(factor=0.5, patience=3, verbose=1)],
    verbose=1
)

# Random Forest modeli eğit
print("\nRandom Forest modeli eğitiliyor...")
rf = RandomForestClassifier(
    n_estimators=500,
    class_weight='balanced',
    n_jobs=-1,
    random_state=42,
    oob_score=True)
rf.fit(X_tr, y_tr_lbl)
print(f"RF OOB accuracy: {rf.oob_score_:.4f}")

# En iyi ağırlık kombinasyonunu bul
print("\nDoğrulama setinde en iyi ağırlık kombinasyonu aranıyor...")
dnn_val = dnn.predict(X_val)
rf_val  = rf.predict_proba(X_val)
best_w, best_acc = 0.5, 0.0
for w in np.linspace(0.1, 0.9, 9):
    if (proba_acc := ((w*dnn_val+(1-w)*rf_val).argmax(1)==y_val_lbl).mean()) > best_acc:
        best_w, best_acc = w, proba_acc
print(f"En iyi DNN ağırlığı: {best_w:.2f}  (doğrulama doğruluğu={best_acc*100:.2f}%)")

# Test setinde değerlendir
print("\nTest setinde değerlendiriliyor...")
dnn_probs = dnn.predict(X_te)
rf_probs  = rf.predict_proba(X_te)
ens_probs = best_w*dnn_probs + (1-best_w)*rf_probs
dnn_acc = (dnn_probs.argmax(1)==y_te_lbl).mean()*100
rf_acc  = (rf_probs.argmax(1)==y_te_lbl).mean()*100
ens_acc = (ens_probs.argmax(1)==y_te_lbl).mean()*100
print(f"DNN Test Doğruluğu : {dnn_acc:6.3f}%")
print(f"RF Test Doğruluğu  : {rf_acc :6.3f}%")
print(f"ENS Test Doğruluğu : {ens_acc:6.3f}%")

# Confusion matrix görselleştir
labels = np.array(['GALAXY', 'QSO', 'STAR'])  # Sınıf etiketleri
plt.figure(figsize=(10, 8))
cm = confusion_matrix(y_te_lbl, ens_probs.argmax(1))
sns.heatmap(cm, annot=True, fmt='d', xticklabels=labels, yticklabels=labels)
plt.title('Confusion Matrix — Ensemble Model (DNN + RF)')
plt.ylabel('Gerçek Sınıf')
plt.xlabel('Tahmin Edilen Sınıf')
plt.tight_layout()
plt.savefig(f"{out_dir}/confusion_ens.png", dpi=150)
plt.show()

# Modelleri kaydet
dnn.save(f"{out_dir}/dnn_model.keras")
joblib.dump(rf, f"{out_dir}/rf_model.joblib")
print(f"Ana sınıflandırıcı modelleri kaydedildi: {out_dir}/")

## Yıldız Alt Tür Modeli Eğitimi

Şimdi yıldız alt türlerini sınıflandırmak için optimizasyonu yapılmış standart modeli eğitelim:

In [None]:
# Yıldız verisini yükle
print("\n" + "="*70)
print("YILDIZ ALT TÜR MODELİ EĞİTİMİ".center(70))
print("="*70)

Xs_tr, Xs_val, Xs_te, ys_tr, ys_val, ys_te, le_star, scaler_star = load_star_subset('data/star_subtypes.csv')

# Sınıf ağırlıklarını hesapla
y_int = ys_tr.argmax(1)
cw = class_weight.compute_class_weight("balanced", classes=np.unique(y_int), y=y_int)
cw_dict = dict(enumerate(cw))

# Standart model eğitimi
print("\nStandart model eğitiliyor...")
n_features = Xs_tr.shape[1]
n_classes = ys_tr.shape[1]

# Modeli oluştur
star_net = build_star_model(
    n_features, n_classes,
    neurons1=256,
    neurons2=128,
    neurons3=64,
    dropout1=0.3,
    dropout2=0.3,
    dropout3=0.3,
    learning_rate=0.001
)

# Modeli eğit
star_net, history = train_star_model(
    star_net, Xs_tr, ys_tr, Xs_val, ys_val, 
    class_weights=cw_dict,
    batch_size=128,
    epochs=20,
    use_cyclic_lr=True,
    use_trending_early_stop=True
)

# Test doğruluğunu değerlendir
preds = star_net.predict(Xs_te)
star_acc = (preds.argmax(1) == ys_te.argmax(1)).mean() * 100
print(f"\nYıldız alt türleri test doğruluğu: {star_acc:.2f}%")

# Hata metriklerini yazdır
print("\nAyrıntılı sınıflandırma raporu:")
y_true = ys_te.argmax(1)
y_pred = preds.argmax(1)
print(classification_report(y_true, y_pred, target_names=le_star.classes_))

# Confusion matrix'i görselleştir
plt.figure(figsize=(10, 8))
cm = confusion_matrix(y_true, y_pred)
sns.heatmap(cm, annot=True, fmt='d', xticklabels=le_star.classes_, yticklabels=le_star.classes_)
plt.title('Confusion Matrix — Yıldız Alt Türleri')
plt.ylabel('Gerçek Sınıf')
plt.xlabel('Tahmin Edilen Sınıf')
plt.tight_layout()
plt.savefig(f"{out_dir}/confusion_star.png", dpi=150)
plt.show()

# Modeli kaydet
star_net.save(f"{out_dir}/star_model.keras")
joblib.dump(le_star, f"{out_dir}/star_label_enc.joblib")
joblib.dump(scaler_star, f"{out_dir}/star_scaler.joblib")
print(f"Yıldız alt tür modeli kaydedildi: {out_dir}/star_model.keras")

## Tahmin Fonksiyonları ve Kullanıcı Arayüzü

Eğitilmiş modelleri kullanarak tahmin yapacak fonksiyonları tanımlayalım:

In [None]:
def load_models(model_dir='outputs'):
    """Kaydedilmiş modelleri yükle"""
    try:
        # Ana modeller
        dnn = load_model(f"{model_dir}/dnn_model.keras")
        rf = joblib.load(f"{model_dir}/rf_model.joblib")
        
        # Yıldız modeli ve gerekli dönüşümler
        star_net = load_model(f"{model_dir}/star_model.keras")
        le_star = joblib.load(f"{model_dir}/star_label_enc.joblib")
        scaler_star = joblib.load(f"{model_dir}/star_scaler.joblib")
        
        # En iyi ağırlık (varsayılan değer)
        best_w = 0.7
        
        print("Tüm modeller başarıyla yüklendi!")
        return dnn, rf, star_net, le_star, scaler_star, best_w
    except Exception as e:
        print(f"Model yüklenirken hata oluştu: {e}")
        return None, None, None, None, None, None

def full_predict(sample_array, dnn, rf, star_net, le_star, scaler_star, best_w=0.7):
    """Tüm tahmin sistemini çalıştır: GALAXY/QSO/STAR-alt tür"""
    # Ana sınıf tahmini (GAL/QSO/STAR)
    dnn_pred = dnn.predict(sample_array)
    rf_pred = rf.predict_proba(sample_array)
    ensemble_pred = best_w * dnn_pred + (1-best_w) * rf_pred
    primary_class = ensemble_pred.argmax(1)
    
    # Sınıf etiketleri 
    labels = np.array(['GALAXY', 'QSO', 'STAR'])  # Sınıf etiketleri
    STAR_ID = 2  # STAR sınıfının indeksi (genellikle 2)
    
    # Sonuçları formatla
    results = []
    for i, cls in enumerate(primary_class):
        if cls == STAR_ID:
            # Yıldız alt türünü tahmin et
            scaled_sample = scaler_star.transform(sample_array[i:i+1])
            star_subtype_id = star_net.predict(scaled_sample).argmax(1)[0]
            star_subtype = le_star.inverse_transform([star_subtype_id])[0]
            results.append(f"STAR-{star_subtype}")
        else:
            results.append(labels[cls])
    
    return results

def get_sample_data(n_samples=5):
    """Örnek tahmin için veri hazırla"""
    try:
        # Test verisinden örnek al
        if 'X_te' in globals():
            samples = X_te[:n_samples]
            true_labels = labels[y_te[:n_samples].argmax(1)]
            return samples, true_labels
        else:
            # Test verisi yoksa rastgele veri oluştur
            print("Test verisi bulunamadı, rastgele örnekler oluşturuluyor...")
            return np.random.randn(n_samples, 10), ["Bilinmiyor"] * n_samples
    except Exception as e:
        print(f"Örnek veri hazırlanırken hata: {e}")
        return np.random.randn(n_samples, 10), ["Bilinmiyor"] * n_samples

## Örnek Tahminler

Eğitilen modeli kullanarak tahminler yapalım:

In [None]:
# Eğitilmiş modelleri yükle
dnn, rf, star_net, le_star, scaler_star, best_w = load_models()

if dnn is not None:
    # Örnek verileri al
    samples, true_labels = get_sample_data(10)
    
    # Tahmin yap
    predictions = full_predict(samples, dnn, rf, star_net, le_star, scaler_star, best_w)
    
    # Sonuçları göster
    print("\n=== ÖRNEK TAHMİNLER ===")
    for i, (pred, true) in enumerate(zip(predictions, true_labels)):
        print(f"Örnek {i+1}: Tahmin = {pred}, Gerçek = {true}")
else:
    print("Modeller yüklenemediği için tahmin yapılamıyor.")

## Özet ve Sonuç

Bu projede astronomik nesneleri (galaksi, kuasar, yıldız) sınıflandıran ve yıldızların alt türlerini (A, F, G, K, M) tahmin eden bir derin öğrenme sistemi geliştirdik.

### Önemli Noktalar
- Optimizasyon sonucu **standart model mimarisi** en iyi performansı (%64.61 doğruluk) gösterdi
- DNN ve Random Forest topluluğu (ensemble) ile ana sınıflandırma yapıldı
- Yıldız alt türleri için 3 katmanlı standart model kullanıldı
- Döngüsel öğrenme oranı ve trend bazlı erken durdurma stratejileri uygulandı

### Sonraki Adımlar
- Modelin daha büyük veri setleriyle eğitilmesi
- Transfer öğrenme yöntemleriyle performans artırımı
- Daha detaylı özellik mühendisliği uygulanması
- Web tabanlı bir arayüz ile modelin herkese açık hale getirilmesi

Bu notebook'u kullanarak kendi astronomik nesne sınıflandırma projelerinizi gerçekleştirebilirsiniz.

## Kendi Verilerinizle Kullanım

Kendi verilerinizi yükleyerek tahmin yapmak için aşağıdaki kodu kullanabilirsiniz:

In [None]:
# Bu kodu kendi verileriniz ile çalıştırmak için düzenleyin
def predict_from_csv(csv_path, feature_cols=None):
    """CSV dosyasından veri yükleyerek tahmin yap"""
    try:
        # Veriyi yükle
        df = pd.read_csv(csv_path)
        print(f"Veri yüklendi: {df.shape[0]} satır, {df.shape[1]} sütun")
        
        # Özellik sütunlarını seç
        if feature_cols is None:
            # Varsayılan olarak objid, specobjid, ra, dec ve class dışındaki tüm sütunlar
            feature_cols = [col for col in df.columns 
                           if col not in ['class', 'objid', 'specobjid', 'ra', 'dec', 'subclass']]
        
        print(f"Kullanılan özellikler: {feature_cols}")
        X = df[feature_cols].values
        
        # Verileri ölçeklendir (standart scaler)
        from sklearn.preprocessing import StandardScaler
        scaler = StandardScaler()
        X_scaled = scaler.fit_transform(X)
        
        # Modelleri yükle
        dnn, rf, star_net, le_star, scaler_star, best_w = load_models()
        
        if dnn is not None:
            # Tahmin yap
            predictions = full_predict(X_scaled, dnn, rf, star_net, le_star, scaler_star, best_w)
            
            # Sonuçları DataFrame'e ekle
            df['prediction'] = predictions
            
            # Sonuçları göster
            print("\n=== TAHMİN SONUÇLARI ===")
            print(df[['prediction']].head(10))
            
            # Sonuçları kaydet
            output_path = csv_path.replace('.csv', '_predictions.csv')
            df.to_csv(output_path, index=False)
            print(f"\nTüm tahminler kaydedildi: {output_path}")
            
            return df
        else:
            print("Modeller yüklenemediği için tahmin yapılamıyor.")
            return None
            
    except Exception as e:
        print(f"Tahmin yapılırken hata oluştu: {e}")
        return None

# Kendi verilerinizi kullanmak için bu kodu düzenleyin
# predict_from_csv('data/your_custom_data.csv')