In [24]:
import os
import pandas as pd
from sklearn.model_selection import train_test_split
from sklearn.tree import DecisionTreeClassifier
from sklearn.ensemble import RandomForestClassifier
from sklearn.neighbors import KNeighborsClassifier
from sklearn.svm import SVC
from sklearn.metrics import accuracy_score
from sklearn.preprocessing import StandardScaler

# Veri klasörlerini belirt
okra_klasoru = r"C:\Users\AliBakiTURKOZ\OneDrive\Masaüstü\Okralı_Dut"
normal_klasoru = r"C:\Users\AliBakiTURKOZ\OneDrive\Masaüstü\Saglikli_Dut"

# Verileri depolamak için boş bir DataFrame oluştur
tum_veriler = pd.DataFrame()

# .csv dosyalarını oku ve NaN değerleri ortalama ile doldur
for klasor, label in [(okra_klasoru, 'Okra'), (normal_klasoru, 'Normal')]:
    dosyalar = os.listdir(klasor)
    
    for dosya in dosyalar:
        dosya_yolu = os.path.join(klasor, dosya)
        veri = pd.read_csv(dosya_yolu)
        veri = veri.fillna(veri.mean())  # NaN değerleri ortalama ile doldur
        veri['Label'] = label  # Etiket sütunu ekle
        tum_veriler = pd.concat([tum_veriler, veri], ignore_index=True)

# Verileri sınıflandırma için hazırla
X = tum_veriler[['Wavelength (nm)','Absorbance (AU)']]
y = tum_veriler['Label']

# Veri normalizasyonu
scaler = StandardScaler()
X_scaled = scaler.fit_transform(X)

# Verileri eğitim ve test setlerine ayır
X_train, X_test, y_train, y_test = train_test_split(X_scaled, y, test_size=0.2, random_state=42)

# Modelleri oluştur, eğit ve doğruluk oranlarını ekrana bastır
models = {
    'Decision Tree': DecisionTreeClassifier(),
    'Random Forest': RandomForestClassifier(),
    'K-Nearest Neighbors': KNeighborsClassifier(),
    'Support Vector Machine': SVC(kernel='linear', C=1)
}

for model_name, model in models.items():
    model.fit(X_train, y_train)
    y_pred = model.predict(X_test)
    dogruluk_orani = accuracy_score(y_test, y_pred)
    print(f"{model_name} Doğruluk Oranı: {dogruluk_orani:.4f}")


Decision Tree Doğruluk Oranı: 0.6475
Random Forest Doğruluk Oranı: 0.6212
K-Nearest Neighbors Doğruluk Oranı: 0.6546
Support Vector Machine Doğruluk Oranı: 0.5559
