In [10]:
import os
import pandas as pd
from sklearn.model_selection import train_test_split
from sklearn.svm import SVC
from sklearn.metrics import accuracy_score, confusion_matrix, classification_report
from sklearn.preprocessing import StandardScaler

# Veri klasörlerini belirt
okra_klasoru = r"C:\Users\AliBakiTURKOZ\OneDrive\Masaüstü\Absorbance_o"
normal_klasoru = r"C:\Users\AliBakiTURKOZ\OneDrive\Masaüstü\Absorbance_s"

# Verileri depolamak için boş bir DataFrame oluştur
tum_veriler = pd.DataFrame()

# .csv dosyalarını oku ve NaN değerleri ortalama ile doldur
for klasor, label in [(okra_klasoru, 'Okra'), (normal_klasoru, 'Normal')]:
    dosyalar = os.listdir(klasor)
    
    for dosya in dosyalar:
        dosya_yolu = os.path.join(klasor, dosya)
        veri = pd.read_csv(dosya_yolu)
        veri = veri.fillna(veri.mean())  # NaN değerleri ortalama ile doldur
        veri['Label'] = label  # Etiket sütunu ekle
        tum_veriler = pd.concat([tum_veriler, veri], ignore_index=True)

# Verileri sınıflandırma için hazırla
X = tum_veriler[['Wavelength (nm)','Absorbance (AU)']]
y = tum_veriler['Label']

# Veri normalizasyonu
scaler = StandardScaler()
X_scaled = scaler.fit_transform(X)

# Verileri eğitim ve test setlerine ayır
X_train, X_test, y_train, y_test = train_test_split(X_scaled, y, test_size=0.2, random_state=42)

# SVM kullanarak modeli eğit
model = SVC(kernel='linear', C=1)  # Lineer kernel ve C parametresi ayarlanabilir
model.fit(X_train, y_train)

# Test seti üzerinde tahmin yap
y_pred = model.predict(X_test)

# Doğruluk oranını hesapla
dogruluk_orani = accuracy_score(y_test, y_pred)
print(f"Doğruluk Oranı: {dogruluk_orani:.4f}")

# Doğruluk oranı düşük olan örnekleri göster
dusuk_dogruluk_orani_indeksleri = y_test[y_test != y_pred].index
dusuk_dogruluk_orani_veriler = tum_veriler.iloc[dusuk_dogruluk_orani_indeksleri]

# Tüm verileri ekrana bastır
with pd.option_context('display.max_rows', None, 'display.max_columns', None):
    print(tum_veriler)

# Doğruluk oranı düşük olan örnekleri ekrana bastır
print("\nDoğruluk Oranı Düşük Olan Örnekler:")
with pd.option_context('display.max_rows', None, 'display.max_columns', None):
    print(dusuk_dogruluk_orani_veriler)


Doğruluk Oranı: 0.5521
      Wavelength (nm)  Absorbance (AU)   Label
0          901.663021         0.640730    Okra
1          905.592173         0.638534    Okra
2          909.516909         0.634400    Okra
3          913.437229         0.631070    Okra
4          917.353134         0.625836    Okra
5          921.264622         0.624404    Okra
6          925.171696         0.620632    Okra
7          929.074353         0.615322    Okra
8          932.972595         0.612864    Okra
9          938.163382         0.604618    Okra
10         942.051321         0.601889    Okra
11         945.934844         0.598648    Okra
12         949.813951         0.596310    Okra
13         953.688643         0.593320    Okra
14         957.558919         0.593602    Okra
15         961.424779         0.593845    Okra
16         965.286223         0.592976    Okra
17         969.143252         0.595063    Okra
18         972.995866         0.597304    Okra
19         978.125814         0.59906