In [6]:
import os
import pandas as pd
from sklearn.model_selection import train_test_split
from sklearn.svm import SVC
from sklearn.metrics import accuracy_score, confusion_matrix, classification_report
from sklearn.preprocessing import StandardScaler

# Veri klasörlerini belirt
okra_klasoru = r"C:\Users\AliBakiTURKOZ\OneDrive\Masaüstü\Intensity_o"
normal_klasoru = r"C:\Users\AliBakiTURKOZ\OneDrive\Masaüstü\Intensity_s"

# Verileri depolamak için boş bir DataFrame oluştur
tum_veriler = pd.DataFrame()

# .csv dosyalarını oku ve NaN değerleri ortalama ile doldur
for klasor, label in [(okra_klasoru, 'Okra'), (normal_klasoru, 'Normal')]:
    dosyalar = os.listdir(klasor)
    
    for dosya in dosyalar:
        dosya_yolu = os.path.join(klasor, dosya)
        veri = pd.read_csv(dosya_yolu)
        veri = veri.fillna(veri.mean())  # NaN değerleri ortalama ile doldur
        veri['Label'] = label  # Etiket sütunu ekle
        tum_veriler = pd.concat([tum_veriler, veri], ignore_index=True)

# Verileri sınıflandırma için hazırla
X = tum_veriler[['Wavelength (nm)', 'Sample Signal (unitless)']]
y = tum_veriler['Label']

# Veri normalizasyonu
scaler = StandardScaler()
X_scaled = scaler.fit_transform(X)

# Verileri eğitim ve test setlerine ayır
X_train, X_test, y_train, y_test = train_test_split(X_scaled, y, test_size=0.2, random_state=42)

# SVM kullanarak modeli eğit
model = SVC(kernel='linear', C=1)  # Lineer kernel ve C parametresi ayarlanabilir
model.fit(X_train, y_train)

# Test seti üzerinde tahmin yap
y_pred = model.predict(X_test)

# Doğruluk oranını hesapla
dogruluk_orani = accuracy_score(y_test, y_pred)
print(f"Doğruluk Oranı: {dogruluk_orani:.4f}")

# Doğruluk oranı düşük olan örnekleri göster
dusuk_dogruluk_orani_indeksleri = y_test[y_test != y_pred].index
dusuk_dogruluk_orani_veriler = tum_veriler.iloc[dusuk_dogruluk_orani_indeksleri]

# Tüm verileri ekrana bastır
with pd.option_context('display.max_rows', None, 'display.max_columns', None):
    print(tum_veriler)

# Doğruluk oranı düşük olan örnekleri ekrana bastır
print("\nDoğruluk Oranı Düşük Olan Örnekler:")
with pd.option_context('display.max_rows', None, 'display.max_columns', None):
    print(dusuk_dogruluk_orani_veriler)


Doğruluk Oranı: 0.5691
      Wavelength (nm)  Sample Signal (unitless)   Label
0          901.663021                   25052.0    Okra
1          905.592173                   27539.0    Okra
2          909.516909                   30158.0    Okra
3          913.437229                   33118.0    Okra
4          917.353134                   36892.0    Okra
5          921.264622                   41040.0    Okra
6          925.171696                   45958.0    Okra
7          929.074353                   51453.0    Okra
8          932.972595                   56650.0    Okra
9          938.163382                   64155.0    Okra
10         942.051321                   69195.0    Okra
11         945.934844                   74241.0    Okra
12         949.813951                   79115.0    Okra
13         953.688643                   84038.0    Okra
14         957.558919                   88161.0    Okra
15         961.424779                   91903.0    Okra
16         965.286223    