In [1]:
import os
import numpy as np
import librosa
from sklearn.model_selection import train_test_split
from sklearn.ensemble import RandomForestClassifier
from sklearn.metrics import classification_report, accuracy_score
from sklearn.svm import SVC
from sklearn.linear_model import LogisticRegression
from sklearn.neighbors import KNeighborsClassifier
from sklearn.tree import DecisionTreeClassifier

# Ses dosyalarının bulunduğu ana dizin
veri_yolu = r"C:\Users\Buse Yener\makineProje"  # Dosya yolu buraya güncellendi

# Enstrüman etiketleri
enstrumanlar = {
    "temizlenmis_parcalarKanun": "kanun",
    "temizlenmis_parcalarKeman": "keman",
    "temizlenmis_parcalarGitar": "gitar",
    "temizlenmis_parcalarPiyano": "piyano"
}

X, y = [], []

# Veri yükleme
for klasor, etiket in enstrumanlar.items():
    klasor_yolu = os.path.join(veri_yolu, klasor)
    
    # Klasörün var olup olmadığını kontrol et
    if not os.path.exists(klasor_yolu):
        print(f"{klasor_yolu} bulunamadı.")
        continue
    
    for dosya in os.listdir(klasor_yolu):
        if dosya.endswith(".mp3"):
            dosya_yolu = os.path.join(klasor_yolu, dosya)
            y_audio, sr = librosa.load(dosya_yolu, sr=None)
            mfcc = np.mean(librosa.feature.mfcc(y=y_audio, sr=sr, n_mfcc=13), axis=1)
            X.append(mfcc)
            y.append(etiket)

X = np.array(X)
y = np.array(y)

print(f"Veri seti oluşturuldu. Toplam örnek sayısı: {len(X)}")

# Veriyi eğitim ve test setlerine ayır
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)

# Modelleri tanımla
modeller = {
    "Random Forest": RandomForestClassifier(n_estimators=100, random_state=42),
    "SVC": SVC(random_state=42),
    "Lojistik Regresyon": LogisticRegression(max_iter=200, random_state=42),
    "KNN": KNeighborsClassifier(n_neighbors=5),
    "Karar Ağaçları": DecisionTreeClassifier(random_state=42)
}

# Her model için eğitim ve değerlendirme yap
for isim, model in modeller.items():
    # Modeli eğit
    model.fit(X_train, y_train)

    # Test seti ile tahmin yap
    y_pred = model.predict(X_test)

    # Sonuçları değerlendir
    print(f"{isim} - Doğruluk Skoru:", accuracy_score(y_test, y_pred))
    print(f"{isim} - Sınıflandırma Raporu:\n", classification_report(y_test, y_pred))
    print("-" * 60)  # Ayırıcı çizgi


Veri seti oluşturuldu. Toplam örnek sayısı: 4475
Random Forest - Doğruluk Skoru: 0.9787709497206704
Random Forest - Sınıflandırma Raporu:
               precision    recall  f1-score   support

       gitar       0.98      0.97      0.97       208
       kanun       0.97      0.99      0.98       190
       keman       1.00      0.94      0.97       168
      piyano       0.97      1.00      0.98       329

    accuracy                           0.98       895
   macro avg       0.98      0.97      0.98       895
weighted avg       0.98      0.98      0.98       895

------------------------------------------------------------
SVC - Doğruluk Skoru: 0.9229050279329609
SVC - Sınıflandırma Raporu:
               precision    recall  f1-score   support

       gitar       0.88      0.86      0.87       208
       kanun       0.85      0.94      0.89       190
       keman       0.98      0.89      0.93       168
      piyano       0.97      0.97      0.97       329

    accuracy           

STOP: TOTAL NO. of ITERATIONS REACHED LIMIT.

Increase the number of iterations (max_iter) or scale the data as shown in:
    https://scikit-learn.org/stable/modules/preprocessing.html
Please also refer to the documentation for alternative solver options:
    https://scikit-learn.org/stable/modules/linear_model.html#logistic-regression
  n_iter_i = _check_optimize_result(
