In [1]:
import os
import librosa
import pandas as pd
import numpy as np
import random

# Ana klasör yolu
ana_klasor_yolu = './'  # Ana klasör yolu buraya girilmelidir

# Dosyaları ve etiketleri toplama
dosyalar_ve_etiketler = []
for klasor in os.listdir(ana_klasor_yolu):
    klasor_yolu = os.path.join(ana_klasor_yolu, klasor)
    if os.path.isdir(klasor_yolu):
        for dosya in os.listdir(klasor_yolu):
            if dosya.endswith('.wav'):
                dosyalar_ve_etiketler.append((klasor, os.path.join(klasor_yolu, dosya)))

# Sınıf sayılarını hesapla ve en az sınıf sayısını bul
etiket_sayilari = pd.Series([etiket for etiket, _ in dosyalar_ve_etiketler]).value_counts()
min_sayi = etiket_sayilari.min()

# Her sınıftan eşit sayıda örnek seç
secilen_dosyalar = []
for etiket in etiket_sayilari.index:
    secilen_dosyalar.extend(random.sample([dosya for etiket_dosya, dosya in dosyalar_ve_etiketler if etiket_dosya == etiket], min_sayi))

# Öznitelikleri çıkar ve listeye ekle
oznitelikler_listesi = []
for dosya in secilen_dosyalar:
    print(f'{dosya} dosyası işleniyor...')
    etiket = dosya.split(os.path.sep)[-2]
    y, sr = librosa.load(dosya, duration=5)
    if len(y) < 5 * sr:
        y = np.pad(y, (0, max(0, 5 * sr - len(y))), "constant")

    sro = np.mean(librosa.zero_crossings(y, pad=False))
    spec_centroid = np.mean(librosa.feature.spectral_centroid(y=y, sr=sr))
    spec_bandwidth = np.mean(librosa.feature.spectral_bandwidth(y=y, sr=sr))
    spec_rolloff = np.mean(librosa.feature.spectral_rolloff(y=y, sr=sr))
    mfcc = np.mean(librosa.feature.mfcc(y=y, sr=sr, n_mfcc=20), axis=1)

    oznitelikler_listesi.append([os.path.basename(dosya), etiket, sro, spec_centroid, spec_bandwidth, spec_rolloff, *mfcc])

# Listeyi DataFrame'e dönüştür ve CSV dosyasına yaz
oznitelikler = pd.DataFrame(oznitelikler_listesi, columns=['Dosya Adı', 'Etiket', 'SRO', 'Spectral Centroid', 'Spectral Bandwidth', 'Spectral Rolloff'] + [f'MFCC_{i}' for i in range(20)])
csv_dosya_adi = 'dengeli_ses_oznitelikleri_ve_etiketleri.csv'
oznitelikler.to_csv(csv_dosya_adi, index=False)


./NON AI COVER/NON AI COVER_96_12.wav dosyası işleniyor...
./NON AI COVER/NON AI COVER_26_65.wav dosyası işleniyor...
./NON AI COVER/NON AI COVER_18_21.wav dosyası işleniyor...
./NON AI COVER/NON AI COVER_125_0.wav dosyası işleniyor...
./NON AI COVER/NON AI COVER_63_8.wav dosyası işleniyor...
./NON AI COVER/NON AI COVER_26_36.wav dosyası işleniyor...
./NON AI COVER/NON AI COVER_19_12.wav dosyası işleniyor...
./NON AI COVER/NON AI COVER_122_9.wav dosyası işleniyor...
./NON AI COVER/NON AI COVER_64_1.wav dosyası işleniyor...
./NON AI COVER/NON AI COVER_24_94.wav dosyası işleniyor...
./NON AI COVER/NON AI COVER_12_3.wav dosyası işleniyor...
./NON AI COVER/NON AI COVER_10_218.wav dosyası işleniyor...
./NON AI COVER/NON AI COVER_19_106.wav dosyası işleniyor...
./NON AI COVER/NON AI COVER_9_90.wav dosyası işleniyor...
./NON AI COVER/NON AI COVER_24_113.wav dosyası işleniyor...
./NON AI COVER/NON AI COVER_81_5.wav dosyası işleniyor...
./NON AI COVER/NON AI COVER_24_6.wav dosyası işleniyor...
