### Bu dosyada bir ses dosyasından librosa kütüphanesi ile özellik çıkarımlarının(feature extraction) nasıl yapılacağı gösterilmektedir

İlk olarak ses dosyasını belleğe alıyorum.

In [None]:
import librosa
import numpy as np

# Ses dosyasını yükle
file_path = "common_voice_tr_41239135.wav"
audio, sr = librosa.load(file_path, sr=None)

Featureların ne olduğunun daha kolay anlaşılması için 3 adet mfcc değeri alıp bu değerleri yazdırıyorum.
Sonraki aşamalarda bu değerleri fazlasıyla kullanacağım bu yüzden çıktıyı incelemenizi öneriyorum.

"mfcc.shape" fonksiyonu aldığımız featureların 2 adet niteliğini verir. Çıktısı şu şekildedir: (coefficients, frames);

1- Number of coefficients: Kaç adet mfcc değeri kullandığımızı ifade eder.

2- Number of frames: Frame sayısını ifade eder.

Frame: Ses sinyalleri sürekli bir veri akışı gibi olsa da, bilgisayarda işlenebilmesi için genellikle küçük zaman dilimlerine bölünür.
Bu zaman dilimlerine frame denir.

In [34]:
mfcc = librosa.feature.mfcc(y=audio, sr=sr, n_mfcc=3)
np.set_printoptions(threshold=np.inf)
print(mfcc.shape)
print("\ndizinin 0. elemanı\n")
print(mfcc[0, :])
print("\ndizinin 1. elemanı\n")
print(mfcc[1, :])
print("\ndizinin 2. elemanı\n")
print(mfcc[2, :])

KeyboardInterrupt: 

Burada bir çok farklı feature çıkarıp yazdırıyorum.

In [33]:
# Özellikleri çıkartalım
features = {}

# 1. MFCC (Mel-Frequency Cepstral Coefficients)
mfcc = librosa.feature.mfcc(y=audio, sr=sr, n_mfcc=13)
features['MFCC'] = mfcc

# 2. Chroma Features
chroma = librosa.feature.chroma_stft(y=audio, sr=sr)
features['Chroma'] = chroma

# 3. Spectral Centroid
spectral_centroid = librosa.feature.spectral_centroid(y=audio, sr=sr)
features['Spectral Centroid'] = spectral_centroid

# 4. Spectral Rolloff
spectral_rolloff = librosa.feature.spectral_rolloff(y=audio, sr=sr)
features['Spectral Rolloff'] = spectral_rolloff

# 5. Zero-Crossing Rate
zcr = librosa.feature.zero_crossing_rate(audio)
features['Zero Crossing Rate'] = zcr

# 6. Spectral Bandwidth
spectral_bandwidth = librosa.feature.spectral_bandwidth(y=audio, sr=sr)
features['Spectral Bandwidth'] = spectral_bandwidth

# 7. Root Mean Square Energy (RMS)
rms = librosa.feature.rms(y=audio)
features['RMS Energy'] = rms

# 8. Tempo (BPM)
tempo, _ = librosa.beat.beat_track(y=audio, sr=sr)
features['Tempo (BPM)'] = tempo


for feature_name, feature_value in features.items():
    if isinstance(feature_value, np.ndarray):
        print(f"{feature_name}: {feature_value.shape}")
    else:
        print(f"{feature_name}: {feature_value}")

MFCC: (13, 2855)
Chroma: (12, 2855)
Spectral Centroid: (1, 2855)
Spectral Rolloff: (1, 2855)
Zero Crossing Rate: (1, 2855)
Spectral Bandwidth: (1, 2855)
RMS Energy: (1, 2855)
Tempo (BPM): (1,)


Kalan kısımda veri setimdeki seslerin featurelarını çıkarıp "pickle.dumps()" fonksiyonu ile serialize edip "BLOB" formatında veri tabanına yazacağım.

Oluşturduğum veri tabanını feature selection için "feature_selection" dosyasında kullanacağım.