In [61]:
# import numpy as np
# import librosa

# # Đặc trưng thời gian

# def compute_energy(signal):
#     """
#     Tính toán năng lượng của tín hiệu âm thanh.

#     Parameters:
#         signal (numpy array): Tín hiệu âm thanh.

#     Returns:
#         float: Năng lượng của tín hiệu âm thanh.
#     """
#     return np.sum(signal**2)


# def compute_zcr(signal):
#     """
#     Tính toán Zero Crossing Rate (ZCR) của tín hiệu âm thanh.

#     Parameters:
#         signal (numpy array): Tín hiệu âm thanh.

#     Returns:
#         float: ZCR của tín hiệu âm thanh.
#     """
#     return np.mean(np.abs(np.diff(np.sign(signal))))


# def compute_spectral_flux(spectrogram):
#     """
#     Tính toán Spectral Flux của phổ âm thanh.

#     Parameters:
#         spectrogram (numpy array): Phổ âm thanh.

#     Returns:
#         float: Spectral Flux của phổ âm thanh.
#     """
#     return np.mean(np.abs(np.diff(spectrogram, axis=1)))


# # Đặc trưng tần số

# def compute_spectral_rolloff(spectrogram, frequencies, rolloff_percent=0.85):
#     """
#     Tính toán Spectral Rolloff của phổ âm thanh.

#     Parameters:
#         spectrogram (numpy array): Phổ âm thanh.
#         frequencies (numpy array): Tần số của phổ âm thanh.
#         rolloff_percent (float): Phần trăm tích lũy năng lượng.

#     Returns:
#         float: Spectral Rolloff của phổ âm thanh.
#     """
#     total_energy = np.sum(spectrogram)
#     cumulative_energy = 0
#     for i, energy in enumerate(spectrogram):
#         cumulative_energy += energy
#         if cumulative_energy / total_energy >= rolloff_percent:
#             return frequencies[i]


# def compute_spectral_contrast(spectrogram):
#     """
#     Tính toán Spectral Contrast của phổ âm thanh.

#     Parameters:
#         spectrogram (numpy array): Phổ âm thanh.

#     Returns:
#         numpy array: Spectral Contrast của phổ âm thanh.
#     """
#     return librosa.feature.spectral_contrast(S=spectrogram).mean(axis=1)

# # Chroma

# def compute_chroma(signal, sample_rate):
#     """
#     Tính toán Chroma của tín hiệu âm thanh.

#     Parameters:
#         signal (numpy array): Tín hiệu âm thanh.
#         sample_rate (int): Tần số lấy mẫu của tín hiệu âm thanh.

#     Returns:
#         numpy array: Trung bình của Chroma.
#     """
#     chroma = librosa.feature.chroma_stft(y=signal, sr=sample_rate)
#     return chroma.mean(axis=1)

# def compute_spectral_centroid(spectrogram, frequencies):
#     """
#     Tính toán Spectral Centroid của phổ âm thanh.

#     Parameters:
#         spectrogram (numpy array): Phổ âm thanh.
#         frequencies (numpy array): Tần số của phổ âm thanh.

#     Returns:
#         float: Spectral Centroid của phổ âm thanh.
#     """
#     return np.sum(frequencies * spectrogram) / np.sum(spectrogram)

In [62]:
import numpy as np
import librosa
import os

In [63]:
# MFCCs

def compute_mfccs(signal, sample_rate, n_mfcc=13):
    """
    Tính toán Mel-frequency cepstral coefficients (MFCCs) của tín hiệu âm thanh.

    Parameters:
        signal (numpy array): Tín hiệu âm thanh.
        sample_rate (int): Tần số lấy mẫu của tín hiệu âm thanh.
        n_mfcc (int): Số lượng MFCCs.

    Returns:
        numpy array: Trung bình của MFCCs.
    """
    mfccs = librosa.feature.mfcc(y=signal, sr=sample_rate, n_mfcc=n_mfcc)
    return np.mean(mfccs.T, axis=0)

In [64]:
def feature_engineering_for_file(audio_file, n_mfcc):
    # Đọc tín hiệu âm thanh từ tệp âm thanh
    audio_file = r"D:\data_analysis\test3\data\clean\Angry\03-01-05-01-01-01-01_1.0158730158730158s_to_2.786394557823129s.wav"
    signal, sample_rate = librosa.load(audio_file, sr=None)
    print(compute_mfccs(signal, sample_rate, n_mfcc=40))

In [65]:
def process_folder(input_folder_path):
    """
    Xử lý tất cả các tệp WAV trong thư mục để tìm các phân đoạn nói.
    """
    for file_name in os.listdir(input_folder_path):
        print(file_name)
        if file_name.endswith('.wav'):
            file_path = os.path.join(input_folder_path, file_name)
            feature_engineering_for_file(file_path, 40)