In [2]:
import scipy.io.wavfile as wav
import matplotlib.pyplot as plt
import scipy.signal as signal
import numpy as np


def energy_based_speech_silence_discrimination(signal, fs, frame_length, hop_length, threshold_factor, window_type):
    # Tính số lượng mẫu trong mỗi khung
    frame_samples = int(frame_length * fs)
    
    # Tính số lượng mẫu nhảy giữa các khung
    hop_samples = int(hop_length * fs)
    
    # Tạo cửa sổ (window) cho từng khung
    window = signal.get_window(window_type, frame_samples)
    
    # Tính toán số lượng khung tín hiệu
    num_frames = int(np.ceil(len(signal) / hop_samples))
    
    # Khởi tạo mảng lưu trữ năng lượng của các khung
    frame_energies = np.zeros(num_frames)
    
    # Tính toán năng lượng của từng khung
    for i in range(num_frames):
        # Tính toán chỉ số mẫu bắt đầu và kết thúc của khung hiện tại
        start = i * hop_samples
        end = start + frame_samples
        
        # Trích xuất khung tín hiệu hiện tại
        frame = signal[start:end]
        
        # Áp dụng cửa sổ cho khung tín hiệu
        frame *= window
        
        # Tính toán năng lượng của khung tín hiệu
        frame_energy = np.sum(np.square(frame))
        
        # Lưu trữ năng lượng của khung tín hiệu
        frame_energies[i] = frame_energy
    
    # Tính toán ngưỡng phân loại giữa tiếng nói và im lặng
    threshold = threshold_factor * np.median(frame_energies)
    
    # Phân loại các khung tín hiệu là tiếng nói hay im lặng dựa trên ngưỡng
    is_speech = frame_energies > threshold
    
    return is_speech
# Load tập tin âm thanh
audio_file = 'phone_F1.wav'
fs,signal=wav.read('phone_F1.wav')

# Các tham số cho hàm phân loại tiếng nói và im lặng
frame_length = 0.02   # 20 ms
hop_length = 0.01     # 10 ms
threshold_factor = 5  # ngưỡng phân loại
window_type = 'hamming'

# Phân loại tiếng nói và im lặng
is_speech = energy_based_speech_silence_discrimination(signal, fs, frame_length, hop_length, threshold_factor, window_type)

# Vẽ đồ thị biểu diễn phân loại tiếng nói và im lặng
plt.figure(figsize=(10, 4))
plt.plot(signal, color='gray', label='signal')
plt.plot(is_speech * np.max(signal), color='blue', label='speech')
plt.legend()
plt.xlabel('Time (samples)')
plt.ylabel('Amplitude')
plt.show()


AttributeError: 'numpy.ndarray' object has no attribute 'get_window'