# 📌 Ghi Âm, Lưu và Trích Xuất Đặc Trưng MFCC từ Giọng Nói
## **PBL5 - Smart Home AI Voice Recognition**
Notebook này hướng dẫn từng bước để:
- Kết nối Google Drive
- Ghi âm giọng nói và lưu dưới dạng `.wav`
- Trích xuất đặc trưng MFCC để huấn luyện mô hình AI


## **1️⃣ Kết nối Google Drive**

In [None]:
from google.colab import drive
drive.mount('/content/drive')

## **2️⃣ Tạo thư mục lưu dữ liệu**

In [None]:
import os

# Đường dẫn thư mục trong Google Drive
base_dir = '/content/drive/MyDrive/Colab_Notebooks/PBL5'
voice_dir = os.path.join(base_dir, 'voice_data')

# Tạo thư mục nếu chưa có
os.makedirs(voice_dir, exist_ok=True)
print(f'Thư mục lưu dữ liệu: {voice_dir}')

## **3️⃣ Ghi âm và lưu file .wav**

In [None]:
import sounddevice as sd
from scipy.io.wavfile import write
import numpy as np

fs = 44100  # Tần số lấy mẫu (Hz)
seconds = 5  # Thời gian ghi âm

user_name = 'user_A'  # Đổi thành tên người dùng
file_path = os.path.join(voice_dir, f'{user_name}.wav')

print('Bắt đầu ghi âm...')
recording = sd.rec(int(seconds * fs), samplerate=fs, channels=1, dtype=np.int16)
sd.wait()
print('Ghi âm xong!')

# Lưu file vào Google Drive
write(file_path, fs, recording)
print(f'File đã lưu tại: {file_path}')

## **4️⃣ Kiểm tra danh sách file đã ghi âm**

In [1]:
import glob

file_list = glob.glob(os.path.join(voice_dir, '*.wav'))
print('Danh sách file ghi âm:')
print(file_list)

NameError: name 'os' is not defined

## **5️⃣ Load file .wav và trích xuất đặc trưng MFCC**

In [None]:
import librosa
import librosa.display
import matplotlib.pyplot as plt

file_path = file_list[0]  # Chọn file đầu tiên
y, sr = librosa.load(file_path, sr=None)
mfccs = librosa.feature.mfcc(y=y, sr=sr, n_mfcc=13)

plt.figure(figsize=(10, 6))
librosa.display.specshow(mfccs, sr=sr, x_axis='time')
plt.colorbar(format='%+2.0f dB')
plt.title('MFCC của giọng nói')
plt.tight_layout()
plt.show()

## **6️⃣ Chuẩn bị dữ liệu cho quá trình training**

In [None]:
X_train = []  # Danh sách đặc trưng MFCC
y_train = []  # Nhãn tương ứng

for file in file_list:
    y, sr = librosa.load(file, sr=None)
    mfccs = librosa.feature.mfcc(y=y, sr=sr, n_mfcc=13)
    X_train.append(mfccs)
    y_train.append(file.split('/')[-1].split('.')[0])  # Lưu tên file làm nhãn

print('Dữ liệu đã được chuẩn bị xong!')

## **✅ Hoàn tất: Dữ liệu đã sẵn sàng để huấn luyện mô hình AI!**