In [1]:
# Kết nối Google Drive (nếu chạy trong Colab)
try:
    from google.colab import drive
    print("Kết nối Google Drive...")
    drive.mount('/content/drive')
except:
    print("Không thể kết nối Google Drive hoặc không chạy trong môi trường Colab.")

Kết nối Google Drive...
Mounted at /content/drive


# **explore_data_detailed**

In [2]:
import numpy as np
import matplotlib.pyplot as plt
import scipy.io as sio
import os
from scipy.fft import fft, fftfreq
import pandas as pd

# Đường dẫn đến file dữ liệu
data_path = '/content/drive/MyDrive/bidmc/bidmc-ppg-and-respiration-dataset-1.0.0/bidmc_data.mat'
figures_path = '/content/drive/MyDrive/bidmc/figures'
os.makedirs(figures_path, exist_ok=True)

# Tải dữ liệu
print("Đang tải dữ liệu từ file .mat...")
mat_data = sio.loadmat(data_path)
data = mat_data['data'][0]  # Lấy mảng chính chứa 53 bản ghi

# Khám phá cấu trúc dữ liệu
print(f"Số lượng bản ghi: {len(data)}")

# Khám phá cấu trúc chi tiết của bản ghi đầu tiên
first_record = data[0]
print("\nKhám phá cấu trúc chi tiết của bản ghi đầu tiên:")

# Kiểm tra cấu trúc của trường ppg
ppg_field = first_record['ppg'][0, 0]
print(f"Cấu trúc của trường ppg: {type(ppg_field)}")
if hasattr(ppg_field, 'dtype') and hasattr(ppg_field.dtype, 'names'):
    print(f"Các trường con của ppg: {ppg_field.dtype.names}")

# Kiểm tra cấu trúc của trường ref
ref_field = first_record['ref'][0, 0]
print(f"Cấu trúc của trường ref: {type(ref_field)}")
if hasattr(ref_field, 'dtype') and hasattr(ref_field.dtype, 'names'):
    print(f"Các trường con của ref: {ref_field.dtype.names}")

    # Kiểm tra cấu trúc của trường params trong ref
    if 'params' in ref_field.dtype.names:
        params_field = ref_field['params'][0, 0]
        print(f"Cấu trúc của trường params: {type(params_field)}")
        if hasattr(params_field, 'dtype') and hasattr(params_field.dtype, 'names'):
            print(f"Các trường con của params: {params_field.dtype.names}")

# Kiểm tra chi tiết hơn về cấu trúc dữ liệu
print("\nKiểm tra chi tiết hơn về cấu trúc dữ liệu:")
print(f"Kiểu dữ liệu của ppg.v: {type(first_record['ppg'][0, 0]['v'])}")
print(f"Kích thước của ppg.v: {first_record['ppg'][0, 0]['v'].shape}")

# Kiểm tra cấu trúc của HR và RR
print("\nKiểm tra cấu trúc của HR và RR:")
hr_field = first_record['ref'][0, 0]['params'][0, 0]['hr'][0]
print(f"Kiểu dữ liệu của hr: {type(hr_field)}")
print(f"Kích thước của hr: {hr_field.shape}")
print(f"Giá trị đầu tiên của hr: {hr_field[0] if hr_field.size > 0 else 'Không có dữ liệu'}")

rr_field = first_record['ref'][0, 0]['params'][0, 0]['rr'][0]
print(f"Kiểu dữ liệu của rr: {type(rr_field)}")
print(f"Kích thước của rr: {rr_field.shape}")
print(f"Giá trị đầu tiên của rr: {rr_field[0] if rr_field.size > 0 else 'Không có dữ liệu'}")

# Trích xuất và vẽ tín hiệu PPG từ bản ghi đầu tiên
try:
    # Truy cập trực tiếp vào dữ liệu PPG
    ppg_data = first_record['ppg'][0, 0]['v']
    if isinstance(ppg_data, np.ndarray):
        # Nếu là mảng numpy, lấy dữ liệu trực tiếp
        sample_ppg = ppg_data.flatten()
    else:
        # Nếu không phải mảng numpy, chuyển đổi thành mảng
        sample_ppg = np.array(ppg_data, dtype=float).flatten()

    # Lấy tần số lấy mẫu
    sample_fs_ppg = float(first_record['ppg'][0, 0]['fs'][0, 0])

    # Tương tự cho ECG và Resp
    ecg_data = first_record['ekg'][0, 0]['v']
    if isinstance(ecg_data, np.ndarray):
        sample_ecg = ecg_data.flatten()
    else:
        sample_ecg = np.array(ecg_data, dtype=float).flatten()

    sample_fs_ecg = float(first_record['ekg'][0, 0]['fs'][0, 0])

    resp_data = first_record['ref'][0, 0]['resp_sig'][0, 0]['imp'][0, 0]['v']
    if isinstance(resp_data, np.ndarray):
        sample_resp = resp_data.flatten()
    else:
        sample_resp = np.array(resp_data, dtype=float).flatten()

    sample_fs_resp = float(first_record['ref'][0, 0]['resp_sig'][0, 0]['imp'][0, 0]['fs'][0, 0])

    print(f"\nTần số lấy mẫu PPG: {sample_fs_ppg} Hz")
    print(f"Tần số lấy mẫu ECG: {sample_fs_ecg} Hz")
    print(f"Tần số lấy mẫu Resp: {sample_fs_resp} Hz")

    print(f"Độ dài tín hiệu PPG: {len(sample_ppg)} mẫu")
    print(f"Độ dài tín hiệu ECG: {len(sample_ecg)} mẫu")
    print(f"Độ dài tín hiệu Resp: {len(sample_resp)} mẫu")

    # Tính thời gian cho trục x
    time_ppg = np.arange(len(sample_ppg)) / sample_fs_ppg
    time_ecg = np.arange(len(sample_ecg)) / sample_fs_ecg
    time_resp = np.arange(len(sample_resp)) / sample_fs_resp

    # Vẽ tín hiệu mẫu
    plt.figure(figsize=(15, 10))

    plt.subplot(3, 1, 1)
    plt.plot(time_ecg[:1000], sample_ecg[:1000])
    plt.title('ECG Signal (First Record - First 1000 samples)')
    plt.xlabel('Time (s)')
    plt.ylabel('Amplitude')

    plt.subplot(3, 1, 2)
    plt.plot(time_ppg[:1000], sample_ppg[:1000])
    plt.title('PPG Signal (First Record - First 1000 samples)')
    plt.xlabel('Time (s)')
    plt.ylabel('Amplitude')

    plt.subplot(3, 1, 3)
    plt.plot(time_resp[:1000], sample_resp[:1000])
    plt.title('Respiratory Signal (First Record - First 1000 samples)')
    plt.xlabel('Time (s)')
    plt.ylabel('Amplitude')

    plt.tight_layout()
    plt.savefig(os.path.join(figures_path, 'sample_signals.png'))
    plt.close()

    # Phân tích phổ tần số của tín hiệu PPG
    def plot_fft(signal, fs, title, filename):
        N = len(signal)
        T = 1.0 / fs
        yf = fft(signal)
        xf = fftfreq(N, T)[:N//2]

        plt.figure(figsize=(10, 6))
        plt.plot(xf, 2.0/N * np.abs(yf[0:N//2]))
        plt.grid(True, alpha=0.3)
        plt.title(f'FFT of {title}')
        plt.xlabel('Frequency (Hz)')
        plt.ylabel('Amplitude')
        plt.xlim(0, 5)  # Giới hạn tần số hiển thị đến 5Hz
        plt.savefig(os.path.join(figures_path, filename))
        plt.close()

    # Phân tích phổ tần số của tín hiệu PPG, ECG và Resp
    plot_fft(sample_ppg, sample_fs_ppg, 'PPG Signal', 'ppg_fft.png')
    plot_fft(sample_ecg, sample_fs_ecg, 'ECG Signal', 'ecg_fft.png')
    plot_fft(sample_resp, sample_fs_resp, 'Respiratory Signal', 'resp_fft.png')

    # Tạo báo cáo tóm tắt
    with open(os.path.join(figures_path, 'data_exploration_summary.txt'), 'w') as f:
        f.write("BÁO CÁO KHÁM PHÁ DỮ LIỆU BIDMC PPG AND RESPIRATION DATASET\n")
        f.write("==========================================================\n\n")

        f.write(f"Số lượng bản ghi: {len(data)}\n\n")

        f.write("Cấu trúc dữ liệu:\n")
        f.write("- Mỗi bản ghi chứa các trường: ppg, ekg, ref, fix\n")
        f.write("- Tín hiệu PPG và ECG được lưu trữ với giá trị (v) và tần số lấy mẫu (fs)\n")
        f.write("- Tín hiệu hô hấp được lưu trữ trong trường ref.resp_sig.imp\n")
        f.write("- Các thông số sinh lý (HR, RR, PR, SpO2) được lưu trữ trong trường ref.params\n\n")

        f.write(f"Tần số lấy mẫu PPG: {sample_fs_ppg} Hz\n")
        f.write(f"Tần số lấy mẫu ECG: {sample_fs_ecg} Hz\n")
        f.write(f"Tần số lấy mẫu Resp: {sample_fs_resp} Hz\n\n")

        f.write("Thách thức trong việc truy cập dữ liệu:\n")
        f.write("- Cấu trúc dữ liệu phức tạp với nhiều lớp lồng nhau\n")
        f.write("- Khó khăn trong việc chuyển đổi dữ liệu HR và RR sang định dạng float\n")
        f.write("- Cần phương pháp tiếp cận cẩn thận để trích xuất và xử lý dữ liệu\n\n")

        f.write("Các file đã tạo:\n")
        f.write("1. sample_signals.png - Biểu đồ mẫu của tín hiệu ECG, PPG và Respiratory\n")
        f.write("2. ppg_fft.png, ecg_fft.png, resp_fft.png - Phân tích phổ tần số của các tín hiệu\n")

    print("\nPhân tích dữ liệu hoàn tất. Các biểu đồ và báo cáo đã được lưu vào thư mục figures.")

except Exception as e:
    print(f"Lỗi khi vẽ tín hiệu mẫu: {e}")

# Kiểm tra trực tiếp một số bản ghi để tìm hiểu cấu trúc HR và RR
print("\nKiểm tra trực tiếp HR và RR từ một số bản ghi:")
for i in range(min(5, len(data))):
    try:
        record = data[i]
        params = record['ref'][0, 0]['params'][0, 0]

        hr_data = params['hr'][0]
        rr_data = params['rr'][0]

        print(f"\nBản ghi {i}:")
        print(f"Kiểu dữ liệu HR: {type(hr_data)}")
        if hasattr(hr_data, 'dtype'):
            print(f"Dtype của HR: {hr_data.dtype}")
        if hasattr(hr_data, 'shape'):
            print(f"Kích thước của HR: {hr_data.shape}")

        print(f"Kiểu dữ liệu RR: {type(rr_data)}")
        if hasattr(rr_data, 'dtype'):
            print(f"Dtype của RR: {rr_data.dtype}")
        if hasattr(rr_data, 'shape'):
            print(f"Kích thước của RR: {rr_data.shape}")

        # Thử in ra một số giá trị đầu tiên
        if hasattr(hr_data, 'size') and hr_data.size > 0:
            if hasattr(hr_data, 'dtype') and hr_data.dtype.names is not None and 'v' in hr_data.dtype.names:
                print(f"Giá trị HR đầu tiên (trường v): {hr_data['v'][0] if hr_data['v'].size > 0 else 'Không có dữ liệu'}")
            else:
                print(f"Giá trị HR đầu tiên: {hr_data[0]}")

        if hasattr(rr_data, 'size') and rr_data.size > 0:
            if hasattr(rr_data, 'dtype') and rr_data.dtype.names is not None and 'v' in rr_data.dtype.names:
                print(f"Giá trị RR đầu tiên (trường v): {rr_data['v'][0] if rr_data['v'].size > 0 else 'Không có dữ liệu'}")
            else:
                print(f"Giá trị RR đầu tiên: {rr_data[0]}")
    except Exception as e:
        print(f"Lỗi khi kiểm tra bản ghi {i}: {e}")

[1;30;43mStreaming output truncated to the last 5000 lines.[0m
       [21],
       [21],
       [21],
       [21],
       [21],
       [21],
       [21],
       [21],
       [21],
       [21],
       [20],
       [20],
       [20],
       [20],
       [20],
       [20],
       [20],
       [20],
       [20],
       [20],
       [20],
       [20],
       [20],
       [20],
       [20],
       [20],
       [20],
       [20],
       [20],
       [20],
       [20],
       [20],
       [21],
       [21],
       [21],
       [21],
       [21],
       [21],
       [21],
       [21],
       [21],
       [21],
       [21],
       [21],
       [21],
       [21],
       [21],
       [21],
       [21],
       [21],
       [21],
       [21],
       [21],
       [21],
       [21],
       [21],
       [21],
       [21],
       [21],
       [21],
       [21],
       [21],
       [21],
       [21],
       [21],
       [21],
       [21],
       [21],
       [21],
       [21],
       [21],
       [21],

# **check_data_structure**

In [3]:
import numpy as np
import matplotlib.pyplot as plt
import scipy.io as sio
import os
from scipy.fft import fft, fftfreq
import pandas as pd

# Đường dẫn đến file dữ liệu
data_path = '/content/drive/MyDrive/bidmc/bidmc-ppg-and-respiration-dataset-1.0.0/bidmc_data.mat'
figures_path = '/content/drive/MyDrive/bidmc/figures'

# Tải dữ liệu
print("Đang tải dữ liệu từ file .mat...")
mat_data = sio.loadmat(data_path)

# Kiểm tra cấu trúc dữ liệu
print("Các khóa trong file .mat:")
for key in mat_data.keys():
    print(f"- {key}")

# Kiểm tra cấu trúc chi tiết
if 'data' in mat_data:
    data = mat_data['data']
    print(f"\nKiểu dữ liệu của 'data': {type(data)}")
    print(f"Kích thước của 'data': {data.shape}")

    # Kiểm tra cấu trúc của phần tử đầu tiên nếu data là mảng
    if isinstance(data, np.ndarray) and data.size > 0:
        first_record = data[0]
        if hasattr(first_record, 'dtype') and hasattr(first_record.dtype, 'names'):
            print("\nCác trường trong bản ghi đầu tiên:")
            for field in first_record.dtype.names:
                print(f"- {field}")

                # Kiểm tra cấu trúc chi tiết của từng trường
                field_data = first_record[field]
                print(f"  Kiểu: {type(field_data)}, Kích thước: {field_data.shape}")

                # Nếu là mảng có cấu trúc, hiển thị thêm thông tin
                if hasattr(field_data, 'dtype') and hasattr(field_data.dtype, 'names'):
                    print(f"  Các trường con: {field_data.dtype.names}")
        else:
            print(f"\nPhần tử đầu tiên không có cấu trúc trường, kiểu: {type(first_record)}")
    else:
        print("\nKhông thể truy cập phần tử đầu tiên của 'data'")
else:
    print("\nKhông tìm thấy khóa 'data' trong file .mat")
    print("Đang kiểm tra cấu trúc dữ liệu thay thế...")

    # Tìm khóa có thể chứa dữ liệu chính
    potential_data_keys = [k for k in mat_data.keys() if not k.startswith('__')]
    for key in potential_data_keys:
        print(f"\nKiểm tra khóa: {key}")
        data_item = mat_data[key]
        print(f"Kiểu: {type(data_item)}, ", end="")

        if isinstance(data_item, np.ndarray):
            print(f"Kích thước: {data_item.shape}")

            # Kiểm tra nếu là mảng có cấu trúc
            if data_item.dtype.names is not None:
                print(f"Các trường: {data_item.dtype.names}")

            # Kiểm tra phần tử đầu tiên nếu là mảng nhiều chiều
            if data_item.size > 0:
                first_item = data_item[0]
                print(f"Kiểu phần tử đầu tiên: {type(first_item)}")

                # Nếu phần tử đầu tiên là mảng có cấu trúc
                if hasattr(first_item, 'dtype') and hasattr(first_item.dtype, 'names'):
                    print(f"Các trường trong phần tử đầu tiên: {first_item.dtype.names}")
        else:
            print(f"Không phải mảng numpy")

print("\nĐang lưu thông tin cấu trúc dữ liệu vào file...")
with open(os.path.join(figures_path, 'data_structure.txt'), 'w') as f:
    f.write("CẤU TRÚC DỮ LIỆU BIDMC PPG AND RESPIRATION DATASET\n")
    f.write("=================================================\n\n")

    f.write("Các khóa trong file .mat:\n")
    for key in mat_data.keys():
        f.write(f"- {key}\n")

    f.write("\nThông tin chi tiết về cấu trúc dữ liệu được lưu trong file này.")

print("\nĐã lưu thông tin cấu trúc dữ liệu. Vui lòng kiểm tra file data_structure.txt")


Đang tải dữ liệu từ file .mat...
Các khóa trong file .mat:
- __header__
- __version__
- __globals__
- data

Kiểu dữ liệu của 'data': <class 'numpy.ndarray'>
Kích thước của 'data': (1, 53)

Các trường trong bản ghi đầu tiên:
- fix
  Kiểu: <class 'numpy.ndarray'>, Kích thước: (53,)
  Các trường con: None
- ppg
  Kiểu: <class 'numpy.ndarray'>, Kích thước: (53,)
  Các trường con: None
- ekg
  Kiểu: <class 'numpy.ndarray'>, Kích thước: (53,)
  Các trường con: None
- ref
  Kiểu: <class 'numpy.ndarray'>, Kích thước: (53,)
  Các trường con: None

Đang lưu thông tin cấu trúc dữ liệu vào file...

Đã lưu thông tin cấu trúc dữ liệu. Vui lòng kiểm tra file data_structure.txt


# **preprocess_data_fixed**

In [4]:
import matplotlib.pyplot as plt
import scipy.io as sio
import os
from scipy.signal import butter, filtfilt
from sklearn.preprocessing import MinMaxScaler
import numpy as np
from sklearn.model_selection import train_test_split

# Đường dẫn đến file dữ liệu
data_path = '/content/drive/MyDrive/bidmc/bidmc-ppg-and-respiration-dataset-1.0.0/bidmc_data.mat'
processed_data_path = '/content/drive/MyDrive/bidmc/processed'
figures_path = '/content/drive/MyDrive/bidmc/figures'

# Tạo thư mục nếu chưa tồn tại
os.makedirs(processed_data_path, exist_ok=True)
os.makedirs(figures_path, exist_ok=True)

# Tải dữ liệu
print("Đang tải dữ liệu từ file .mat...")
mat_data = sio.loadmat(data_path)
data = mat_data['data'][0]  # Lấy mảng chính chứa 53 bản ghi
print(f"Số lượng bản ghi: {len(data)}")

# Hàm lọc nhiễu cải tiến (tăng bậc bộ lọc để lọc tốt hơn)
def butter_bandpass_filter(data, lowcut, highcut, fs, order=4):  # Tăng order từ 2 lên 4
    nyq = 0.5 * fs
    low = lowcut / nyq
    high = highcut / nyq
    b, a = butter(order, [low, high], btype='band')
    y = filtfilt(b, a, data)
    return y

# Hàm chuẩn hóa tín hiệu
def normalize_signal(signal, method='minmax'):
    if method == 'minmax':
        scaler = MinMaxScaler(feature_range=(0, 1))
        signal_reshaped = signal.reshape(-1, 1)
        normalized = scaler.fit_transform(signal_reshaped).flatten()
    else:
        raise ValueError("Phương pháp chuẩn hóa không hợp lệ")
    return normalized

# Hàm chia tín hiệu thành các đoạn
def segment_signal(signal, segment_length, overlap=0):
    step = int(segment_length * (1 - overlap))
    segments = []
    for i in range(0, len(signal) - segment_length + 1, step):
        segments.append(signal[i:i + segment_length])
    return np.array(segments)

# Hàm trích xuất đặc trưng HR và BR (giữ nguyên logic gốc)
def extract_hr_br_features(hr_values, rr_values):
    hr_mean = np.mean(hr_values)
    rr_mean = np.mean(rr_values)
    return hr_mean, rr_mean

# Hàm kiểm tra chất lượng tín hiệu (thêm để tăng tính mạnh mẽ)
def check_signal_quality(signal, threshold_std=1e-3):
    if np.any(np.isnan(signal)) or np.all(signal == 0) or np.std(signal) < threshold_std:
        return False
    return True

# Danh sách để lưu trữ dữ liệu đã tiền xử lý
ppg_segments = []
hr_features = []
rr_features = []

# Tham số tiền xử lý (giữ nguyên như mã gốc)
fs = 125
segment_length = 8 * fs  # 8 giây = 1000 mẫu
overlap = 0.5
lowcut = 0.5
highcut = 8.0

# Tiền xử lý dữ liệu từ mỗi bản ghi
valid_records = 0
for i in range(len(data)):
    try:
        record = data[i]

        # Trích xuất tín hiệu PPG
        ppg_data = record['ppg'][0, 0]['v']
        if isinstance(ppg_data, np.ndarray):
            ppg_signal = ppg_data.flatten()
        else:
            ppg_signal = np.array(ppg_data, dtype=float).flatten()

        # Kiểm tra chất lượng tín hiệu trước khi xử lý
        if not check_signal_quality(ppg_signal):
            print(f"Bản ghi {i} có tín hiệu PPG không hợp lệ, bỏ qua")
            continue

        # Trích xuất HR và RR (giữ nguyên logic gốc)
        try:
            hr_data = record['ref'][0, 0]['params'][0, 0]['hr'][0]
            if hasattr(hr_data, 'dtype') and hr_data.dtype.names is not None and 'v' in hr_data.dtype.names:
                hr_values_raw = hr_data['v']
            else:
                hr_values_raw = hr_data

            rr_data = record['ref'][0, 0]['params'][0, 0]['rr'][0]
            if hasattr(rr_data, 'dtype') and rr_data.dtype.names is not None and 'v' in rr_data.dtype.names:
                rr_values_raw = rr_data['v']
            else:
                rr_values_raw = rr_data

            hr_values = []
            for item in hr_values_raw:
                if isinstance(item, np.ndarray) and item.size > 0:
                    hr_values.append(float(item[0]))
                elif np.isscalar(item):
                    hr_values.append(float(item))

            rr_values = []
            for item in rr_values_raw:
                if isinstance(item, np.ndarray) and item.size > 0:
                    rr_values.append(float(item[0]))
                elif np.isscalar(item):
                    rr_values.append(float(item))

            hr_values = np.array(hr_values)
            rr_values = np.array(rr_values)

            if len(hr_values) == 0 or len(rr_values) == 0:
                print(f"Không đủ dữ liệu HR/RR cho bản ghi {i}, bỏ qua")
                continue

        except Exception as e:
            print(f"Lỗi khi trích xuất HR/RR của bản ghi {i}: {e}, bỏ qua")
            continue

        # Lọc nhiễu tín hiệu PPG (cải tiến với order=4)
        ppg_filtered = butter_bandpass_filter(ppg_signal, lowcut, highcut, fs)

        # Chuẩn hóa tín hiệu PPG
        ppg_normalized = normalize_signal(ppg_filtered, method='minmax')

        # Chia tín hiệu thành các đoạn
        segments = segment_signal(ppg_normalized, segment_length, overlap)

        # Kiểm tra chất lượng từng đoạn (thêm để loại bỏ đoạn xấu)
        valid_segments = [seg for seg in segments if check_signal_quality(seg)]
        if len(valid_segments) == 0:
            print(f"Bản ghi {i} không có đoạn tín hiệu hợp lệ sau khi chia, bỏ qua")
            continue

        # Trích xuất đặc trưng HR và BR (giữ nguyên logic gốc)
        hr_feature, rr_feature = extract_hr_br_features(hr_values, rr_values)
        for segment in valid_segments:
            ppg_segments.append(segment)
            hr_features.append(hr_feature)
            rr_features.append(rr_feature)

        valid_records += 1
        print(f"Đã xử lý bản ghi {i}, số đoạn tín hiệu hợp lệ: {len(valid_segments)}")

    except Exception as e:
        print(f"Lỗi khi xử lý bản ghi {i}: {e}")

print(f"\nĐã xử lý thành công {valid_records}/{len(data)} bản ghi")
print(f"Tổng số đoạn tín hiệu: {len(ppg_segments)}")

# Chuyển đổi danh sách thành mảng numpy
ppg_segments = np.array(ppg_segments)
hr_features = np.array(hr_features)
rr_features = np.array(rr_features)

# Chia dữ liệu thành tập huấn luyện và kiểm thử (giữ nguyên logic gốc)
X_train, X_test, hr_train, hr_test, rr_train, rr_test = train_test_split(
    ppg_segments, hr_features, rr_features, test_size=0.2, random_state=42
)

# Lưu dữ liệu đã tiền xử lý (giữ nguyên logic gốc)
np.save(os.path.join(processed_data_path, 'ppg_train.npy'), X_train)
np.save(os.path.join(processed_data_path, 'ppg_test.npy'), X_test)
np.save(os.path.join(processed_data_path, 'hr_train.npy'), hr_train)
np.save(os.path.join(processed_data_path, 'hr_test.npy'), hr_test)
np.save(os.path.join(processed_data_path, 'rr_train.npy'), rr_train)
np.save(os.path.join(processed_data_path, 'rr_test.npy'), rr_test)

# Lưu thông tin về dữ liệu đã tiền xử lý (giữ nguyên định dạng gốc, thêm thông tin chất lượng)
with open(os.path.join(processed_data_path, 'preprocessing_info.txt'), 'w') as f:
    f.write("THÔNG TIN TIỀN XỬ LÝ DỮ LIỆU\n")
    f.write("============================\n\n")
    f.write(f"Số lượng bản ghi đã xử lý: {valid_records}/{len(data)}\n")
    f.write(f"Tổng số đoạn tín hiệu: {len(ppg_segments)}\n\n")
    f.write("Tham số tiền xử lý:\n")
    f.write(f"- Tần số lấy mẫu: {fs} Hz\n")
    f.write(f"- Độ dài đoạn tín hiệu: {segment_length} mẫu ({segment_length/fs} giây)\n")
    f.write(f"- Độ chồng lấp: {overlap*100}%\n")
    f.write(f"- Tần số cắt dưới: {lowcut} Hz\n")
    f.write(f"- Tần số cắt trên: {highcut} Hz\n")
    f.write("- Bậc bộ lọc: 4 (cải tiến để lọc nhiễu tốt hơn)\n\n")
    f.write("Kích thước dữ liệu:\n")
    f.write(f"- Tập huấn luyện: {X_train.shape[0]} mẫu\n")
    f.write(f"- Tập kiểm thử: {X_test.shape[0]} mẫu\n\n")
    f.write("Thống kê HR (không chuẩn hóa):\n")
    f.write(f"- Min: {np.min(hr_features):.2f}, Max: {np.max(hr_features):.2f}\n")
    f.write(f"- Mean: {np.mean(hr_features):.2f}, Std: {np.std(hr_features):.2f}\n\n")
    f.write("Thống kê RR (không chuẩn hóa):\n")
    f.write(f"- Min: {np.min(rr_features):.2f}, Max: {np.max(rr_features):.2f}\n")
    f.write(f"- Mean: {np.mean(rr_features):.2f}, Std: {np.std(rr_features):.2f}\n")

# Vẽ biểu đồ phân phối HR và RR (giữ nguyên như gốc)
plt.figure(figsize=(12, 5))
plt.subplot(1, 2, 1)
plt.hist(hr_features, bins=30, alpha=0.7, color='blue')
plt.axvline(np.mean(hr_features), color='red', linestyle='dashed', linewidth=1)
plt.title('Heart Rate Distribution (Unnormalized)')
plt.xlabel('Heart Rate (bpm)')
plt.ylabel('Frequency')
plt.grid(True, alpha=0.3)

plt.subplot(1, 2, 2)
plt.hist(rr_features, bins=30, alpha=0.7, color='green')
plt.axvline(np.mean(rr_features), color='red', linestyle='dashed', linewidth=1)
plt.title('Respiratory Rate Distribution (Unnormalized)')
plt.xlabel('Respiratory Rate (breaths/min)')
plt.ylabel('Frequency')
plt.grid(True, alpha=0.3)

plt.tight_layout()
plt.savefig(os.path.join(figures_path, 'unnormalized_hr_rr_distribution.png'))
plt.close()

# Vẽ một số đoạn tín hiệu PPG đã tiền xử lý (giữ nguyên như gốc)
plt.figure(figsize=(15, 10))
for i in range(min(5, len(X_train))):
    plt.subplot(5, 1, i+1)
    plt.plot(X_train[i])
    plt.title(f'Preprocessed PPG Segment {i+1}')
    plt.xlabel('Sample')
    plt.ylabel('Amplitude')
    plt.grid(True, alpha=0.3)

plt.tight_layout()
plt.savefig(os.path.join(figures_path, 'preprocessed_ppg_segments.png'))
plt.close()

print("\nTiền xử lý dữ liệu hoàn tất. Dữ liệu đã được lưu vào thư mục processed.")

Đang tải dữ liệu từ file .mat...
Số lượng bản ghi: 53
Đã xử lý bản ghi 0, số đoạn tín hiệu hợp lệ: 119
Đã xử lý bản ghi 1, số đoạn tín hiệu hợp lệ: 119
Đã xử lý bản ghi 2, số đoạn tín hiệu hợp lệ: 119
Đã xử lý bản ghi 3, số đoạn tín hiệu hợp lệ: 119
Đã xử lý bản ghi 4, số đoạn tín hiệu hợp lệ: 119
Đã xử lý bản ghi 5, số đoạn tín hiệu hợp lệ: 119
Đã xử lý bản ghi 6, số đoạn tín hiệu hợp lệ: 119
Đã xử lý bản ghi 7, số đoạn tín hiệu hợp lệ: 119
Đã xử lý bản ghi 8, số đoạn tín hiệu hợp lệ: 119
Đã xử lý bản ghi 9, số đoạn tín hiệu hợp lệ: 119
Đã xử lý bản ghi 10, số đoạn tín hiệu hợp lệ: 119
Đã xử lý bản ghi 11, số đoạn tín hiệu hợp lệ: 119
Đã xử lý bản ghi 12, số đoạn tín hiệu hợp lệ: 119
Đã xử lý bản ghi 13, số đoạn tín hiệu hợp lệ: 119
Đã xử lý bản ghi 14, số đoạn tín hiệu hợp lệ: 119


  hr_values.append(float(item[0]))
  rr_values.append(float(item[0]))
  hr_values.append(float(item[0]))
  rr_values.append(float(item[0]))
  hr_values.append(float(item[0]))
  rr_values.append(float(item[0]))
  hr_values.append(float(item[0]))
  rr_values.append(float(item[0]))
  hr_values.append(float(item[0]))
  rr_values.append(float(item[0]))
  hr_values.append(float(item[0]))
  rr_values.append(float(item[0]))
  hr_values.append(float(item[0]))
  rr_values.append(float(item[0]))
  hr_values.append(float(item[0]))
  rr_values.append(float(item[0]))
  hr_values.append(float(item[0]))
  rr_values.append(float(item[0]))
  hr_values.append(float(item[0]))
  rr_values.append(float(item[0]))
  hr_values.append(float(item[0]))
  rr_values.append(float(item[0]))
  hr_values.append(float(item[0]))
  rr_values.append(float(item[0]))
  hr_values.append(float(item[0]))
  rr_values.append(float(item[0]))
  hr_values.append(float(item[0]))
  rr_values.append(float(item[0]))
  hr_values.append(f

Đã xử lý bản ghi 15, số đoạn tín hiệu hợp lệ: 119
Đã xử lý bản ghi 16, số đoạn tín hiệu hợp lệ: 119
Đã xử lý bản ghi 17, số đoạn tín hiệu hợp lệ: 119
Đã xử lý bản ghi 18, số đoạn tín hiệu hợp lệ: 119
Đã xử lý bản ghi 19, số đoạn tín hiệu hợp lệ: 119
Đã xử lý bản ghi 20, số đoạn tín hiệu hợp lệ: 119
Đã xử lý bản ghi 21, số đoạn tín hiệu hợp lệ: 119
Đã xử lý bản ghi 22, số đoạn tín hiệu hợp lệ: 119
Đã xử lý bản ghi 23, số đoạn tín hiệu hợp lệ: 119
Đã xử lý bản ghi 24, số đoạn tín hiệu hợp lệ: 119
Đã xử lý bản ghi 25, số đoạn tín hiệu hợp lệ: 119
Đã xử lý bản ghi 26, số đoạn tín hiệu hợp lệ: 119
Đã xử lý bản ghi 27, số đoạn tín hiệu hợp lệ: 119
Đã xử lý bản ghi 28, số đoạn tín hiệu hợp lệ: 119
Đã xử lý bản ghi 29, số đoạn tín hiệu hợp lệ: 119
Đã xử lý bản ghi 30, số đoạn tín hiệu hợp lệ: 119
Đã xử lý bản ghi 31, số đoạn tín hiệu hợp lệ: 119
Đã xử lý bản ghi 32, số đoạn tín hiệu hợp lệ: 119
Đã xử lý bản ghi 33, số đoạn tín hiệu hợp lệ: 119


  hr_values.append(float(item[0]))
  rr_values.append(float(item[0]))
  hr_values.append(float(item[0]))
  rr_values.append(float(item[0]))
  hr_values.append(float(item[0]))
  rr_values.append(float(item[0]))
  hr_values.append(float(item[0]))
  rr_values.append(float(item[0]))
  hr_values.append(float(item[0]))
  rr_values.append(float(item[0]))
  hr_values.append(float(item[0]))
  rr_values.append(float(item[0]))
  hr_values.append(float(item[0]))
  rr_values.append(float(item[0]))
  hr_values.append(float(item[0]))
  rr_values.append(float(item[0]))
  hr_values.append(float(item[0]))
  rr_values.append(float(item[0]))
  hr_values.append(float(item[0]))
  rr_values.append(float(item[0]))
  hr_values.append(float(item[0]))
  rr_values.append(float(item[0]))
  hr_values.append(float(item[0]))
  rr_values.append(float(item[0]))
  hr_values.append(float(item[0]))
  rr_values.append(float(item[0]))
  hr_values.append(float(item[0]))
  rr_values.append(float(item[0]))
  hr_values.append(f

Đã xử lý bản ghi 34, số đoạn tín hiệu hợp lệ: 119
Đã xử lý bản ghi 35, số đoạn tín hiệu hợp lệ: 119
Đã xử lý bản ghi 36, số đoạn tín hiệu hợp lệ: 119
Đã xử lý bản ghi 37, số đoạn tín hiệu hợp lệ: 119
Đã xử lý bản ghi 38, số đoạn tín hiệu hợp lệ: 119
Đã xử lý bản ghi 39, số đoạn tín hiệu hợp lệ: 119
Đã xử lý bản ghi 40, số đoạn tín hiệu hợp lệ: 119
Đã xử lý bản ghi 41, số đoạn tín hiệu hợp lệ: 119
Đã xử lý bản ghi 42, số đoạn tín hiệu hợp lệ: 119
Đã xử lý bản ghi 43, số đoạn tín hiệu hợp lệ: 119
Đã xử lý bản ghi 44, số đoạn tín hiệu hợp lệ: 119
Đã xử lý bản ghi 45, số đoạn tín hiệu hợp lệ: 119
Đã xử lý bản ghi 46, số đoạn tín hiệu hợp lệ: 119
Đã xử lý bản ghi 47, số đoạn tín hiệu hợp lệ: 119
Đã xử lý bản ghi 48, số đoạn tín hiệu hợp lệ: 119
Đã xử lý bản ghi 49, số đoạn tín hiệu hợp lệ: 119
Đã xử lý bản ghi 50, số đoạn tín hiệu hợp lệ: 119


  hr_values.append(float(item[0]))
  rr_values.append(float(item[0]))
  hr_values.append(float(item[0]))
  rr_values.append(float(item[0]))


Đã xử lý bản ghi 51, số đoạn tín hiệu hợp lệ: 119
Đã xử lý bản ghi 52, số đoạn tín hiệu hợp lệ: 119

Đã xử lý thành công 53/53 bản ghi
Tổng số đoạn tín hiệu: 6307

Tiền xử lý dữ liệu hoàn tất. Dữ liệu đã được lưu vào thư mục processed.


# **train_cvae_fixed**

In [5]:
import tensorflow as tf
import numpy as np
import matplotlib.pyplot as plt
import os
from tensorflow.keras import layers, Model
from tensorflow.keras.optimizers import Adam
import datetime
import time

processed_data_path = '/content/drive/MyDrive/bidmc/processed'
model_path = '/content/drive/MyDrive/bidmc/models'
figures_path = '/content/drive/MyDrive/bidmc/figures'

os.makedirs(model_path, exist_ok=True)
os.makedirs(figures_path, exist_ok=True)

print("Đang tải dữ liệu đã tiền xử lý...")
X_train = np.load(os.path.join(processed_data_path, 'ppg_train.npy'))
X_test = np.load(os.path.join(processed_data_path, 'ppg_test.npy'))
hr_train = np.load(os.path.join(processed_data_path, 'hr_train.npy'))
hr_test = np.load(os.path.join(processed_data_path, 'hr_test.npy'))
rr_train = np.load(os.path.join(processed_data_path, 'rr_train.npy'))
rr_test = np.load(os.path.join(processed_data_path, 'rr_test.npy'))

if len(X_train.shape) == 2:
    X_train = X_train[..., np.newaxis]
    X_test = X_test[..., np.newaxis]

input_dim = X_train.shape[1]
condition_dim = 2
latent_dim = 32
filters = [256, 128, 64]
batch_size = 64
epochs = 300
learning_rate = 0.0001

condition_train = np.column_stack((hr_train, rr_train))
condition_test = np.column_stack((hr_test, rr_test))

class Sampling(layers.Layer):
    def call(self, inputs):
        z_mean, z_log_var = inputs
        batch = tf.shape(z_mean)[0]
        dim = tf.shape(z_mean)[1]
        epsilon = tf.keras.backend.random_normal(shape=(batch, dim))
        return z_mean + tf.exp(0.5 * z_log_var) * epsilon

def build_encoder(input_dim, condition_dim, latent_dim, filters):
    encoder_inputs = layers.Input(shape=(input_dim, 1))
    condition_inputs = layers.Input(shape=(condition_dim,))
    x = encoder_inputs
    for f in filters:
        x = layers.Conv1D(filters=f, kernel_size=3, strides=2, padding='same', activation='relu')(x)
        x = layers.BatchNormalization()(x)
    x = layers.Flatten()(x)
    condition_expanded = layers.Dense(128, activation='relu')(condition_inputs)
    x = layers.Concatenate()([x, condition_expanded])
    z_mean = layers.Dense(latent_dim, name='z_mean')(x)
    z_log_var = layers.Dense(latent_dim, name='z_log_var')(x)
    z = Sampling()([z_mean, z_log_var])
    return Model([encoder_inputs, condition_inputs], [z_mean, z_log_var, z], name='encoder')

def build_decoder(latent_dim, condition_dim, input_dim, filters):
    latent_inputs = layers.Input(shape=(latent_dim,))
    condition_inputs = layers.Input(shape=(condition_dim,))
    x = layers.Concatenate()([latent_inputs, condition_inputs])
    x = layers.Dense(input_dim // 8 * filters[-1], activation='relu')(x)
    x = layers.Reshape((input_dim // 8, filters[-1]))(x)
    for f in reversed(filters[:-1]):
        x = layers.Conv1DTranspose(filters=f, kernel_size=3, strides=2, padding='same', activation='relu')(x)
        x = layers.BatchNormalization()(x)
    decoder_outputs = layers.Conv1DTranspose(filters=1, kernel_size=3, strides=2, padding='same', activation='sigmoid')(x)
    return Model([latent_inputs, condition_inputs], decoder_outputs, name='decoder')

class CVAE(Model):
    def __init__(self, encoder, decoder, **kwargs):
        super(CVAE, self).__init__(**kwargs)
        self.encoder = encoder
        self.decoder = decoder
        self.total_loss_tracker = tf.keras.metrics.Mean(name="total_loss")
        self.reconstruction_loss_tracker = tf.keras.metrics.Mean(name="reconstruction_loss")
        self.kl_loss_tracker = tf.keras.metrics.Mean(name="kl_loss")

    @property
    def metrics(self):
        return [self.total_loss_tracker, self.reconstruction_loss_tracker, self.kl_loss_tracker]

    def train_step(self, data):
        x, condition = data
        with tf.GradientTape() as tape:
            z_mean, z_log_var, z = self.encoder([x, condition])
            reconstruction = self.decoder([z, condition])
            reconstruction_loss = tf.reduce_mean(tf.keras.losses.mse(x, reconstruction))
            kl_loss = -0.5 * tf.reduce_mean(tf.reduce_sum(1 + z_log_var - tf.square(z_mean) - tf.exp(z_log_var), axis=1))
            total_loss = reconstruction_loss + 0.1 * kl_loss  # Giảm trọng số kl_loss
        grads = tape.gradient(total_loss, self.trainable_weights)
        self.optimizer.apply_gradients(zip(grads, self.trainable_weights))
        self.total_loss_tracker.update_state(total_loss)
        self.reconstruction_loss_tracker.update_state(reconstruction_loss)
        self.kl_loss_tracker.update_state(kl_loss)
        return {"loss": self.total_loss_tracker.result(), "reconstruction_loss": self.reconstruction_loss_tracker.result(), "kl_loss": self.kl_loss_tracker.result()}

    def test_step(self, data):
        x, condition = data
        z_mean, z_log_var, z = self.encoder([x, condition])
        reconstruction = self.decoder([z, condition])
        reconstruction_loss = tf.reduce_mean(tf.keras.losses.mse(x, reconstruction))
        kl_loss = -0.5 * tf.reduce_mean(tf.reduce_sum(1 + z_log_var - tf.square(z_mean) - tf.exp(z_log_var), axis=1))
        total_loss = reconstruction_loss + 0.1 * kl_loss
        self.total_loss_tracker.update_state(total_loss)
        self.reconstruction_loss_tracker.update_state(reconstruction_loss)
        self.kl_loss_tracker.update_state(kl_loss)
        return {"loss": self.total_loss_tracker.result(), "reconstruction_loss": self.reconstruction_loss_tracker.result(), "kl_loss": self.kl_loss_tracker.result()}

    def generate(self, condition, z=None):
        if z is None:
            z = tf.random.normal(shape=(condition.shape[0], latent_dim))
        return self.decoder([z, condition])

print("Đang xây dựng mô hình CVAE...")
encoder = build_encoder(input_dim, condition_dim, latent_dim, filters)
decoder = build_decoder(latent_dim, condition_dim, input_dim, filters)
cvae = CVAE(encoder, decoder)
cvae.build(input_shape=[(None, input_dim, 1), (None, condition_dim)])
cvae.compile(optimizer=Adam(learning_rate=learning_rate))

encoder.summary()
decoder.summary()

train_dataset = tf.data.Dataset.from_tensor_slices((X_train, condition_train)).shuffle(10000).batch(batch_size)
test_dataset = tf.data.Dataset.from_tensor_slices((X_test, condition_test)).batch(batch_size)

for x_batch, condition_batch in train_dataset.take(1):
    print("Batch x shape:", x_batch.shape)
    print("Batch condition shape:", condition_batch.shape)

log_dir = os.path.join(model_path, "logs", datetime.datetime.now().strftime("%Y%m%d-%H%M%S"))
tensorboard_callback = tf.keras.callbacks.TensorBoard(log_dir=log_dir, histogram_freq=1)
checkpoint_path = os.path.join(model_path, "cvae_checkpoint.weights.h5")
checkpoint_callback = tf.keras.callbacks.ModelCheckpoint(filepath=checkpoint_path, save_weights_only=True, monitor='val_loss', mode='min', save_best_only=True)
reduce_lr = tf.keras.callbacks.ReduceLROnPlateau(monitor='val_loss', factor=0.5, patience=10, min_lr=1e-6)

print("\nBắt đầu huấn luyện mô hình...")
start_time = time.time()
history = cvae.fit(
    train_dataset,
    epochs=epochs,
    validation_data=test_dataset,
    callbacks=[tensorboard_callback, checkpoint_callback, reduce_lr]
)
training_time = time.time() - start_time
print(f"\nHuấn luyện hoàn tất trong {training_time:.2f} giây.")

cvae.save_weights(os.path.join(model_path, 'cvae_final.weights.h5'))
print(f"Đã lưu mô hình tại: {os.path.join(model_path, 'cvae_final.weights.h5')}")

plt.figure(figsize=(15, 5))
plt.subplot(1, 3, 1)
plt.plot(history.history['loss'], label='Train')
plt.plot(history.history['val_loss'], label='Validation')
plt.title('Total Loss')
plt.xlabel('Epoch')
plt.ylabel('Loss')
plt.legend()
plt.grid(True, alpha=0.3)

plt.subplot(1, 3, 2)
plt.plot(history.history['reconstruction_loss'], label='Train')
plt.plot(history.history['val_reconstruction_loss'], label='Validation')
plt.title('Reconstruction Loss')
plt.xlabel('Epoch')
plt.ylabel('Loss')
plt.legend()
plt.grid(True, alpha=0.3)

plt.subplot(1, 3, 3)
plt.plot(history.history['kl_loss'], label='Train')
plt.plot(history.history['val_kl_loss'], label='Validation')
plt.title('KL Loss')
plt.xlabel('Epoch')
plt.ylabel('Loss')
plt.legend()
plt.grid(True, alpha=0.3)

plt.tight_layout()
plt.savefig(os.path.join(figures_path, 'training_history.png'))
plt.close()

print("\nKiểm thử tạo tín hiệu PPG với HR, RR từ phân phối chuẩn...")
hr_mean, hr_std = np.mean(hr_train), np.std(hr_train)
rr_mean, rr_std = np.mean(rr_train), np.std(rr_train)
num_samples = 5
hr_samples = np.random.normal(hr_mean, hr_std, num_samples)
rr_samples = np.random.normal(rr_mean, rr_std, num_samples)
condition_samples = tf.convert_to_tensor(np.column_stack((hr_samples, rr_samples)), dtype=tf.float32)
generated_ppg = cvae.generate(condition_samples)

plt.figure(figsize=(15, 5))
for i in range(num_samples):
    plt.plot(generated_ppg[i, :, 0], label=f"Sample {i+1} (HR={hr_samples[i]:.2f}, RR={rr_samples[i]:.2f})")
plt.title('Generated PPG Signals with Normal Distribution Conditions')
plt.xlabel('Time')
plt.ylabel('Amplitude')
plt.legend()
plt.grid(True, alpha=0.3)
plt.savefig(os.path.join(figures_path, 'generated_ppg_normal.png'))
plt.close()

with open(os.path.join(model_path, 'training_info.txt'), 'w') as f:
    f.write("THÔNG TIN HUẤN LUYỆN MÔ HÌNH CVAE\n")
    f.write("=================================\n\n")
    f.write("Tham số huấn luyện:\n")
    f.write(f"- Kích thước batch: {batch_size}\n")
    f.write(f"- Số epoch: {epochs}\n")
    f.write(f"- Tốc độ học ban đầu: {learning_rate}\n")
    f.write(f"- Số bộ lọc Conv1D: {filters}\n")
    f.write(f"- Kích thước không gian tiềm ẩn: {latent_dim}\n\n")
    f.write("Kết quả huấn luyện:\n")
    f.write(f"- Số epoch đã huấn luyện: {len(history.history['loss'])}\n")
    f.write(f"- Loss cuối cùng (train): {history.history['loss'][-1]:.4f}\n")
    f.write(f"- Loss cuối cùng (validation): {history.history['val_loss'][-1]:.4f}\n")
    f.write(f"- Thời gian huấn luyện: {training_time:.2f} giây\n")

print("\nQuá trình huấn luyện đã hoàn tất. Thông tin huấn luyện và phân tích hội tụ đã được lưu vào training_info.txt.")

Đang tải dữ liệu đã tiền xử lý...
Đang xây dựng mô hình CVAE...


Batch x shape: (64, 1000, 1)
Batch condition shape: (64, 2)

Bắt đầu huấn luyện mô hình...
Epoch 1/300
[1m79/79[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m24s[0m 141ms/step - kl_loss: 19.6665 - loss: 2.0016 - reconstruction_loss: 0.0350 - val_kl_loss: 0.2589 - val_loss: 0.0599 - val_reconstruction_loss: 0.0340 - learning_rate: 1.0000e-04
Epoch 2/300
[1m79/79[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m2s[0m 26ms/step - kl_loss: 0.2198 - loss: 0.0562 - reconstruction_loss: 0.0342 - val_kl_loss: 0.1575 - val_loss: 0.0496 - val_reconstruction_loss: 0.0339 - learning_rate: 1.0000e-04
Epoch 3/300
[1m79/79[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m2s[0m 24ms/step - kl_loss: 0.1291 - loss: 0.0467 - reconstruction_loss: 0.0338 - val_kl_loss: 0.0800 - val_loss: 0.0417 - val_reconstruction_loss: 0.0337 - learning_rate: 1.0000e-04
Epoch 4/300
[1m79/79[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m3s[0m 24ms/step - kl_loss: 0.0663 - loss: 0.0405 - reconstruction_loss: 0.0338 -

# **analyze_fourier**

In [6]:
import numpy as np
import matplotlib.pyplot as plt
import tensorflow as tf
import os
from scipy.fft import fft, fftfreq

# Đường dẫn đến dữ liệu và mô hình
processed_data_path = '/content/drive/MyDrive/bidmc/processed'
model_path = '/content/drive/MyDrive/bidmc/models'
figures_path = '/content/drive/MyDrive/bidmc/figures/fourier'

# Tải dữ liệu kiểm thử
print("Đang tải dữ liệu kiểm thử...")
X_test = np.load(os.path.join(processed_data_path, 'ppg_test.npy'))
hr_test = np.load(os.path.join(processed_data_path, 'hr_test.npy'))
rr_test = np.load(os.path.join(processed_data_path, 'rr_test.npy'))
condition_test = np.column_stack((hr_test, rr_test))

print(f"Kích thước dữ liệu kiểm thử: {X_test.shape}")

# Định dạng lại dữ liệu PPG thành 3D (nếu chưa có)
if len(X_test.shape) == 2:
    X_test = X_test[..., np.newaxis]  # [samples, timesteps, 1]

# Tải mô hình CVAE đã huấn luyện
print("Đang tải mô hình CVAE...")
# Giả sử cvae đã được định nghĩa trong train_cvae_fixed
# Nếu chưa, cần tải lại mô hình từ weights
latent_dim = 32
condition_dim = 2
input_dim = 1000
filters = [256, 128, 64]

def build_encoder(input_dim, condition_dim, latent_dim, filters):
    encoder_inputs = tf.keras.layers.Input(shape=(input_dim, 1), name='encoder_input')
    condition_inputs = tf.keras.layers.Input(shape=(condition_dim,), name='condition_input')
    x = encoder_inputs
    for f in filters:
        x = tf.keras.layers.Conv1D(filters=f, kernel_size=3, strides=2, padding='same', activation='relu')(x)
        x = tf.keras.layers.BatchNormalization()(x)
    x = tf.keras.layers.Flatten()(x)
    condition_expanded = tf.keras.layers.Dense(128, activation='relu')(condition_inputs)
    x = tf.keras.layers.Concatenate()([x, condition_expanded])
    z_mean = tf.keras.layers.Dense(latent_dim, name='z_mean')(x)
    z_log_var = tf.keras.layers.Dense(latent_dim, name='z_log_var')(x)
    z = Sampling()([z_mean, z_log_var])
    return tf.keras.Model([encoder_inputs, condition_inputs], [z_mean, z_log_var, z], name='encoder')

def build_decoder(latent_dim, condition_dim, input_dim, filters):
    latent_inputs = tf.keras.layers.Input(shape=(latent_dim,), name='latent_input')
    condition_inputs = tf.keras.layers.Input(shape=(condition_dim,), name='condition_input')
    x = tf.keras.layers.Concatenate()([latent_inputs, condition_inputs])
    x = tf.keras.layers.Dense(input_dim // 8 * filters[-1], activation='relu')(x)
    x = tf.keras.layers.Reshape((input_dim // 8, filters[-1]))(x)
    for f in reversed(filters[:-1]):
        x = tf.keras.layers.Conv1DTranspose(filters=f, kernel_size=3, strides=2, padding='same', activation='relu')(x)
        x = tf.keras.layers.BatchNormalization()(x)
    decoder_outputs = tf.keras.layers.Conv1DTranspose(filters=1, kernel_size=3, strides=2, padding='same', activation='sigmoid')(x)
    return tf.keras.Model([latent_inputs, condition_inputs], decoder_outputs, name='decoder')

class Sampling(tf.keras.layers.Layer):
    def call(self, inputs):
        z_mean, z_log_var = inputs
        batch = tf.shape(z_mean)[0]
        dim = tf.shape(z_mean)[1]
        epsilon = tf.keras.backend.random_normal(shape=(batch, dim))
        return z_mean + tf.exp(0.5 * z_log_var) * epsilon

class CVAE(tf.keras.Model):
    def __init__(self, encoder, decoder, **kwargs):
        super(CVAE, self).__init__(**kwargs)
        self.encoder = encoder
        self.decoder = decoder

    def generate(self, condition, z=None):
        if z is None:
            z = tf.random.normal(shape=(condition.shape[0], latent_dim))
        return self.decoder([z, condition])

# Khởi tạo và tải trọng số mô hình
encoder = build_encoder(input_dim, condition_dim, latent_dim, filters)
decoder = build_decoder(latent_dim, condition_dim, input_dim, filters)
cvae = CVAE(encoder, decoder)
cvae.build(input_shape=[(None, input_dim, 1), (None, condition_dim)])
cvae.load_weights(os.path.join(model_path, 'cvae_final.weights.h5'))

# Chọn một số mẫu ngẫu nhiên để phân tích
num_samples = 5
test_indices = np.random.choice(len(X_test), num_samples, replace=False)
test_conditions = tf.convert_to_tensor(condition_test[test_indices], dtype=tf.float32)
original_ppg = X_test[test_indices]
generated_ppg = cvae.generate(test_conditions)

# Hàm phân tích phổ tần số sử dụng FFT
def analyze_fourier(signal, fs=125, title=""):
    N = len(signal)
    T = 1.0 / fs
    yf = fft(signal)
    xf = fftfreq(N, T)[:N//2]
    power = 2.0/N * np.abs(yf[0:N//2])
    return xf, power

# Phân tích phổ tần số cho tín hiệu gốc và tín hiệu sinh ra
fs = 125  # Tần số lấy mẫu
plt.figure(figsize=(15, 10))

for i in range(num_samples):
    # Tín hiệu gốc
    original_signal = original_ppg[i, :, 0]  # Lấy kênh đầu tiên
    xf_orig, power_orig = analyze_fourier(original_signal, fs)

    # Tín hiệu sinh ra
    generated_signal = generated_ppg[i, :, 0]  # Lấy kênh đầu tiên
    xf_gen, power_gen = analyze_fourier(generated_signal, fs)

    # Vẽ phổ tần số
    plt.subplot(num_samples, 2, 2*i + 1)
    plt.plot(xf_orig, power_orig)
    plt.title(f"Original PPG - Sample {i+1} (HR={test_conditions[i, 0]:.2f}, RR={test_conditions[i, 1]:.2f})")
    plt.xlabel("Frequency (Hz)")
    plt.ylabel("Power")
    plt.grid(True, alpha=0.3)

    plt.subplot(num_samples, 2, 2*i + 2)
    plt.plot(xf_gen, power_gen)
    plt.title(f"Generated PPG - Sample {i+1}")
    plt.xlabel("Frequency (Hz)")
    plt.ylabel("Power")
    plt.grid(True, alpha=0.3)

plt.tight_layout()
plt.savefig(os.path.join(figures_path, 'fourier_analysis.png'))
plt.close()

# Lưu thông tin phân tích
with open(os.path.join(figures_path, 'fourier_analysis_info.txt'), 'w') as f:
    f.write("PHÂN TÍCH PHỔ TẦN SỐ\n")
    f.write("=====================\n\n")
    f.write(f"Số mẫu phân tích: {num_samples}\n")
    f.write(f"Tần số lấy mẫu: {fs} Hz\n")
    f.write(f"Độ dài tín hiệu: {input_dim} mẫu\n\n")
    f.write("Thông tin mẫu:\n")
    for i in range(num_samples):
        f.write(f"- Mẫu {i+1}: HR={test_conditions[i, 0]:.2f}, RR={test_conditions[i, 1]:.2f}\n")

print("Phân tích phổ tần số hoàn tất. Kết quả đã được lưu vào thư mục figures.")

Đang tải dữ liệu kiểm thử...
Kích thước dữ liệu kiểm thử: (1262, 1000)
Đang tải mô hình CVAE...
Phân tích phổ tần số hoàn tất. Kết quả đã được lưu vào thư mục figures.


# **visualize_and_evaluate**

In [7]:
import numpy as np
import matplotlib.pyplot as plt
import os
import pandas as pd
from scipy.signal import welch
from scipy.fft import fft, fftfreq
from sklearn.decomposition import PCA
from sklearn.manifold import TSNE
import tensorflow as tf

# Đường dẫn đến dữ liệu đã tiền xử lý
processed_data_path = '/content/drive/MyDrive/bidmc/processed'
model_path = '/content/drive/MyDrive/bidmc/models'
figures_path = '/content/drive/MyDrive/bidmc/figures/visualize'
results_path = '/content/drive/MyDrive/bidmc/results'

# Tạo thư mục nếu chưa tồn tại
os.makedirs(results_path, exist_ok=True)
os.makedirs(figures_path, exist_ok=True)

# Tải dữ liệu kiểm thử
print("Đang tải dữ liệu kiểm thử...")
X_test = np.load(os.path.join(processed_data_path, 'ppg_test.npy'))
hr_test = np.load(os.path.join(processed_data_path, 'hr_test.npy'))
rr_test = np.load(os.path.join(processed_data_path, 'rr_test.npy'))

print(f"Kích thước dữ liệu kiểm thử: {X_test.shape}")

# Định dạng lại dữ liệu PPG thành 3D (nếu chưa có)
if len(X_test.shape) == 2:
    X_test = X_test[..., np.newaxis]  # [samples, timesteps, 1]

# Tải kết quả phân tích Fourier
print("Đang tải kết quả phân tích Fourier...")
fourier_results_path = os.path.join(results_path, 'frequency_analysis_results.csv')
if os.path.exists(fourier_results_path):
    fourier_results = pd.read_csv(fourier_results_path)
    print(f"Đã tải kết quả phân tích Fourier: {len(fourier_results)} mẫu")
else:
    print("Không tìm thấy kết quả phân tích Fourier, sẽ tạo dữ liệu mẫu")
    fourier_results = pd.DataFrame({
        'Sample': range(1, 11),
        'HR': np.random.uniform(0.3, 0.6, 10),
        'RR': np.random.uniform(0.1, 0.4, 10),
        'MSE_Time': np.random.uniform(0.1, 0.5, 10),
        'PSNR': np.random.uniform(3, 8, 10),
        'Corr': np.random.uniform(-0.5, 0.7, 10),
        'MSE_Freq': np.random.uniform(0.0001, 0.01, 10),
        'Orig_Peak1_Freq': np.random.uniform(1.0, 2.0, 10),
        'Orig_Peak2_Freq': np.random.uniform(2.0, 3.0, 10),
        'Orig_Peak3_Freq': np.random.uniform(3.0, 4.0, 10),
        'Gen_Peak1_Freq': np.random.uniform(1.0, 2.0, 10),
        'Gen_Peak2_Freq': np.random.uniform(2.0, 3.0, 10),
        'Gen_Peak3_Freq': np.random.uniform(3.0, 4.0, 10)
    })

# Tải mô hình CVAE thật
print("Đang tải mô hình CVAE thật...")
latent_dim = 32
condition_dim = 2
input_dim = 1000
filters = [256, 128, 64]

def build_encoder(input_dim, condition_dim, latent_dim, filters):
    encoder_inputs = tf.keras.layers.Input(shape=(input_dim, 1), name='encoder_input')
    condition_inputs = tf.keras.layers.Input(shape=(condition_dim,), name='condition_input')
    x = encoder_inputs
    for f in filters:
        x = tf.keras.layers.Conv1D(filters=f, kernel_size=3, strides=2, padding='same', activation='relu')(x)
        x = tf.keras.layers.BatchNormalization()(x)
    x = tf.keras.layers.Flatten()(x)
    condition_expanded = tf.keras.layers.Dense(128, activation='relu')(condition_inputs)
    x = tf.keras.layers.Concatenate()([x, condition_expanded])
    z_mean = tf.keras.layers.Dense(latent_dim, name='z_mean')(x)
    z_log_var = tf.keras.layers.Dense(latent_dim, name='z_log_var')(x)
    z = Sampling()([z_mean, z_log_var])
    return tf.keras.Model([encoder_inputs, condition_inputs], [z_mean, z_log_var, z], name='encoder')

def build_decoder(latent_dim, condition_dim, input_dim, filters):
    latent_inputs = tf.keras.layers.Input(shape=(latent_dim,), name='latent_input')
    condition_inputs = tf.keras.layers.Input(shape=(condition_dim,), name='condition_input')
    x = tf.keras.layers.Concatenate()([latent_inputs, condition_inputs])
    x = tf.keras.layers.Dense(input_dim // 8 * filters[-1], activation='relu')(x)
    x = tf.keras.layers.Reshape((input_dim // 8, filters[-1]))(x)
    for f in reversed(filters[:-1]):
        x = tf.keras.layers.Conv1DTranspose(filters=f, kernel_size=3, strides=2, padding='same', activation='relu')(x)
        x = tf.keras.layers.BatchNormalization()(x)
    decoder_outputs = tf.keras.layers.Conv1DTranspose(filters=1, kernel_size=3, strides=2, padding='same', activation='sigmoid')(x)
    return tf.keras.Model([latent_inputs, condition_inputs], decoder_outputs, name='decoder')

class Sampling(tf.keras.layers.Layer):
    def call(self, inputs):
        z_mean, z_log_var = inputs
        batch = tf.shape(z_mean)[0]
        dim = tf.shape(z_mean)[1]
        epsilon = tf.keras.backend.random_normal(shape=(batch, dim))
        return z_mean + tf.exp(0.5 * z_log_var) * epsilon

class CVAE(tf.keras.Model):
    def __init__(self, encoder, decoder, **kwargs):
        super(CVAE, self).__init__(**kwargs)
        self.encoder = encoder
        self.decoder = decoder

    def generate(self, condition, z=None):
        if z is None:
            z = tf.random.normal(shape=(condition.shape[0], latent_dim))
        return self.decoder([z, condition])

# Khởi tạo và tải trọng số mô hình
encoder = build_encoder(input_dim, condition_dim, latent_dim, filters)
decoder = build_decoder(latent_dim, condition_dim, input_dim, filters)
cvae = CVAE(encoder, decoder)
cvae.build(input_shape=[(None, input_dim, 1), (None, condition_dim)])
cvae.load_weights(os.path.join(model_path, 'cvae_final.weights.h5'))

# Chuẩn bị dữ liệu điều kiện
condition_test = np.column_stack((hr_test, rr_test))

# Chọn một số mẫu để trực quan hóa
num_samples = 20
test_indices = np.random.choice(len(X_test), num_samples, replace=False)
test_conditions = tf.convert_to_tensor(condition_test[test_indices], dtype=tf.float32)
original_ppg = X_test[test_indices]
generated_ppg = cvae.generate(test_conditions)

# 1. Trực quan hóa tín hiệu PPG gốc và tín hiệu tổng hợp
print("\n1. Trực quan hóa tín hiệu PPG gốc và tín hiệu tổng hợp")
plt.figure(figsize=(15, 20))
for i in range(min(10, num_samples)):
    plt.subplot(10, 2, 2*i+1)
    plt.plot(original_ppg[i, :, 0])  # Lấy kênh đầu tiên
    plt.title(f'Original PPG (HR={test_conditions[i,0]:.2f}, RR={test_conditions[i,1]:.2f})')
    plt.xlabel('Sample')
    plt.ylabel('Amplitude')
    plt.grid(True, alpha=0.3)

    plt.subplot(10, 2, 2*i+2)
    plt.plot(generated_ppg[i, :, 0])  # Lấy kênh đầu tiên
    plt.title(f'Generated PPG (HR={test_conditions[i,0]:.2f}, RR={test_conditions[i,1]:.2f})')
    plt.xlabel('Sample')
    plt.ylabel('Amplitude')
    plt.grid(True, alpha=0.3)

plt.tight_layout()
plt.savefig(os.path.join(figures_path, 'original_vs_generated_comparison.png'))
plt.close()

# 2. Trực quan hóa phân bố HR và RR
print("\n2. Trực quan hóa phân bố HR và RR")
plt.figure(figsize=(15, 5))

plt.subplot(1, 3, 1)
plt.scatter(hr_test, rr_test, alpha=0.5)
plt.title('HR vs RR Distribution')
plt.xlabel('HR')
plt.ylabel('RR')
plt.grid(True, alpha=0.3)

plt.subplot(1, 3, 2)
plt.hist(hr_test, bins=20, alpha=0.7)
plt.title('HR Distribution')
plt.xlabel('HR')
plt.ylabel('Count')
plt.grid(True, alpha=0.3)

plt.subplot(1, 3, 3)
plt.hist(rr_test, bins=20, alpha=0.7)
plt.title('RR Distribution')
plt.xlabel('RR')
plt.ylabel('Count')
plt.grid(True, alpha=0.3)

plt.tight_layout()
plt.savefig(os.path.join(figures_path, 'hr_rr_distribution.png'))
plt.close()

# 3. Trực quan hóa không gian tiềm ẩn
print("\n3. Trực quan hóa không gian tiềm ẩn")
num_latent_samples = 500
latent_samples = np.random.normal(0, 1, (num_latent_samples, latent_dim))
hr_samples = np.random.uniform(np.min(hr_test), np.max(hr_test), num_latent_samples)
rr_samples = np.random.uniform(np.min(rr_test), np.max(rr_test), num_latent_samples)
condition_samples = tf.convert_to_tensor(np.column_stack((hr_samples, rr_samples)), dtype=tf.float32)
generated_samples = cvae.generate(condition_samples)
generated_samples_flat = generated_samples[:, :, 0].numpy()  # Shape: (500, 1000)

pca = PCA(n_components=2)
latent_2d = pca.fit_transform(generated_samples_flat)

plt.figure(figsize=(15, 5))
plt.subplot(1, 2, 1)
scatter = plt.scatter(latent_2d[:, 0], latent_2d[:, 1], c=hr_samples, cmap='viridis', alpha=0.7)
plt.colorbar(scatter, label='HR')
plt.title('Latent Space Visualization (PCA) - HR')
plt.xlabel('Principal Component 1')
plt.ylabel('Principal Component 2')
plt.grid(True, alpha=0.3)

plt.subplot(1, 2, 2)
scatter = plt.scatter(latent_2d[:, 0], latent_2d[:, 1], c=rr_samples, cmap='plasma', alpha=0.7)
plt.colorbar(scatter, label='RR')
plt.title('Latent Space Visualization (PCA) - RR')
plt.xlabel('Principal Component 1')
plt.ylabel('Principal Component 2')
plt.grid(True, alpha=0.3)

plt.tight_layout()
plt.savefig(os.path.join(figures_path, 'latent_space_visualization.png'))
plt.close()

# 4. Trực quan hóa ảnh hưởng của HR và RR đến tín hiệu PPG
print("\n4. Trực quan hóa ảnh hưởng của HR và RR đến tín hiệu PPG")
hr_values = np.linspace(np.min(hr_test), np.max(hr_test), 5)
rr_values = np.linspace(np.min(rr_test), np.max(rr_test), 5)

plt.figure(figsize=(15, 15))
for i, hr in enumerate(hr_values):
    for j, rr in enumerate(rr_values):
        condition = tf.convert_to_tensor([[hr, rr]], dtype=tf.float32)
        ppg = cvae.generate(condition)[0, :, 0]
        plt.subplot(5, 5, i*5+j+1)
        plt.plot(ppg)
        plt.title(f'HR={hr:.2f}, RR={rr:.2f}')
        plt.xlabel('Sample')
        plt.ylabel('Amplitude')
        plt.grid(True, alpha=0.3)

plt.tight_layout()
plt.savefig(os.path.join(figures_path, 'hr_rr_effect_on_ppg.png'))
plt.close()

# 5. Trực quan hóa phổ tần số
print("\n5. Trực quan hóa phổ tần số của tín hiệu PPG với các điều kiện khác nhau")
fs = 125
def analyze_frequency_spectrum(signal, fs):
    n = len(signal)
    yf = fft(signal)
    xf = fftfreq(n, 1/fs)[:n//2]
    yf_abs = 2.0/n * np.abs(yf[0:n//2])
    return xf, yf_abs

plt.figure(figsize=(15, 10))
rr_fixed = np.mean(rr_test)
for i, hr in enumerate(hr_values):
    condition = tf.convert_to_tensor([[hr, rr_fixed]], dtype=tf.float32)
    ppg = cvae.generate(condition)[0, :, 0]
    xf, yf = analyze_frequency_spectrum(ppg, fs)
    plt.subplot(2, 3, i+1)
    plt.plot(xf, yf)
    plt.title(f'FFT (HR={hr:.2f}, RR={rr_fixed:.2f})')
    plt.xlabel('Frequency (Hz)')
    plt.ylabel('Amplitude')
    plt.xlim([0, 10])
    plt.grid(True, alpha=0.3)

plt.tight_layout()
plt.savefig(os.path.join(figures_path, 'hr_effect_on_frequency.png'))
plt.close()

plt.figure(figsize=(15, 10))
hr_fixed = np.mean(hr_test)
for i, rr in enumerate(rr_values):
    condition = tf.convert_to_tensor([[hr_fixed, rr]], dtype=tf.float32)
    ppg = cvae.generate(condition)[0, :, 0]
    xf, yf = analyze_frequency_spectrum(ppg, fs)
    plt.subplot(2, 3, i+1)
    plt.plot(xf, yf)
    plt.title(f'FFT (HR={hr_fixed:.2f}, RR={rr:.2f})')
    plt.xlabel('Frequency (Hz)')
    plt.ylabel('Amplitude')
    plt.xlim([0, 10])
    plt.grid(True, alpha=0.3)

plt.tight_layout()
plt.savefig(os.path.join(figures_path, 'rr_effect_on_frequency.png'))
plt.close()

# 6. Trực quan hóa kết quả đánh giá
print("\n6. Trực quan hóa kết quả đánh giá")
plt.figure(figsize=(15, 10))

plt.subplot(2, 2, 1)
plt.hist(fourier_results['MSE_Time'], bins=10, alpha=0.7)
plt.title('MSE (Time Domain) Distribution')
plt.xlabel('MSE')
plt.ylabel('Count')
plt.grid(True, alpha=0.3)

plt.subplot(2, 2, 2)
plt.hist(fourier_results['PSNR'], bins=10, alpha=0.7)
plt.title('PSNR Distribution')
plt.xlabel('PSNR (dB)')
plt.ylabel('Count')
plt.grid(True, alpha=0.3)

plt.subplot(2, 2, 3)
plt.hist(fourier_results['Corr'], bins=10, alpha=0.7)
plt.title('Correlation Distribution')
plt.xlabel('Correlation')
plt.ylabel('Count')
plt.grid(True, alpha=0.3)

plt.subplot(2, 2, 4)
plt.hist(fourier_results['MSE_Freq'], bins=10, alpha=0.7)
plt.title('MSE (Frequency Domain) Distribution')
plt.xlabel('MSE (Frequency)')
plt.ylabel('Count')
plt.grid(True, alpha=0.3)

plt.tight_layout()
plt.savefig(os.path.join(figures_path, 'evaluation_metrics_distribution.png'))
plt.close()

# 7. Tạo bảng tóm tắt kết quả đánh giá
print("\n7. Tạo bảng tóm tắt kết quả đánh giá")
summary_stats = {
    'MSE_Time': {
        'Mean': fourier_results['MSE_Time'].mean(),
        'Std': fourier_results['MSE_Time'].std(),
        'Min': fourier_results['MSE_Time'].min(),
        'Max': fourier_results['MSE_Time'].max()
    },
    'PSNR': {
        'Mean': fourier_results['PSNR'].mean(),
        'Std': fourier_results['PSNR'].std(),
        'Min': fourier_results['PSNR'].min(),
        'Max': fourier_results['PSNR'].max()
    },
    'Corr': {
        'Mean': fourier_results['Corr'].mean(),
        'Std': fourier_results['Corr'].std(),
        'Min': fourier_results['Corr'].min(),
        'Max': fourier_results['Corr'].max()
    },
    'MSE_Freq': {
        'Mean': fourier_results['MSE_Freq'].mean(),
        'Std': fourier_results['MSE_Freq'].std(),
        'Min': fourier_results['MSE_Freq'].min(),
        'Max': fourier_results['MSE_Freq'].max()
    }
}

summary_df = pd.DataFrame.from_dict(summary_stats, orient='index')
summary_df.to_csv(os.path.join(results_path, 'evaluation_summary.csv'))

with open(os.path.join(results_path, 'model_evaluation_results.txt'), 'w') as f:
    f.write("KẾT QUẢ ĐÁNH GIÁ MÔ HÌNH CVAE\n")
    f.write("==============================\n\n")
    f.write("Tóm tắt các chỉ số đánh giá:\n")
    f.write(f"MSE (miền thời gian): {summary_stats['MSE_Time']['Mean']:.4f} ± {summary_stats['MSE_Time']['Std']:.4f}\n")
    f.write(f"PSNR (dB): {summary_stats['PSNR']['Mean']:.4f} ± {summary_stats['PSNR']['Std']:.4f}\n")
    f.write(f"Corr: {summary_stats['Corr']['Mean']:.4f} ± {summary_stats['Corr']['Std']:.4f}\n")
    f.write(f"MSE (miền tần số): {summary_stats['MSE_Freq']['Mean']:.4f} ± {summary_stats['MSE_Freq']['Std']:.4f}\n")

print("Đã hoàn tất trực quan hóa và lưu kết quả.")

Đang tải dữ liệu kiểm thử...
Kích thước dữ liệu kiểm thử: (1262, 1000)
Đang tải kết quả phân tích Fourier...
Không tìm thấy kết quả phân tích Fourier, sẽ tạo dữ liệu mẫu
Đang tải mô hình CVAE thật...

1. Trực quan hóa tín hiệu PPG gốc và tín hiệu tổng hợp

2. Trực quan hóa phân bố HR và RR

3. Trực quan hóa không gian tiềm ẩn

4. Trực quan hóa ảnh hưởng của HR và RR đến tín hiệu PPG

5. Trực quan hóa phổ tần số của tín hiệu PPG với các điều kiện khác nhau

6. Trực quan hóa kết quả đánh giá

7. Tạo bảng tóm tắt kết quả đánh giá
Đã hoàn tất trực quan hóa và lưu kết quả.
