In [5]:
import scipy.io as sio
from scipy import signal
import matplotlib.pyplot as plt
import numpy as np
import os
import pandas as pd
import csv
import sys
import h5py

In [10]:
#ninapro 데이터셋 불러오기
ninapro_df = pd.DataFrame()
for i in range (1,11):
    adress = f"ninapro_db5/s{i}/S{i}_E2_A1"
    filename = adress
    mat = sio.loadmat(filename)
    emg = mat['emg']
    Restimulus = mat['restimulus']
    rerepetition = mat['rerepetition']
    df_emg = pd.DataFrame(emg)
    df_Restimulus = pd.DataFrame(Restimulus)
#    df_rerepetition = pd.DataFrame(rerepetition)
    df = pd.concat([df_emg, df_Restimulus], axis=1)
#    df = pd.concat([df, df_rerepetition], axis=1)
#    df.columns = ['emg1', 'emg2', 'emg3', 'emg4', 'emg5', 'emg6', 'emg7', 'emg8', 'emg9', 'emg10', 'emg11', 'emg12', 'emg13', 'emg14', 'emg15', 'emg16', 'Restimulus', 'rerepetition']
    df.columns = ['emg1', 'emg2', 'emg3', 'emg4', 'emg5', 'emg6', 'emg7', 'emg8', 'emg9', 'emg10', 'emg11', 'emg12', 'emg13', 'emg14', 'emg15', 'emg16', 'Restimulus']
    ninapro_df = pd.concat([ninapro_df, df])

In [11]:
#upsampling
import pandas as pd
import numpy as np
from scipy import signal
from sklearn.preprocessing import StandardScaler

def preprocess_emg_data(df):
   
    # 설정 값
    ORIGINAL_FS = 200   # 기존 주파수
    TARGET_FS = 1000    # 목표 주파수
    RESAMPLE_RATIO = TARGET_FS / ORIGINAL_FS # 5.0

    # 1. 데이터와 라벨 분리
    # 마지막 컬럼이 Restimulus라고 가정
    feature_cols = df.columns[:-1]  # EMG 채널 16개
    label_col = df.columns[-1]      # Restimulus
    
    print(f"설정 확인: {ORIGINAL_FS}Hz -> {TARGET_FS}Hz 변환 (비율: {RESAMPLE_RATIO}배)")
    
    # 2. 동작(Class)별 구간 자르기
    # 단순히 라벨값(0,1,2..)으로 묶는게 아니라, 시간 순서상 '연속된 동작' 단위로 잘라야 함
    # 라벨이 변하는 지점마다 새로운 그룹 ID 부여
    df['segment_id'] = (df[label_col] != df[label_col].shift()).cumsum()
    
    processed_data_list = []
    labels_list = []
    
    # 그룹별 처리
    print("데이터 변환 진행 중 (Splitting -> Upsampling -> Normalization)...")
    
    for _, group in df.groupby('segment_id'):
        # 현재 구간의 라벨
        current_label = group[label_col].iloc[0]
        
        # (선택사항) 0번 클래스(Rest/휴식)가 학습에 불필요하다면 아래 주석 해제하여 건너뛰기
        # if current_label == 0: continue
        
        # 해당 구간의 EMG 데이터 추출 (Numpy 변환)
        raw_signal = group[feature_cols].values
        
        # 3. 1000Hz Upsampling
        # 변환 후 샘플 수 계산: 현재 길이 * 5
        new_length = int(len(raw_signal) * RESAMPLE_RATIO)
        
        if new_length > 0:
            # Fourier method를 이용한 리샘플링 (신호 손실 최소화)
            upsampled_signal = signal.resample(raw_signal, new_length)
            
            # 4. Z-score 정규화 (Standardization)
            # 각 동작 구간(Segment)마다 독립적으로 정규화 수행
            scaler = StandardScaler()
            normalized_signal = scaler.fit_transform(upsampled_signal)
            
            processed_data_list.append(normalized_signal)
            labels_list.append(current_label)
            
    # 5. 모델 입력을 위한 Padding 및 Numpy Stacking
    # 모델에 넣으려면 모든 데이터의 Time Step(길이)이 같아야 함.
    # 가장 긴 데이터를 기준으로 나머지는 0으로 채움 (Zero-padding)
    
    max_seq_len = max(len(d) for d in processed_data_list)
    num_samples = len(processed_data_list)
    num_channels = len(feature_cols) # 16
    
    # 결과 담을 빈 배열 생성 (Batch, Time, Channel)
    X_padded = np.zeros((num_samples, max_seq_len, num_channels))
    
    # 데이터 채워넣기
    for i, data in enumerate(processed_data_list):
        length = len(data)
        X_padded[i, :length, :] = data  # 앞쪽부터 데이터 채움 (Post-padding 0)
        
    y_labels = np.array(labels_list)
    
    print("-" * 30)
    print("변환 완료!")
    print(f"총 샘플(동작) 개수: {num_samples}")
    print(f"최대 시퀀스 길이 (Max Time Steps): {max_seq_len}")
    print(f"입력 데이터 Shape (X): {X_padded.shape}") # (Batch, Time, 16)
    print(f"라벨 데이터 Shape (y): {y_labels.shape}")
    print("-" * 30)
    
    return X_padded, y_labels


X_up, y_up = preprocess_emg_data(ninapro_df)

# 3. 모델 입력 확인
# 1D CNN + Attention 모델에 입력으로 'X'를, 타겟으로 'y'를 사용하면 됩니다.

설정 확인: 200Hz -> 1000Hz 변환 (비율: 5.0배)
데이터 변환 진행 중 (Splitting -> Upsampling -> Normalization)...
------------------------------
변환 완료!
총 샘플(동작) 개수: 2041
최대 시퀀스 길이 (Max Time Steps): 18880
입력 데이터 Shape (X): (2041, 18880, 16)
라벨 데이터 Shape (y): (2041,)
------------------------------


In [9]:
#nature 데이터셋 불러오기
grasp_mapping = {
    1: 6,
    2: 18,
    3: 7,
    4: 5,
    5: 19,
    6: 0
}

nature_df = pd.DataFrame()
for i in range(1, 9):
    for j in range(1,3):
        for k in range(1,3):
            filename = fr'nature_data\data\participant_{i}\participant{i}_day{j}_block{k}\emg_data.hdf5'
            data_parame = pd.read_csv(fr'nature_data\data\participant_{i}\participant{i}_day{j}_block{k}\trials.csv') 
            nature_data = h5py.File(filename, 'r')
            data_parame['grasp'] = data_parame['grasp'].replace(grasp_mapping)
            for l in range(0, 150):
                df = pd.DataFrame(np.array(nature_data[f"{l}"]))
                df=df.transpose()
                df['Restimulus'] = ''
                df['Restimulus'] = data_parame['grasp'].iloc[l]
                nature_df = pd.concat([nature_df, df], axis=0)
                print(f"nature_df{i}{j}{k}{l} 종료")
nature_df.columns = ['emg1', 'emg2', 'emg3', 'emg4', 'emg5', 'emg6', 'emg7', 'emg8', 'emg9', 'emg10', 'emg11', 'emg12', 'emg13', 'emg14', 'emg15', 'emg16', 'Restimulus']
#nature_df.to_csv('nature_df.csv', index=False)

nature_df1110 종료
nature_df1111 종료
nature_df1112 종료
nature_df1113 종료
nature_df1114 종료
nature_df1115 종료
nature_df1116 종료
nature_df1117 종료
nature_df1118 종료
nature_df1119 종료
nature_df11110 종료
nature_df11111 종료
nature_df11112 종료
nature_df11113 종료
nature_df11114 종료
nature_df11115 종료
nature_df11116 종료
nature_df11117 종료
nature_df11118 종료
nature_df11119 종료
nature_df11120 종료
nature_df11121 종료
nature_df11122 종료
nature_df11123 종료
nature_df11124 종료
nature_df11125 종료
nature_df11126 종료
nature_df11127 종료
nature_df11128 종료
nature_df11129 종료
nature_df11130 종료
nature_df11131 종료
nature_df11132 종료
nature_df11133 종료
nature_df11134 종료
nature_df11135 종료
nature_df11136 종료
nature_df11137 종료
nature_df11138 종료
nature_df11139 종료
nature_df11140 종료
nature_df11141 종료
nature_df11142 종료
nature_df11143 종료
nature_df11144 종료
nature_df11145 종료
nature_df11146 종료
nature_df11147 종료
nature_df11148 종료
nature_df11149 종료
nature_df11150 종료
nature_df11151 종료
nature_df11152 종료
nature_df11153 종료
nature_df11154 종료
nature_df11155 종료
na

KeyboardInterrupt: 

In [None]:
#nature df csv불러오는 코드
nature_df = pd.read_csv('nature_df.csv')
nature_df

Unnamed: 0,emg1,emg2,emg3,emg4,emg5,emg6,emg7,emg8,emg9,emg10,emg11,emg12,emg13,emg14,emg15,emg16,Restimulus
0,0.000038,0.000025,0.000008,0.000008,-0.000016,-0.000002,-0.000005,-0.000010,0.000017,0.000061,-0.000008,-0.000008,-0.000022,-0.000008,-0.000016,-0.000013,7
1,0.000020,0.000026,0.000010,0.000008,-0.000017,-0.000002,-0.000008,-0.000007,0.000014,0.000043,-0.000011,-0.000009,-0.000022,-0.000012,-0.000016,-0.000018,7
2,0.000009,0.000026,0.000011,0.000008,-0.000024,-0.000004,-0.000013,-0.000005,0.000014,0.000025,-0.000015,-0.000011,-0.000018,-0.000013,-0.000013,-0.000016,7
3,0.000012,0.000023,0.000009,0.000007,-0.000041,-0.000009,-0.000016,-0.000006,0.000012,0.000010,-0.000017,-0.000012,-0.000014,-0.000013,-0.000008,-0.000013,7
4,0.000021,0.000020,0.000006,0.000005,-0.000044,-0.000015,-0.000018,-0.000008,0.000007,0.000003,-0.000016,-0.000011,-0.000012,-0.000014,-0.000006,-0.000012,7
...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...
47973915,0.000030,0.000042,0.000010,0.000012,-0.000030,-0.000011,-0.000027,-0.000002,-0.000092,-0.000030,-0.000013,-0.000016,-0.000010,-0.000008,-0.000013,-0.000011,18
47973916,0.000030,0.000060,0.000011,0.000013,-0.000030,-0.000009,-0.000026,-0.000013,-0.000086,-0.000012,-0.000010,-0.000015,-0.000009,-0.000008,-0.000014,-0.000011,18
47973917,0.000024,0.000074,0.000012,0.000014,-0.000029,-0.000006,-0.000025,-0.000014,-0.000072,0.000002,-0.000010,-0.000016,-0.000011,-0.000008,-0.000014,-0.000013,18
47973918,0.000015,0.000077,0.000013,0.000016,-0.000027,-0.000005,-0.000021,-0.000014,-0.000051,0.000002,-0.000012,-0.000017,-0.000013,-0.000006,-0.000013,-0.000014,18


In [None]:
#down sampling code
import pandas as pd
import numpy as np
from scipy import signal
from sklearn.preprocessing import StandardScaler
from tqdm import tqdm  # 진행 상황 표시용 (설치 필요: pip install tqdm)

def process_large_emg_data(df):
    """
    4800만 행 규모의 2000Hz EMG 데이터를 처리하여 1D CNN 모델 입력용 Numpy 배열로 변환
    
    Args:
        df (pd.DataFrame): 2000Hz Raw 데이터 (Rows x 17 cols)
                           (1~16 col: EMG 센서, 17 col: Restimulus 클래스)
    
    Returns:
        X_padded (np.array): (Batch_Size, Max_Time_Steps, 16)
        y_labels (np.array): (Batch_Size,)
    """
    
    # ---------------------------------------------------------
    # 1. 설정 및 준비
    # ---------------------------------------------------------
    ORIGINAL_FS = 2000  # 원본 주파수
    TARGET_FS = 1000    # 목표 주파수
    RATIO = TARGET_FS / ORIGINAL_FS  # 0.5 (절반으로 축소)

    feature_cols = df.columns[:-1]  # 앞의 16개 컬럼 (EMG)
    label_col = df.columns[-1]      # 마지막 컬럼 (Restimulus)
    
    print(f"데이터 처리 시작: {len(df)} rows")
    print(f"Sampling Rate 변환: {ORIGINAL_FS}Hz -> {TARGET_FS}Hz (Downsampling)")

    # ---------------------------------------------------------
    # 2. 세그먼트 분할 (Segmentation)
    # Restimulus 값이 바뀌는 지점을 기준으로 그룹 ID 생성
    # ---------------------------------------------------------
    # 대용량 데이터이므로 메모리 효율을 위해 필요한 컬럼만 사용하여 연산
    df['segment_id'] = (df[label_col] != df[label_col].shift()).cumsum()
    
    processed_segments = []
    labels = []
    
    # 그룹핑 (메모리 절약을 위해 groupby 객체를 바로 순회)
    grouped = df.groupby('segment_id')
    
    print(f"총 {len(grouped)}개의 동작 세그먼트가 발견되었습니다. 변환 중...")
    
    # ---------------------------------------------------------
    # 3. 반복 처리 (Downsampling -> Normalization)
    # ---------------------------------------------------------
    for _, group in tqdm(grouped, desc="Processing Segments"):
        # 현재 클래스 라벨
        current_label = group[label_col].iloc[0]
        
        # (옵션) 0번(휴식) 클래스를 제외하려면 아래 주석 해제
        # if current_label == 0: continue

        # 센서 데이터 추출 (Numpy 변환)
        raw_signals = group[feature_cols].to_numpy() # .values 보다 to_numpy() 권장
        
        # 데이터 길이가 너무 짧으면(예: 노이즈) 스킵하는 로직 추가 가능
        if len(raw_signals) < 2:
            continue

        # [Downsampling] 2000Hz -> 1000Hz
        # 목표 샘플 수 계산
        new_num_samples = int(len(raw_signals) * RATIO)
        
        if new_num_samples > 0:
            # Fourier method 리샘플링 (데이터가 많으므로 signal.decimate(x, 2)도 고려 가능)
            # 여기서는 길이를 정확히 제어하기 위해 resample 사용
            resampled_signals = signal.resample(raw_signals, new_num_samples)
            
            # [Z-score Normalization]
            # 각 세그먼트별로 독립적으로 정규화
            scaler = StandardScaler()
            normalized_signals = scaler.fit_transform(resampled_signals)
            
            # 리스트에 저장 (float32로 변환하여 메모리 절약 권장)
            processed_segments.append(normalized_signals.astype(np.float32))
            labels.append(current_label)

    # ---------------------------------------------------------
    # 4. 패딩 (Padding) 및 최종 변환
    # ---------------------------------------------------------
    print("패딩(Padding) 및 최종 배열 생성 중...")
    
    # 가장 긴 시퀀스 길이 찾기
    max_len = max(len(seg) for seg in processed_segments)
    num_samples = len(processed_segments)
    num_channels = len(feature_cols)
    
    # 결과 배열 생성 (메모리 효율을 위해 float32 사용)
    # Shape: (Batch_Size, Max_Time_Steps, Channels)
    X_final = np.zeros((num_samples, max_len, num_channels), dtype=np.float32)
    y_final = np.array(labels, dtype=np.int32)
    
    # 패딩 적용 (Post-padding: 뒤쪽을 0으로 채움)
    for i, seg in enumerate(processed_segments):
        length = len(seg)
        X_final[i, :length, :] = seg
        
    print("-" * 40)
    print("처리가 완료되었습니다.")
    print(f"입력 데이터 Shape (X): {X_final.shape}")
    print(f"라벨 데이터 Shape (y): {y_final.shape}")
    print(f"메모리 사용량(예상): {X_final.nbytes / 1024**3:.2f} GB")
    print("-" * 40)
    
    return X_final, y_final

# 3. 함수 실행
X_down, y_down = process_large_emg_data(nature_df)

데이터 처리 시작: 47973920 rows
Sampling Rate 변환: 2000Hz -> 1000Hz (Downsampling)
총 815개의 동작 세그먼트가 발견되었습니다. 변환 중...


Processing Segments: 100%|██████████| 815/815 [00:37<00:00, 21.51it/s]


패딩(Padding) 및 최종 배열 생성 중...
----------------------------------------
처리가 완료되었습니다.
입력 데이터 Shape (X): (815, 125080, 16)
라벨 데이터 Shape (y): (815,)
메모리 사용량(예상): 6.08 GB
----------------------------------------


In [None]:
#combin data code
import numpy as np
import gc  # 가비지 컬렉션(메모리 관리용)

def merge_datasets(X1, y1, X2, y2):
    """
    서로 다른 길이를 가진 두 개의 3차원 Numpy 배열을 병합합니다.
    가장 긴 시퀀스 길이를 기준으로 Zero-padding을 수행합니다.
    """
    print(f"병합 시작...")
    print(f"데이터셋 1 Shape: {X1.shape}")
    print(f"데이터셋 2 Shape: {X2.shape}")

    # 1. 통합 차원 계산
    # 샘플 수 합계
    total_samples = X1.shape[0] + X2.shape[0]
    # 두 데이터 중 더 긴 시퀀스 길이 선택 (여기서는 125080 예상)
    max_seq_len = max(X1.shape[1], X2.shape[1])
    num_channels = X1.shape[2] # 16

    print(f"통합 후 목표 Shape: ({total_samples}, {max_seq_len}, {num_channels})")
    
    # 2. 메모리 할당 (Float32로 메모리 절약)
    # 한 번에 큰 메모리를 할당하고 데이터를 밀어넣는 방식이 가장 효율적입니다.
    X_final = np.zeros((total_samples, max_seq_len, num_channels), dtype=np.float32)
    y_final = np.zeros((total_samples,), dtype=y1.dtype) # 라벨용

    # 3. 데이터 채워넣기 (Padding 자동 적용)
    # X1 (업샘플링 데이터) 넣기
    # X1의 길이만큼만 앞부분에 채워지고, 나머지는 0으로 남음 (Post-padding 효과)
    len1 = X1.shape[1]
    X_final[:X1.shape[0], :len1, :] = X1
    y_final[:y1.shape[0]] = y1

    # X2 (다운샘플링 데이터) 넣기
    # X1이 끝난 지점부터 시작
    len2 = X2.shape[1]
    X_final[X1.shape[0]:, :len2, :] = X2
    y_final[y1.shape[0]:] = y2

    print("병합 완료.")
    return X_final, y_final

# ========================================================
# [실행 코드] 변수명 분리 및 병합
# ========================================================

print("\n=== 3. 데이터 병합 (Merging) ===")
# 병합 함수 실행
X_combined, y_combined = merge_datasets(X_up, y_up, X_down, y_down)

# 메모리 확보를 위해 이전 변수 삭제 (선택사항)
del X_up, y_up, X_down, y_down
gc.collect()

print("-" * 40)
print(f"최종 모델 입력 데이터 Shape (X): {X_combined.shape}")
print(f"최종 모델 라벨 데이터 Shape (y): {y_combined.shape}")
print(f"데이터 타입: {X_combined.dtype}")
print("-" * 40)

# 이 X_combined, y_combined를 1D CNN Encoder Attention 모델에 넣으시면 됩니다.


=== 3. 데이터 병합 (Merging) ===
병합 시작...
데이터셋 1 Shape: (2041, 18880, 16)
데이터셋 2 Shape: (815, 125080, 16)
통합 후 목표 Shape: (2856, 125080, 16)
병합 완료.
----------------------------------------
최종 모델 입력 데이터 Shape (X): (2856, 125080, 16)
최종 모델 라벨 데이터 Shape (y): (2856,)
데이터 타입: float32
----------------------------------------


In [15]:
import numpy as np
import os

# 저장할 폴더 생성 (현재 경로에 data 폴더 생성)
save_dir = './processed_data'
if not os.path.exists(save_dir):
    os.makedirs(save_dir)

print(f"데이터 저장을 시작합니다. 대상 폴더: {save_dir}")

# ========================================================
# Method 1: 일반 .npy 파일로 저장 (속도 빠름, 용량 큼)
# ========================================================
# X_combined.npy와 y_combined.npy로 각각 저장됩니다.
# 예상 용량: 약 23GB

print("1. X_combined.npy 저장 중... (시간이 소요될 수 있습니다)")
np.save(os.path.join(save_dir, 'X_combined.npy'), X_combined)

print("2. y_combined.npy 저장 중...")
np.save(os.path.join(save_dir, 'y_combined.npy'), y_combined)

print("일반 저장 완료.")

# ========================================================
# Method 2: 압축된 .npz 파일로 저장 (권장)
# ========================================================
# 패딩으로 채워진 0이 많으므로 용량이 1/10 이하로 줄어들 가능성이 큽니다.
# 나중에 로드할 때는 np.load()['X'] 형태로 불러옵니다.

save_path_compressed = os.path.join(save_dir, 'emg_data_compressed.npz')
print(f"3. 압축 저장 시작 (권장): {save_path_compressed} ...")

np.savez_compressed(save_path_compressed, X=X_combined, y=y_combined)

print("모든 저장이 완료되었습니다.")

데이터 저장을 시작합니다. 대상 폴더: ./processed_data
1. X_combined.npy 저장 중... (시간이 소요될 수 있습니다)
2. y_combined.npy 저장 중...
일반 저장 완료.
3. 압축 저장 시작 (권장): ./processed_data\emg_data_compressed.npz ...
모든 저장이 완료되었습니다.


In [None]:
import torch
import torch.nn as nn
import torch.optim as optim
from torch.utils.data import Dataset, DataLoader
import numpy as np
from tqdm import tqdm

# ==========================================
# 1. Memory-Efficient Dataset (대용량 처리용)
# ==========================================
class LargeEMGDataset(Dataset):
    def __init__(self, x_path, y_path):
        """
        mmap_mode='r'을 사용하여 데이터를 메모리에 다 올리지 않고
        디스크에서 필요한 부분만 읽어옵니다.
        """
        # 실제 데이터 로드는 아니고 포인터만 생성
        self.X = np.load(x_path, mmap_mode='r')
        self.y = np.load(y_path, mmap_mode='r')
        
    def __len__(self):
        return self.X.shape[0]

    def __getitem__(self, idx):
        # 1. 디스크에서 해당 인덱스 데이터만 읽음
        # 데이터 원본 Shape: (Batch, Time, Channel) -> (125080, 16) 등
        data = self.X[idx].astype(np.float32)
        label = self.y[idx].astype(np.longlong)
        
        # 2. PyTorch 포맷으로 변환 (Channel-First)
        # 입력: (Time, Channel) -> 출력: (Channel, Time)
        # 주의: 1D CNN은 (Batch, Channel, Time) 형태를 원하지만,
        # 우리 모델 내부에서 다시 (Batch*Channel, 1, Time)으로 바꿀 것이므로
        # 여기서는 (Channel, Time)으로 넘겨줍니다.
        data_tensor = torch.from_numpy(data).transpose(0, 1) 
        
        return data_tensor, torch.tensor(label)

# ==========================================
# 2. Model Architecture (이론 기반 구현)
# ==========================================
class ChannelWiseEncoderAttention(nn.Module):
    def __init__(self, time_steps, num_classes, embedding_dim=64):
        super(ChannelWiseEncoderAttention, self).__init__()
        
        self.embedding_dim = embedding_dim
        
        # [2.2] Channel-wise Shared Encoder (f_theta)
        # 모든 채널이 이 파라미터를 공유합니다.
        # Input: (Batch * Channels, 1, Time)
        self.shared_encoder = nn.Sequential(
            nn.Conv1d(1, 16, kernel_size=64, stride=2, padding=32),
            nn.BatchNorm1d(16),
            nn.ReLU(),
            nn.MaxPool1d(2),
            
            nn.Conv1d(16, 32, kernel_size=32, stride=2, padding=16),
            nn.BatchNorm1d(32),
            nn.ReLU(),
            nn.MaxPool1d(2),
            
            nn.Conv1d(32, 64, kernel_size=16, stride=2, padding=8),
            nn.BatchNorm1d(64),
            nn.ReLU(),
            nn.AdaptiveAvgPool1d(1), # Time 차원을 1로 압축
            nn.Flatten()             # (B*C, 64)
        )
        
        # Encoder 출력 차원을 embedding_dim으로 맞춤
        self.projection = nn.Linear(64, embedding_dim)

        # [2.3] Attention Mechanism (Aggregation)
        # 채널별 중요도(Scalar)를 계산하기 위한 레이어
        self.attn_layer = nn.Sequential(
            nn.Linear(embedding_dim, 32),
            nn.Tanh(),
            nn.Linear(32, 1) # 스칼라 점수 출력
        )
        
        # [Classifier]
        self.classifier = nn.Sequential(
            nn.Linear(embedding_dim, 64),
            nn.ReLU(),
            nn.Dropout(0.5),
            nn.Linear(64, num_classes)
        )

    def forward(self, x):
        # Input x: (Batch, Channels, Time)
        B, C, T = x.shape
        
        # -------------------------------------------------------
        # Step 1: Reshape for Shared Encoder (Channel-wise Processing)
        # 각 채널을 독립적인 샘플로 취급: (Batch * Channels, 1, Time)
        # -------------------------------------------------------
        x_reshaped = x.view(B * C, 1, T)
        
        # -------------------------------------------------------
        # Step 2: Encode (f_theta)
        # h: (Batch * Channels, Embedding_Dim)
        # -------------------------------------------------------
        features = self.shared_encoder(x_reshaped)
        features = self.projection(features)
        
        # 다시 배치 단위로 복구: (Batch, Channels, Embedding_Dim)
        features = features.view(B, C, self.embedding_dim)
        
        # -------------------------------------------------------
        # Step 3: Attention Pooling (Aggregation)
        # 각 채널의 feature에 대해 중요도(alpha) 계산
        # -------------------------------------------------------
        # scores: (Batch, Channels, 1)
        scores = self.attn_layer(features) 
        
        # weights: (Batch, Channels, 1) - 채널 차원(dim=1)에 대해 Softmax
        attn_weights = torch.softmax(scores, dim=1)
        
        # Weighted Sum: (Batch, Embedding_Dim)
        # z = Sum(alpha_c * h_c)
        z = (features * attn_weights).sum(dim=1)
        
        # -------------------------------------------------------
        # Step 4: Classifier
        # -------------------------------------------------------
        logits = self.classifier(z)
        
        return logits

# ==========================================
# 3. Execution Script
# ==========================================
def run_training():
    # 파일 경로 설정
    X_PATH = './processed_data/X_combined.npy'
    Y_PATH = './processed_data/y_combined.npy'
    
    # 1. 데이터셋 준비 (mmap 사용)
    # y 데이터를 먼저 살짝 읽어서 클래스 개수를 파악합니다.
    print("클래스 개수 자동 탐색 중...")
    y_temp = np.load(Y_PATH, mmap_mode='r')
    
    # 라벨 중 가장 큰 값 + 1 이 총 클래스 개수가 됩니다.
    # (예: 라벨이 0~13 이라면 max는 13이고, 클래스 개수는 14개)
    MAX_LABEL = int(np.max(y_temp))
    NUM_CLASSES = MAX_LABEL + 1
    
    print(f"-> 감지된 최대 라벨: {MAX_LABEL}")
    print(f"-> 설정된 NUM_CLASSES: {NUM_CLASSES}")

    dataset = LargeEMGDataset(X_PATH, Y_PATH)
    
    # Shape 확인
    temp_x, temp_y = dataset[0] 
    CHANNELS, TIME_STEPS = temp_x.shape
    
    print(f"Input Shape per Sample: {temp_x.shape}") 
    
    # 2. DataLoader 설정 (Windows 에러 방지: num_workers=0)
    BATCH_SIZE = 32 
    dataloader = DataLoader(
        dataset, 
        batch_size=BATCH_SIZE, 
        shuffle=True, 
        num_workers=0,      # Windows Error 해결을 위해 0으로 설정
        pin_memory=True     # GPU 전송 속도 향상
    )
    
    # 3. 모델 초기화 (자동 감지된 NUM_CLASSES 주입)
    device = torch.device('cuda' if torch.cuda.is_available() else 'cpu')
    
    model = ChannelWiseEncoderAttention(
        time_steps=TIME_STEPS, 
        num_classes=NUM_CLASSES,  # <--- 수정된 부분
        embedding_dim=128
    ).to(device)
    
    optimizer = optim.Adam(model.parameters(), lr=0.001)
    criterion = nn.CrossEntropyLoss()
    
    print(f"모델 학습 시작 (Device: {device})")
    
    # 4. 학습 루프
    EPOCHS = 5
    model.train()
    
    for epoch in range(EPOCHS):
        running_loss = 0.0
        correct = 0
        total = 0
        
        loop = tqdm(dataloader, desc=f"Epoch {epoch+1}/{EPOCHS}")
        
        for inputs, labels in loop:
            inputs = inputs.to(device) # (B, C, T)
            labels = labels.to(device) # (B,)
            
            optimizer.zero_grad()
            
            # Forward
            outputs = model(inputs)
            loss = criterion(outputs, labels)
            
            # Backward
            loss.backward()
            optimizer.step()
            
            # Statistics
            running_loss += loss.item()
            _, predicted = torch.max(outputs.data, 1)
            total += labels.size(0)
            correct += (predicted == labels).sum().item()
            
            loop.set_postfix(loss=running_loss/len(dataloader), acc=100.*correct/total)

    print("학습 완료.")

if __name__ == "__main__":
    run_training()

클래스 개수 자동 탐색 중...
-> 감지된 최대 라벨: 19
-> 설정된 NUM_CLASSES: 20
Input Shape per Sample: torch.Size([16, 125080])
모델 학습 시작 (Device: cpu)


