## import

In [1]:
import torch
import torch.nn as nn
import torch.optim as optim
import torchvision
import torchvision.transforms as transforms
from torch.utils.data import TensorDataset, DataLoader, random_split
#LWM을 하기위한 라이브러리 가져오기
import DeepMIMOv3
import numpy as np
from pprint import pprint
import matplotlib.pyplot as plt
import time


plt . rcParams [ 'figure.figsize' ]  =  [ 12 ,  8 ]  # 기본 플롯 크기 설정

## GPU설정

In [2]:
# GPU 설정
device = torch.device("cuda" if torch.cuda.is_available() else "cpu")
print(device)

cuda


In [3]:
import torch
print(torch.version.cuda)                   # 설치된 CUDA 버전 (예: '11.7')
print(torch.backends.cudnn.version())       # cuDNN 버전 (예: 8200)
print("CUDA available:", torch.cuda.is_available())  # True


11.8
90100
CUDA available: True


# DeepMIMOv3 다운

In [4]:
# pip install DeepMIMOv3 umap-learn

## 파라미터 수정

In [5]:
## Load and print the default parameters
# bandwith: 0.05GHz(50MHz 대역폭 사용)
parameters = DeepMIMOv3.default_params()
pprint(parameters)

{'OFDM': {'RX_filter': 0,
          'bandwidth': 0.05,
          'selected_subcarriers': array([0]),
          'subcarriers': 512},
 'OFDM_channels': 1,
 'active_BS': array([1]),
 'bs_antenna': {'FoV': array([360, 180]),
                'radiation_pattern': 'isotropic',
                'rotation': array([0, 0, 0]),
                'shape': array([8, 4]),
                'spacing': 0.5},
 'dataset_folder': './Raytracing_scenarios',
 'dynamic_scenario_scenes': array([1]),
 'enable_BS2BS': 1,
 'enable_doppler': 0,
 'enable_dual_polar': 0,
 'num_paths': 5,
 'scenario': 'O1_60',
 'ue_antenna': {'FoV': array([360, 180]),
                'radiation_pattern': 'isotropic',
                'rotation': array([0, 0, 0]),
                'shape': array([4, 2]),
                'spacing': 0.5},
 'user_rows': array([1]),
 'user_subsampling': 1}


In [6]:
## Change parameters for the setup
# Scenario O1_60 extracted at the dataset_folder
#LWM 동적 시나리오 불러오기
#자신의 LWM 파일 위치 경로 작성
# parameters['dataset_folder'] = r'/content/drive/MyDrive/Colab Notebooks/LWM'
scene = 15 # 장면 수
parameters['dataset_folder'] = r'C:\Users\dlghd\졸업프로젝트\LWM'

# scnario = 02_dyn_3p5 <- 다운받은 파일(동적시나리오)
parameters['scenario'] = 'O2_dyn_3p5'
parameters['dynamic_scenario_scenes'] = np.arange(scene) #scene 0~9

# 각 사용자-기지국 채널에 대해 최대 10개 멀티패스 경로 사용
parameters['num_paths'] = 10

# User rows 1-100
parameters['user_rows'] = np.arange(100)
# User 축소하기
parameters['user_subsampling'] = 0.01

# Activate only the first basestation
parameters['active_BS'] = np.array([1])

parameters['activate_OFDM'] = 1

parameters['OFDM']['bandwidth'] = 0.05 # 50 MHz
parameters['OFDM']['subcarriers'] = 512 # OFDM with 512 subcarriers
parameters['OFDM']['selected_subcarriers'] = np.arange(0, 64, 1)
#parameters['OFDM']['subcarriers_limit'] = 64 # Keep only first 64 subcarriers

parameters['ue_antenna']['shape'] = np.array([1, 1]) # Single antenna
parameters['bs_antenna']['shape'] = np.array([1, 32]) # ULA of 32 elements
#parameters['bs_antenna']['rotation'] = np.array([0, 30, 90]) # ULA of 32 elements
#parameters['ue_antenna']['rotation'] = np.array([[0, 30], [30, 60], [60, 90]]) # ULA of 32 elements
#parameters['ue_antenna']['radiation_pattern'] = 'isotropic'
#parameters['bs_antenna']['radiation_pattern'] = 'halfwave-dipole'

In [7]:
print(parameters)

{'dataset_folder': 'C:\\Users\\dlghd\\졸업프로젝트\\LWM', 'scenario': 'O2_dyn_3p5', 'dynamic_scenario_scenes': array([ 0,  1,  2,  3,  4,  5,  6,  7,  8,  9, 10, 11, 12, 13, 14]), 'num_paths': 10, 'active_BS': array([1]), 'user_rows': array([ 0,  1,  2,  3,  4,  5,  6,  7,  8,  9, 10, 11, 12, 13, 14, 15, 16,
       17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33,
       34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50,
       51, 52, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 64, 65, 66, 67,
       68, 69, 70, 71, 72, 73, 74, 75, 76, 77, 78, 79, 80, 81, 82, 83, 84,
       85, 86, 87, 88, 89, 90, 91, 92, 93, 94, 95, 96, 97, 98, 99]), 'user_subsampling': 0.01, 'bs_antenna': {'shape': array([ 1, 32]), 'spacing': 0.5, 'rotation': array([0, 0, 0]), 'FoV': array([360, 180]), 'radiation_pattern': 'isotropic'}, 'ue_antenna': {'shape': array([1, 1]), 'spacing': 0.5, 'rotation': array([0, 0, 0]), 'FoV': array([360, 180]), 'radiation_pattern': 'isotropic'}, 'enable

## dataset 구축

In [None]:
## dataset 구축 (chunked on‑the‑fly generation)
import time, gc
from tqdm import tqdm

# 0~999 씬 인덱스, 한 번에 50개씩 처리
scene_indices = np.arange(scene)
chunk_size   = 5
all_data     = []

# 씬 묶음(chunk)마다 generate_data 호출
for i in tqdm(range(0, len(scene_indices), chunk_size)):
    chunk = scene_indices[i : i+chunk_size].tolist()
    parameters['dynamic_scenario_scenes'] = chunk

    start = time.time()
    data_chunk = DeepMIMOv3.generate_data(parameters)
    print(f"Scenes {chunk[0]}–{chunk[-1]} generation time: {time.time() - start:.2f}s")

    # 바로 all_data에 합치거나, 디스크에 저장해도 OK
    all_data.extend(data_chunk)

    # 메모리 해제
    del data_chunk
    gc.collect()

# 마지막에 하나의 리스트로 합친 데이터셋
dataset = all_data


  0%|                                                                                            | 0/3 [00:00<?, ?it/s]

The following parameters seem unnecessary:
{'activate_OFDM'}

Scene 1/5

Basestation 1

UE-BS Channels



Reading ray-tracing:   0%|                                                                   | 0/69006 [00:00<?, ?it/s][A
Reading ray-tracing:  27%|█████████████▉                                     | 18842/69006 [00:00<00:00, 188409.85it/s][A
Reading ray-tracing:  57%|████████████████████████████▉                      | 39182/69006 [00:00<00:00, 197108.91it/s][A
Reading ray-tracing: 100%|███████████████████████████████████████████████████| 69006/69006 [00:00<00:00, 197861.33it/s][A

Generating channels:   0%|                                                                     | 0/727 [00:00<?, ?it/s][A
Generating channels: 100%|█████████████████████████████████████████████████████████| 727/727 [00:00<00:00, 4674.00it/s][A



BS-BS Channels



Reading ray-tracing: 100%|███████████████████████████████████████████████████████████████████████| 1/1 [00:00<?, ?it/s][A

Generating channels: 100%|██████████████████████████████████████████████████████████████| 1/1 [00:00<00:00, 109.15it/s][A



Scene 2/5

Basestation 1

UE-BS Channels



Reading ray-tracing:   0%|                                                                   | 0/69006 [00:00<?, ?it/s][A
Reading ray-tracing:  25%|████████████▊                                      | 17327/69006 [00:00<00:00, 172374.24it/s][A
Reading ray-tracing:  56%|████████████████████████████▊                      | 38925/69006 [00:00<00:00, 197411.96it/s][A
Reading ray-tracing: 100%|███████████████████████████████████████████████████| 69006/69006 [00:00<00:00, 170836.65it/s][A

Generating channels:   0%|                                                                     | 0/727 [00:00<?, ?it/s][A
Generating channels: 100%|█████████████████████████████████████████████████████████| 727/727 [00:00<00:00, 4490.85it/s][A



BS-BS Channels



Reading ray-tracing: 100%|███████████████████████████████████████████████████████████████████████| 1/1 [00:00<?, ?it/s][A

Generating channels: 100%|██████████████████████████████████████████████████████████████| 1/1 [00:00<00:00, 493.74it/s][A



Scene 3/5

Basestation 1

UE-BS Channels



Reading ray-tracing:   0%|                                                                   | 0/69006 [00:00<?, ?it/s][A
Reading ray-tracing:  28%|██████████████                                     | 19007/69006 [00:00<00:00, 189761.63it/s][A
Reading ray-tracing:  55%|████████████████████████████                       | 37984/69006 [00:00<00:00, 182436.55it/s][A
Reading ray-tracing: 100%|███████████████████████████████████████████████████| 69006/69006 [00:00<00:00, 190129.44it/s][A

Generating channels:   0%|                                                                     | 0/727 [00:00<?, ?it/s][A
Generating channels:  25%|██████████████                                           | 179/727 [00:00<00:00, 1774.38it/s][A
Generating channels: 100%|█████████████████████████████████████████████████████████| 727/727 [00:00<00:00, 3035.52it/s][A



BS-BS Channels



Reading ray-tracing: 100%|██████████████████████████████████████████████████████████████| 1/1 [00:00<00:00, 998.41it/s][A

Generating channels: 100%|██████████████████████████████████████████████████████████████| 1/1 [00:00<00:00, 498.85it/s][A



Scene 4/5

Basestation 1

UE-BS Channels



Reading ray-tracing:   0%|                                                                   | 0/69006 [00:00<?, ?it/s][A
Reading ray-tracing:  32%|████████████████▍                                  | 22240/69006 [00:00<00:00, 221409.38it/s][A
Reading ray-tracing:  64%|████████████████████████████████▊                  | 44381/69006 [00:00<00:00, 213371.09it/s][A
Reading ray-tracing: 100%|███████████████████████████████████████████████████| 69006/69006 [00:00<00:00, 199685.36it/s][A

Generating channels:   0%|                                                                     | 0/727 [00:00<?, ?it/s][A
Generating channels: 100%|█████████████████████████████████████████████████████████| 727/727 [00:00<00:00, 4162.90it/s][A



BS-BS Channels



Reading ray-tracing: 100%|█████████████████████████████████████████████████████████████| 1/1 [00:00<00:00, 1000.79it/s][A

Generating channels: 100%|██████████████████████████████████████████████████████████████| 1/1 [00:00<00:00, 459.45it/s][A



Scene 5/5

Basestation 1

UE-BS Channels



Reading ray-tracing:   0%|                                                                   | 0/69006 [00:00<?, ?it/s][A
Reading ray-tracing:  21%|██████████▊                                        | 14586/69006 [00:00<00:00, 144586.74it/s][A
Reading ray-tracing:  42%|█████████████████████▍                             | 29045/69006 [00:00<00:00, 132927.05it/s][A
Reading ray-tracing:  69%|██████████████████████████████████▉                | 47280/69006 [00:00<00:00, 153845.20it/s][A
Reading ray-tracing: 100%|███████████████████████████████████████████████████| 69006/69006 [00:00<00:00, 157224.46it/s][A

Generating channels:   0%|                                                                     | 0/727 [00:00<?, ?it/s][A
Generating channels: 100%|█████████████████████████████████████████████████████████| 727/727 [00:00<00:00, 4809.62it/s][A



BS-BS Channels



Reading ray-tracing: 100%|██████████████████████████████████████████████████████████████| 1/1 [00:00<00:00, 999.83it/s][A

Generating channels: 100%|██████████████████████████████████████████████████████████████| 1/1 [00:00<00:00, 302.03it/s][A
 33%|████████████████████████████                                                        | 1/3 [00:08<00:16,  8.32s/it]

Scenes 0–4 generation time: 8.18s
The following parameters seem unnecessary:
{'activate_OFDM'}

Scene 1/5

Basestation 1

UE-BS Channels



Reading ray-tracing:   0%|                                                                   | 0/69006 [00:00<?, ?it/s][A
Reading ray-tracing:  28%|██████████████▏                                    | 19226/69006 [00:00<00:00, 190766.09it/s][A
Reading ray-tracing:  56%|████████████████████████████▎                      | 38303/69006 [00:00<00:00, 160216.45it/s][A
Reading ray-tracing: 100%|███████████████████████████████████████████████████| 69006/69006 [00:00<00:00, 160803.76it/s][A

Generating channels:   0%|                                                                     | 0/727 [00:00<?, ?it/s][A
Generating channels: 100%|█████████████████████████████████████████████████████████| 727/727 [00:00<00:00, 3783.04it/s][A



BS-BS Channels



Reading ray-tracing: 100%|███████████████████████████████████████████████████████████████████████| 1/1 [00:00<?, ?it/s][A

Generating channels: 100%|██████████████████████████████████████████████████████████████| 1/1 [00:00<00:00, 333.28it/s][A



Scene 2/5

Basestation 1

UE-BS Channels



Reading ray-tracing:   0%|                                                                   | 0/69006 [00:00<?, ?it/s][A
Reading ray-tracing:  23%|███████████▉                                       | 16216/69006 [00:00<00:00, 161013.87it/s][A
Reading ray-tracing:  48%|████████████████████████▍                          | 33109/69006 [00:00<00:00, 165408.48it/s][A
Reading ray-tracing:  73%|█████████████████████████████████████▍             | 50627/69006 [00:00<00:00, 169228.75it/s][A
Reading ray-tracing: 100%|███████████████████████████████████████████████████| 69006/69006 [00:00<00:00, 161992.49it/s][A

Generating channels:   0%|                                                                     | 0/727 [00:00<?, ?it/s][A
Generating channels: 100%|█████████████████████████████████████████████████████████| 727/727 [00:00<00:00, 4604.53it/s][A



BS-BS Channels



Reading ray-tracing: 100%|███████████████████████████████████████████████████████████████████████| 1/1 [00:00<?, ?it/s][A

Generating channels: 100%|██████████████████████████████████████████████████████████████| 1/1 [00:00<00:00, 333.28it/s][A



Scene 3/5

Basestation 1

UE-BS Channels



Reading ray-tracing:   0%|                                                                   | 0/69006 [00:00<?, ?it/s][A
Reading ray-tracing:  27%|█████████████▌                                     | 18410/69006 [00:00<00:00, 182949.52it/s][A
Reading ray-tracing:  58%|█████████████████████████████▎                     | 39689/69006 [00:00<00:00, 200413.22it/s][A
Reading ray-tracing: 100%|███████████████████████████████████████████████████| 69006/69006 [00:00<00:00, 198661.65it/s][A

Generating channels:   0%|                                                                     | 0/727 [00:00<?, ?it/s][A
Generating channels:  20%|███████████▎                                             | 145/727 [00:00<00:00, 1443.80it/s][A
Generating channels: 100%|█████████████████████████████████████████████████████████| 727/727 [00:00<00:00, 2817.55it/s][A



BS-BS Channels



Reading ray-tracing: 100%|█████████████████████████████████████████████████████████████| 1/1 [00:00<00:00, 1002.22it/s][A

Generating channels:   0%|                                                                       | 0/1 [00:00<?, ?it/s][A

In [None]:
print(parameters['user_rows'])

In [None]:
print(parameters)

# 사용자 접근 데이터

In [None]:
user_data = dataset[0][0]['user']
print(user_data.keys())

# 사용자 채널 정보 확인

In [None]:
# subcarries = 나눈 각각의 주파수 채널
# Channel = H <- 채널 벡터
# 채널 형태
# (user, UE antenna, Bs antenna, subcarrier)
channel = dataset[0][0]['user']['channel']
print(channel.shape)  

In [None]:
print(dataset[0][0]['user']['channel'][100])

# 사용자 위치 정보

In [None]:
location = dataset[0][0]['user']['location']
print(location.shape)      # (사용자 수, 3)
print(location[0:4])         # 첫 번째 사용자의 (x, y, z)

# 경로정보

In [None]:
paths = dataset[0][0]['user']['paths']
#사용자 수
print(len(paths))
# 첫 번째 사용자 경로 정보
print(paths[0])

# 기지국 정보

In [None]:
bs_data = dataset[0][0]['basestation']
print(bs_data.keys())


# Scene 및 사용자 수

In [None]:
for i, scene in enumerate(dataset[0]):
    user_locs = scene['user']['location']
    print(f"Scene {i}: {len(user_locs)} users")

# 채널 수

In [None]:
len(dataset[0][0]['user']['channel'])

In [None]:
print(dataset[0][0]['user']['paths'][0])

In [None]:
scene = dataset[0][0] # scene 0
ue_idx = 0 # 첫 번째 사용자
channel = scene['user']['channel'][ue_idx]
print(channel.shape)

# channel CIR mat 정보 가져오기

In [None]:
import scipy.io as sio

file_path = r'C:\Users\dlghd\졸업프로젝트\LWM\O2_dyn_3p5\scene_0\O2_dyn_3p5.1.CIR.mat'
mat_data = sio.loadmat(file_path)

# 파일 안의 key 확인
print(mat_data.keys())




In [None]:
# 일반적으로 CIR key는 'CIR' 또는 'cir' 같은 이름일 가능성 높음
H_cir = mat_data['__header__']  
print(H_cir)

# Time-Prediction 시작
## Time Series 형태로 변환
### 단일사용자 채널 예측

In [None]:
# print(dataset[0][0]['user']['channel'][150][0][3])

count = 0
for h in dataset[0][0]['user']['channel'][100][0]:
#     h = h.squeeze(0)
    h_real = h.real
    h_imag = h.imag
    if np.sum(np.abs(h_real)) ==0:
        count+=1
    elif np.sum(np.abs(h_imag)) == 0:
        count+=1

print("0이 존재하는 채널 개수",count)

In [None]:
import numpy as np

# 1) (user, ue_port, bs_ant, subc) → (bs_ant, subc) 로 squeeze
H = dataset[0][0]['user']['channel'][100, 0]   # shape: (32, 64), complex

# 2) BS 안테나 인덱스 3의 서브캐리어 벡터 (64,)
print("Antenna #3 subcarriers:", H[3])

# 3) 전체 서브캐리어(32×64) 중 값이 정확히 0인 요소 개수
zero_elements = np.sum(H == 0)
print("0+0j인 서브캐리어 개수:", zero_elements)

# 4) 서브캐리어 전부가 0인 안테나 포트(행) 개수
zero_ports = np.sum(np.all(H == 0, axis=1))
print("완전 0+0j 안테나 포트 개수:", zero_ports)

# 5) 만약 “값이 하나도 0이 아닌” 서브캐리어 요소 개수를 보고 싶다면
nonzero_elements = np.sum(np.abs(H) > 0)
print("0이 아닌 서브캐리어 개수:", nonzero_elements)


## 결측치 제거 및 dataload

In [None]:
# ─────────────────────────────────────────────
# ❶ IterableDataset: 모든 유저·서브캐리어를 스트리밍
import torch
from torch.utils.data import IterableDataset, DataLoader
import numpy as np

class ChannelSeqDataset(IterableDataset):
    """
    • seq_len 개의 과거 채널 벡터(real 64 + imag 64 → 128) → 다음 시점 벡터 예측
    • 벡터는 평균전력 1 로 power‑normalize 후 반환
    """
    def __init__(self, scenes, seq_len: int = 5, eps: float = 1e-9):
        super().__init__()
        self.scenes   = scenes
        self.seq_len  = seq_len
        self.eps      = eps                        # 0 division 방지용 신호세기의 크기 
        ch0           = scenes[0][0]['user']['channel']
        self.U        = ch0.shape[0]               # 사용자 수
        self.A        = ch0.shape[2]               # 안테나 32
        self.S        = ch0.shape[3]               # 서브캐리어 64
        self.vec_len  = 2 * self.A                 # 64 real + imag
        0
    def _vec(self, scene, u: int, sc: int) -> torch.Tensor:
        """(32,) complex → (64,) float32  +  power norm"""
        h = scene[0]['user']['channel'][u, 0, :, sc]          # (32,)
        v = np.concatenate([h.real, h.imag]).astype(np.float32)
        p = np.mean(v * v) + self.eps                         # 평균 전력: 채널 벡터 h의 각 성분의 진폭 제곱을 합산
        v /= np.sqrt(p)                                       # 정규화
        return torch.from_numpy(v)                            # (64,)

    def __iter__(self):
        T = len(self.scenes)
        for t in range(self.seq_len, T):                      # 타깃 시점
            past_scenes = self.scenes[t - self.seq_len : t]
            tgt_scene   = self.scenes[t]
            for u in range(self.U):
                for s in range(self.S):
                    seq = torch.stack([self._vec(ps, u, s) for ps in past_scenes])
                    if not torch.any(seq):                    # 전부 0 이면 skip
                        continue
                    target     = self._vec(tgt_scene, u, s)
                    if not torch.any(target): # target이 0이면 스킵
                        continue
                    masked_pos = torch.tensor([self.seq_len - 2], dtype=torch.long)
                    yield seq, masked_pos, target             # shapes: (5,64) / (1,) / (64,)
    
    def __len__(self):
         return (len(self.scenes) - self.seq_len) * self.U * self.S
# ─────────────────────────────────────────────
# ❷ 학습·검증 DataLoader train : val = 6 : 4
seq_len      = 5
split_ratio  = 0.6
split_idx    = int(len(dataset) * split_ratio)

train_ds = ChannelSeqDataset(dataset[:split_idx], seq_len=seq_len)
val_ds   = ChannelSeqDataset(dataset[split_idx:], seq_len=seq_len)

# train_ds 순회하면서 feature/target min, max 계산


batch_size   = 32
train_loader = DataLoader(train_ds, batch_size=batch_size, shuffle=False)
val_loader   = DataLoader(val_ds,   batch_size=batch_size, shuffle=False)
# ─────────────────────────────────────────────


In [None]:
from sklearn.preprocessing   import MinMaxScaler
from torch.utils.data        import TensorDataset, DataLoader

# ❶ 모든 seq/mask/target을 한 번에 뽑아서 NumPy로
X_list, mposes_list, y_list = [], [], []
for seq, mpos, tgt in ChannelSeqDataset(dataset, seq_len=seq_len):
    X_list.append( seq.numpy() )           # (seq_len, vec_len)
    mposes_list.append( mpos.item() )      # 스칼라 마스크 인덱스
    y_list.append( tgt.numpy() )           # (vec_len,)

X       = np.stack(X_list,      axis=0)    # (N, seq_len, vec_len)
mposes  = np.array(mposes_list).reshape(-1,1)  # (N, 1)
y       = np.stack(y_list,      axis=0)    # (N, vec_len)

# ❷ Train/Val split  (6:4)
split_idx = int(len(X) * split_ratio)
X_tr,  X_va  = X[:split_idx],  X[split_idx:]
mp_tr, mp_va = mposes[:split_idx], mposes[split_idx:]
y_tr,  y_va  = y[:split_idx],  y[split_idx:]

# ❸ 스케일링 (X, y 만)
scaler_x = MinMaxScaler(); scaler_y = MinMaxScaler()
Ntr, L, D = X_tr.shape

# train 에서만 fit
scaler_x .fit( X_tr.reshape(-1, D) )
scaler_y .fit( y_tr )

# transform 후 원래 shape 복원
X_tr_s = scaler_x.transform(X_tr.reshape(-1, D)).reshape(Ntr, L, D)
X_va_s = scaler_x.transform(X_va.reshape(-1, D)).reshape(X_va.shape)
y_tr_s = scaler_y.transform(y_tr)
y_va_s = scaler_y.transform(y_va)

# ❹ TensorDataset 에 세 개 모두 담기
train_ds = TensorDataset(
    torch.from_numpy(X_tr_s).float(),     # seqs
    torch.from_numpy(mp_tr).long(),       # mposes
    torch.from_numpy(y_tr_s).float()      # tgts
)
val_ds   = TensorDataset(
    torch.from_numpy(X_va_s).float(),
    torch.from_numpy(mp_va).long(),
    torch.from_numpy(y_va_s).float()
)

train_loader = DataLoader(train_ds, batch_size=batch_size, shuffle=True)
val_loader   = DataLoader(val_ds,   batch_size=batch_size, shuffle=False)

# 이제 배치 언패킹이 딱 맞습니다!
first_batch = next(iter(train_loader))
seqs, mposes, tgts = first_batch   # (B, L, D), (B,1), (B, D)


In [None]:
len(train_ds) #4x727x64

In [None]:
len(val_ds) #1x727x64

In [None]:
# 1) DataLoader 설정 확인
print(train_loader)                # DataLoader 정보 전체
print("batch_size:", train_loader.batch_size)
print("dataset:",   train_loader.dataset)

# 총 샘플 수
print("total samples:", len(train_loader.dataset))
# → (len(scenes) - seq_len) * U * S 와 동일한 값

# 총 배치 수
print("total batches:", len(train_loader))
# → ceil(total_samples / batch_size)


# 3) 첫 번째 배치 내용 확인
first_batch = next(iter(train_loader))
seqs, mposes, tgts = first_batch
print("seqs.shape:",   seqs.shape)    # (B, seq_len, vec_len)
print("mposes.shape:", mposes.shape)  # (B, 1)
print("tgts.shape:",   tgts.shape)    # (B, vec_len)


In [None]:
# 1) train_ds 자체 정보 출력
print(train_ds)
print("전체 샘플 수 (len):", len(train_loader))

# 2) 앞에서 5개 예시 뽑아서 확인
for idx, (seq, mpos, tgt) in enumerate(train_loader):
    print(f"\n샘플 #{idx}")
    print("  seq shape :", seq.shape)    # (seq_len, feat_dim)
    print("  masked_pos :", mpos)        # tensor([ ... ])
    print("  target shape:", tgt.shape)   # (feat_dim,)
    print("  seq example:\n", seq)        # 실제 값 보기
    print("  target example:\n", tgt)
    if idx >= 4:
        break


## 이론적 input_size

In [None]:
# (1) 장면(scene) 수, 시퀀스 길이
T = len(dataset)
L = 5          # 이제 int!

# (2) 사용자 수(U), 서브캐리어 수(S)
ch0 = dataset[0][0]['user']['channel']  # shape = (U,1,A,S)
U   = ch0.shape[0]
S   = ch0.shape[3]

# (3) 이론상 최대 시퀀스 수
total_possible = (T - L) * U * S

# (4) train/val 분할 기준에서 이론상 최대 개수
train_max = int(total_possible * split_ratio)
val_max   = total_possible - train_max

print(f"▶ 이론상 전체 가능 시퀀스: {total_possible}")
print(f"▶ 이론상 Train 최대 샘플: {train_max}")
print(f"▶ 이론상 Val   최대 샘플: {val_max}")


In [None]:
import numpy as np

# 전체 실제 샘플 수
N_total   = X.shape[0]
# 실제 train/val 샘플 수
N_train   = X_tr.shape[0]
N_val     = X_va.shape[0]

# 실제 배치 수 (올림)
bsize     = batch_size
B_train   = int(np.ceil(N_train / bsize))
B_val     = int(np.ceil(N_val   / bsize))

print(f"▶ 실제 전체 샘플 수: {N_total}")
print(f"▶ 실제   Train 샘플 수: {N_train}   → 배치 수: {B_train}")
print(f"▶ 실제   Val   샘플 수: {N_val}   → 배치 수: {B_val}")


# 아래 코드 구조
┌──────────────────────────────────────────────────────────────┐
│ input_ids  (B, seq_len, element_length)  ─┐                 │
│ masked_pos (B, num_mask)                  ├─>  LWM backbone │
│                                           │    (12-층 트랜스포머)  
└────────────────────────────────────────────┘         │
            logits_lm  (B, num_mask, element_length)  │   enc_output (B, seq_len, d_model)
                                                      ▼
                        ┌─[풀링]───────────────┐      ←── feat (B, d_model)
                        │ 첫 토큰(0번) 선택    │
                        │   or 평균/최대 풀링 │
                        └──────────────────────┘
                                      ▼
                       FC 헤드  (d_model → hidden_dim → out_dim)
                                      ▼
                                out (B, out_dim)

# 시각적비유

[패치 프로젝터]──▶[Transformer ×12]──▶[LayerNorm]──┐
                                                  ├─▶ 64-차 벡터 (CLS 또는 풀링) ─▶ MLP ─▶ out                                                
[Positional Embedding]─────────────────────────────┘


In [None]:
"""
LWMWithHead: 사전학습된 LWM(Transformer encoder)을 ‘백본(backbone)’으로 사용하고,
             그 뒤에 새로운 완전연결(FC) 헤드(head)를 붙여 다운스트림 작업
             (회귀·분류 등)에 사용할 수 있도록 만든 래퍼(wrapper) 클래스입니다.

변경점:
- input_dim: 실제 데이터 차원 (예: 64)
- patch_length: backbone이 기대하는 패치 길이 (예: 16)
- 기존 element_length 파라미터 대신 위 두 개로 명확히 분리
- forward()에서 투영 레이어(self.input_proj) 적용
"""

import torch
import torch.nn as nn
from lwm_model import lwm   # 기존 LWM 모델 클래스

class LWMWithHead(nn.Module):
    def __init__(
        self,
        input_dim:      int,    # 실제 입력 벡터 차원, 예: 64 (real+imag 합친 길이)
        patch_length:   int,    # backbone in_features, 예: 16 (사전학습된 패치 길이)
        d_model:        int = 64,# backbone hidden size (사전학습된 d_model)
        max_len:        int = 129,# 포지셔널 인코딩 최대 길이
        n_layers:       int = 12,# transformer encoder 층 수
        hidden_dim:     int = 256,# 헤드 FC 중간 차원
        out_dim:        int = 64, # 최종 출력 차원
        freeze_backbone: bool = True,  # 백본 동결 여부
        ckpt_path:      str | None = "./model_weights.pth", 
        device:         str = "cuda",
    ):
        super().__init__()

        # ────────────────────────────────────
        # ➊ 입력 투영 레이어
        #   • 실제 데이터(input_dim) → patch_length 차원으로 줄여줌
        #   • backbone이 기대하는 in_features 길이에 맞추기 위함
        # ────────────────────────────────────
        self.input_proj = nn.Linear(input_dim, patch_length)

        # ────────────────────────────────────
        # ➋ 백본(backbone) 초기화
        # ────────────────────────────────────
        if ckpt_path is None:
            # 랜덤 초기화된 backbone
            self.backbone = lwm(
                element_length=patch_length,
                d_model=d_model,
                max_len=max_len,
                n_layers=n_layers
            ).to(device)
        else:
            # 사전학습 가중치 로드
            self.backbone = lwm.from_pretrained(
                ckpt_name=ckpt_path,
                device=device
            )
        # 백본 동결(gradient off)
        if freeze_backbone:
            for p in self.backbone.parameters():
                p.requires_grad = False

        # ────────────────────────────────────
        # ➌ 다운스트림 FC 헤드 정의
        #   • d_model → hidden_dim → out_dim
        # ────────────────────────────────────
        self.head = nn.Sequential(
            nn.Linear(d_model, hidden_dim),
            nn.ReLU(),
            nn.Linear(hidden_dim, out_dim)
        )

    def forward(self, input_ids, masked_pos):
        """
        Parameters
        ----------
        input_ids : Tensor  (B, seq_len, input_dim)
            원본 채널 시퀀스, 예: (B, 5, 64)
        masked_pos: Tensor  (B, num_mask)
            backbone의 masked position 인덱스

        Returns
        -------
        out : Tensor  (B, out_dim)
            최종 FC 헤드를 거친 예측값
        """
        # ────────────────────────────────────
        # 1) 입력 투영: (B, L, 64) → (B, L, 16)
        # ────────────────────────────────────
        x = self.input_proj(input_ids)

        # ────────────────────────────────────
        # 2) backbone forward
        #    • logits_lm (unused), enc_output: (B, L, d_model)
        # ────────────────────────────────────
        _, enc_output = self.backbone(x, masked_pos)

        # ────────────────────────────────────
        # 3) 특징 추출: CLS 토큰 벡터 (첫 번째 토큰)
        #    • feat: (B, d_model)
        # ────────────────────────────────────
        feat = enc_output[:, 0, :]

        # ────────────────────────────────────
        # 4) FC 헤드 통과
        #    • out: (B, out_dim)
        # ────────────────────────────────────
        out = self.head(feat)
        return out


## input_size
-input_size = (scene - seq_len) * U * S -> (10-5)+69040*64 = 22092800  
-batch_size = 32  
-배치 수 = input_size / batch_size = 690400배치

In [None]:
X_tr_s.shape

In [None]:
# ─────────────────────────────────────────────
# 모델 초기화 (새로운 생성자 시그니처에 맞춰 수정)
# ─────────────────────────────────────────────
from torch.optim import Adam

batch_size, seq_len, D = X_tr_s.shape  # D = 64
hidden_dim = 256

model = LWMWithHead(
    input_dim     = D,      # 실제 채널 벡터 차원 (real+imag=64)
    patch_length  = 16,     # pretrained 백본이 기대하는 패치 길이
    d_model       = 64,     # pretrained 백본 hidden size
    max_len       = seq_len,
    n_layers      = 12,
    hidden_dim    = hidden_dim,
    out_dim       = D,      # downstream 예측 차원 (64)
    freeze_backbone = True,
    ckpt_path     = "./model_weights.pth",
    device        = device
).to(device)
# ─────────────────────────────────────────────

# 손실함수 & 옵티마이저는 그대로
criterion = nn.MSELoss()
optimizer = Adam(model.parameters(), lr=1e-4)


In [None]:
# model: LWMWithHead 인스턴스
print("Backbone requires_grad flags:")
for name, param in model.backbone.named_parameters():
    print(f"  {name:40s}: {param.requires_grad}")

# 또한 전체가 동결됐는지 한 줄로 요약하려면:
all_frozen = all(not p.requires_grad for p in model.backbone.parameters())
print(f"\n→ Is backbone fully frozen? {all_frozen}")


In [None]:
# 모델 평가 함수
import torch
import torch.nn.functional as F

# ─────────────────────────────────────────
# 1. 배치 단위 RMSE, NMSE 함수
# ─────────────────────────────────────────
def rmse(pred: torch.Tensor, target: torch.Tensor) -> torch.Tensor:
    """
    Root-Mean-Squared Error
    returns: 스칼라 (배치 평균)
    """
    return torch.sqrt(F.mse_loss(pred, target, reduction="mean"))   # √MSE

def nmse(pred: torch.Tensor, target: torch.Tensor, eps : float = 1e-12) -> torch.Tensor:
    """
    Normalized MSE  =  E[‖ŷ − y‖²] / E[‖y‖²]
      · 채널 예측 분야에서 흔히 쓰는 지표
    returns: 스칼라 (배치 평균)
    """
    # (B, …) → (B,)  : 각 샘플별 제곱합
    mse_per_sample   = ((pred - target)**2).view(pred.size(0), -1).sum(dim=1)
    power_per_sample = (target**2).view(target.size(0), -1).sum(dim=1) + eps
    return (mse_per_sample / power_per_sample).mean()


# ─────────────────────────────────────────
# 2. 검증 루프 예시
# ─────────────────────────────────────────
def evaluate(model, loader, device="cuda"):
    """
    Validation loop for IterableDataset.
    Returns average RMSE and NMSE over all samples.
    """
    model.eval()
    total_rmse, total_nmse, total_samples = 0.0, 0.0, 0

    with torch.no_grad():
        for input_ids, masked_pos, target in loader:
            # Move to device
            input_ids, masked_pos, target = (
                input_ids.to(device),
                masked_pos.to(device),
                target.to(device),
            )
            # Batch size
            bs = input_ids.size(0)

            # Forward
            pred = model(input_ids, masked_pos)

            # Accumulate batch metrics
            total_rmse    += rmse(pred, target).item() * bs
            total_nmse    += nmse(pred, target).item() * bs
            total_samples += bs

    # Compute averages
    return {
        "RMSE": total_rmse / total_samples,
        "NMSE": total_nmse / total_samples
    }



# model training

In [None]:
from tqdm import tqdm
import time, torch

num_epochs   = 10                      # 원하는 epoch 수
start_time   = time.time()

for epoch in range(1, num_epochs+1):

    # ① TRAIN ────────────────────────────────
    model.train()
    run_loss = 0.0

    tq = tqdm(train_loader, desc=f"[{epoch:02d}/{num_epochs}] train", leave=False)
    for b, (inp, mpos, tgt) in enumerate(tq, 1):
        inp, mpos, tgt = inp.to(device), mpos.to(device), tgt.to(device)

        optimizer.zero_grad()
        pred  = model(inp, mpos).squeeze(-1)
        loss  = criterion(pred, tgt)
        loss.backward()
        optimizer.step()

        run_loss += loss.item()
        if b % 100 == 0:                   # 100 배치마다 진행바에 표시
            tq.set_postfix(loss=run_loss/b)

    avg_train_loss = run_loss / b

    # ② VALID ────────────────────────────────
    metrics   = evaluate(model, val_loader, device)
    val_rmse  = metrics["RMSE"]
    val_nmse  = metrics["NMSE"]
    val_nmse_db = 10 * torch.log10(torch.tensor(val_nmse)).item()

    print(
    f"[{epoch:02d}/{num_epochs}] "
    f"Train Loss: {avg_train_loss:.4f}  "
    f"Val RMSE: {val_rmse:.4f}  "
    f"Val NMSE: {val_nmse:.4e}  "
    f"Val NMSE_dB: {val_nmse_db:.1f} dB"
)
print(f"Total training time: {time.time() - start_time:.2f}s")