In [28]:
import os
import numpy as np
import nibabel as nib
import pandas as pd
from sklearn.model_selection import train_test_split
from sklearn.preprocessing import LabelEncoder
from torch.utils.data import Dataset, DataLoader
import torch
import torch.nn as nn
import torch.nn.functional as F
from torchvision import transforms
from tqdm import tqdm
import torchvision.transforms.functional as TF


In [29]:
# Configuration
fmri_root_folder = r'C:\Users\SAIFUL_BADHON\Downloads\fMRI\output'  # Top-level folder containing subfolders
csv_path = r'C:\Users\SAIFUL_BADHON\Downloads\fMRI_3_24_2025.csv'
img_size = (64, 64, 64)
batch_size = 8
num_epochs = 50
lr = 0.001

In [30]:

# Step 1: Load metadata
df = pd.read_csv(csv_path)
# label_encoder = LabelEncoder()
# df['label'] = label_encoder.fit_transform(df['Group'])  # Converts Group to 0-5 labels


In [31]:
def check_valid_nii_exists(image_id, root_folder):
    folder = os.path.join(root_folder, str(image_id))
    if not os.path.isdir(folder):
        return False
    for file in os.listdir(folder):
        if file.endswith('.nii') or file.endswith('.nii.gz'):
            return True
    return False

df['has_file'] = df['Image Data ID'].apply(lambda x: check_valid_nii_exists(x, fmri_root_folder))
df = df[df['has_file']].reset_index(drop=True)

def map_to_binary(group):
    if group in ['CN', 'SMC']:
        return 0
    else:
        return 1

df['label'] = df['Group'].apply(map_to_binary)
# # ✅ Step 2: Encode labels *after* filtering so they match the actual data
# label_encoder = LabelEncoder()
# df['label'] = label_encoder.fit_transform(df['Group'])

# Debug check
# print("Final label classes used:", list(label_encoder.classes_))
print("Encoded label values:", df['label'].unique())

Encoded label values: [1 0]


In [32]:
df

Unnamed: 0,Image Data ID,Subject,Group,Sex,Age,Visit,Modality,Description,Type,Acq Date,Format,Downloaded,has_file,label
0,I1178798,007_S_6341,MCI,M,68,y1,fMRI,Axial MB rsfMRI (Eyes Open),Original,6/11/2019,DCM,,True,1
1,I990573,007_S_6341,MCI,M,67,sc,fMRI,Axial MB rsfMRI (Eyes Open),Original,4/30/2018,DCM,,True,1
2,I1327196,007_S_6310,CN,F,70,y2,fMRI,Axial MB rsfMRI (Eyes Open),Original,8/05/2020,DCM,,True,0
3,I974760,007_S_6255,CN,F,75,sc,fMRI,Axial MB rsfMRI (Eyes Open),Original,3/05/2018,DCM,,True,0
4,I1325573,007_S_6255,CN,F,78,y2,fMRI,Axial MB rsfMRI (Eyes Open),Original,7/27/2020,DCM,,True,0
...,...,...,...,...,...,...,...,...,...,...,...,...,...,...
216,I243902,002_S_0685,CN,F,95,v06,fMRI,Resting State fMRI,Original,7/08/2011,DCM,,True,0
217,I1221056,002_S_0413,CN,F,90,y2,fMRI,Axial MB rsfMRI (Eyes Open),Original,8/27/2019,DCM,,True,0
218,I304790,002_S_0413,CN,F,82,v11,fMRI,Resting State fMRI,Original,5/15/2012,DCM,,True,0
219,I240811,002_S_0413,CN,F,82,v06,fMRI,Resting State fMRI,Original,6/16/2011,DCM,,True,0


In [33]:
df["Group"].value_counts()

Group
CN      104
MCI      41
LMCI     32
EMCI     25
AD       12
SMC       7
Name: count, dtype: int64

In [34]:
df["label"].value_counts()

label
0    111
1    110
Name: count, dtype: int64

In [35]:
# Step 2: Preprocess fMRI images (4D -> 3D)
def load_and_preprocess_nifti_from_folder(folder_path):
    nii_file = None
    for file in os.listdir(folder_path):
        if file.endswith('.nii') or file.endswith('.nii.gz'):
            nii_file = os.path.join(folder_path, file)
            break
    if nii_file is None:
        raise FileNotFoundError(f"No NIfTI file found in {folder_path}")
    img = nib.load(nii_file)
    data = img.get_fdata()
    mean_3d = np.mean(data, axis=3)  # 4D -> 3D
    return mean_3d

def resize_volume(img, size=img_size):
    import scipy.ndimage
    zoom_factors = [s / float(img.shape[i]) for i, s in enumerate(size)]
    return scipy.ndimage.zoom(img, zoom=zoom_factors, order=1)

In [36]:
# Step 3: PyTorch Dataset
class FMRIDataset(Dataset):
    def __init__(self, dataframe, data_root, transform=None):
        self.df = dataframe
        self.data_root = data_root
        self.transform = transform

    def __len__(self):
        return len(self.df)

    def __getitem__(self, idx):
        row = self.df.iloc[idx]
        img_id = str(row['Image Data ID'])
        label = int(row['label'])
        folder_path = os.path.join(self.data_root, img_id)
        volume = load_and_preprocess_nifti_from_folder(folder_path)
        volume = resize_volume(volume)
        volume = (volume - volume.mean()) / (volume.std() + 1e-5)
        volume = np.expand_dims(volume, axis=0)  # Shape: (1, D, H, W)
        return torch.tensor(volume, dtype=torch.float32), torch.tensor(label)

In [37]:
# Step 4: Train/test split
train_df, test_df = train_test_split(df, test_size=0.2, stratify=df['label'], random_state=42)
train_dataset = FMRIDataset(train_df, fmri_root_folder)
test_dataset = FMRIDataset(test_df, fmri_root_folder)
train_loader = DataLoader(train_dataset, batch_size=batch_size, shuffle=True)
test_loader = DataLoader(test_dataset, batch_size=batch_size)

In [38]:
import torch
import torch.nn as nn
import torch.nn.functional as F

class PatchEmbedding3D(nn.Module):
    def __init__(self, in_channels=1, embed_dim=128, patch_size=(8, 8, 8)):
        super().__init__()
        self.proj = nn.Conv3d(in_channels, embed_dim, kernel_size=patch_size, stride=patch_size)
        self.flatten = nn.Flatten(2)  # [B, E, N]
        self.transpose = nn.Sequential()

    def forward(self, x):
        x = self.proj(x)         # [B, E, D, H, W]
        x = self.flatten(x)      # [B, E, N]
        x = x.transpose(1, 2)    # [B, N, E]
        return x

class TransformerEncoder(nn.Module):
    def __init__(self, embed_dim=128, num_heads=4, depth=2, dropout=0.1):
        super().__init__()
        encoder_layer = nn.TransformerEncoderLayer(d_model=embed_dim, nhead=num_heads, dropout=dropout, batch_first=True)
        self.encoder = nn.TransformerEncoder(encoder_layer, num_layers=depth)

    def forward(self, x):
        return self.encoder(x)

class CNNTransformer3D(nn.Module):
    def __init__(self, num_classes=2, embed_dim=128, patch_size=(8, 8, 8), volume_size=(64, 64, 64)):
        super().__init__()
        self.patch_embed = PatchEmbedding3D(in_channels=1, embed_dim=embed_dim, patch_size=patch_size)
        num_patches = (volume_size[0] // patch_size[0]) * (volume_size[1] // patch_size[1]) * (volume_size[2] // patch_size[2])
        
        self.cls_token = nn.Parameter(torch.zeros(1, 1, embed_dim))
        self.pos_embed = nn.Parameter(torch.zeros(1, num_patches + 1, embed_dim))
        
        self.transformer = TransformerEncoder(embed_dim=embed_dim)
        self.norm = nn.LayerNorm(embed_dim)
        self.head = nn.Linear(embed_dim, num_classes)

    def forward(self, x):
        x = self.patch_embed(x)  # [B, N, E]
        B, N, E = x.shape

        cls_tokens = self.cls_token.expand(B, -1, -1)  # [B, 1, E]
        x = torch.cat((cls_tokens, x), dim=1)          # [B, N+1, E]
        x = x + self.pos_embed[:, :x.size(1), :]       # Add positional encoding

        x = self.transformer(x)                        # [B, N+1, E]
        x = self.norm(x[:, 0])                         # Use CLS token
        return self.head(x)


In [39]:

# Step 6: Training loop
device = torch.device('cuda' if torch.cuda.is_available() else 'cpu')
model = CNNTransformer3D(num_classes=2).to(device)
criterion = nn.CrossEntropyLoss()
optimizer = torch.optim.Adam(model.parameters(), lr=lr)

for epoch in range(num_epochs):
    model.train()
    running_loss = 0
    for inputs, labels in tqdm(train_loader, desc=f"Epoch {epoch+1}/{num_epochs}"):
        inputs, labels = inputs.to(device), labels.to(device)
        optimizer.zero_grad()
        outputs = model(inputs)
        loss = criterion(outputs, labels)
        loss.backward()
        optimizer.step()
        running_loss += loss.item()
    print(f"Epoch {epoch+1} Loss: {running_loss/len(train_loader):.4f}")



Epoch 1/50: 100%|██████████████████████████████████████████████████████████████████████| 22/22 [03:22<00:00,  9.23s/it]


Epoch 1 Loss: 1.0664


Epoch 2/50: 100%|██████████████████████████████████████████████████████████████████████| 22/22 [03:25<00:00,  9.36s/it]


Epoch 2 Loss: 0.7019


Epoch 3/50: 100%|██████████████████████████████████████████████████████████████████████| 22/22 [03:25<00:00,  9.34s/it]


Epoch 3 Loss: 0.7228


Epoch 4/50: 100%|██████████████████████████████████████████████████████████████████████| 22/22 [03:28<00:00,  9.46s/it]


Epoch 4 Loss: 0.7356


Epoch 5/50: 100%|██████████████████████████████████████████████████████████████████████| 22/22 [03:23<00:00,  9.26s/it]


Epoch 5 Loss: 0.7134


Epoch 6/50: 100%|██████████████████████████████████████████████████████████████████████| 22/22 [03:27<00:00,  9.42s/it]


Epoch 6 Loss: 0.7081


Epoch 7/50: 100%|██████████████████████████████████████████████████████████████████████| 22/22 [03:23<00:00,  9.27s/it]


Epoch 7 Loss: 0.7067


Epoch 8/50: 100%|██████████████████████████████████████████████████████████████████████| 22/22 [03:25<00:00,  9.33s/it]


Epoch 8 Loss: 0.7086


Epoch 9/50: 100%|██████████████████████████████████████████████████████████████████████| 22/22 [03:27<00:00,  9.45s/it]


Epoch 9 Loss: 0.7045


Epoch 10/50: 100%|█████████████████████████████████████████████████████████████████████| 22/22 [03:21<00:00,  9.18s/it]


Epoch 10 Loss: 0.7003


Epoch 11/50: 100%|█████████████████████████████████████████████████████████████████████| 22/22 [03:24<00:00,  9.29s/it]


Epoch 11 Loss: 0.7040


Epoch 12/50: 100%|█████████████████████████████████████████████████████████████████████| 22/22 [03:25<00:00,  9.35s/it]


Epoch 12 Loss: 0.7026


Epoch 13/50: 100%|█████████████████████████████████████████████████████████████████████| 22/22 [03:22<00:00,  9.22s/it]


Epoch 13 Loss: 0.7123


Epoch 14/50: 100%|█████████████████████████████████████████████████████████████████████| 22/22 [03:24<00:00,  9.29s/it]


Epoch 14 Loss: 0.7109


Epoch 15/50: 100%|█████████████████████████████████████████████████████████████████████| 22/22 [03:19<00:00,  9.07s/it]


Epoch 15 Loss: 0.7032


Epoch 16/50: 100%|█████████████████████████████████████████████████████████████████████| 22/22 [03:26<00:00,  9.39s/it]


Epoch 16 Loss: 0.6926


Epoch 17/50: 100%|█████████████████████████████████████████████████████████████████████| 22/22 [03:20<00:00,  9.13s/it]


Epoch 17 Loss: 0.7045


Epoch 18/50: 100%|█████████████████████████████████████████████████████████████████████| 22/22 [03:25<00:00,  9.36s/it]


Epoch 18 Loss: 0.7167


Epoch 19/50: 100%|█████████████████████████████████████████████████████████████████████| 22/22 [03:23<00:00,  9.24s/it]


Epoch 19 Loss: 0.7015


Epoch 20/50: 100%|█████████████████████████████████████████████████████████████████████| 22/22 [03:25<00:00,  9.33s/it]


Epoch 20 Loss: 0.7065


Epoch 21/50: 100%|█████████████████████████████████████████████████████████████████████| 22/22 [03:23<00:00,  9.25s/it]


Epoch 21 Loss: 0.7018


Epoch 22/50: 100%|█████████████████████████████████████████████████████████████████████| 22/22 [03:22<00:00,  9.23s/it]


Epoch 22 Loss: 0.6968


Epoch 23/50: 100%|█████████████████████████████████████████████████████████████████████| 22/22 [03:25<00:00,  9.33s/it]


Epoch 23 Loss: 0.7096


Epoch 24/50: 100%|█████████████████████████████████████████████████████████████████████| 22/22 [03:19<00:00,  9.05s/it]


Epoch 24 Loss: 0.6948


Epoch 25/50: 100%|█████████████████████████████████████████████████████████████████████| 22/22 [03:24<00:00,  9.29s/it]


Epoch 25 Loss: 0.7027


Epoch 26/50: 100%|█████████████████████████████████████████████████████████████████████| 22/22 [03:24<00:00,  9.31s/it]


Epoch 26 Loss: 0.7119


Epoch 27/50: 100%|█████████████████████████████████████████████████████████████████████| 22/22 [03:22<00:00,  9.20s/it]


Epoch 27 Loss: 0.7037


Epoch 28/50: 100%|█████████████████████████████████████████████████████████████████████| 22/22 [03:26<00:00,  9.39s/it]


Epoch 28 Loss: 0.6943


Epoch 29/50: 100%|█████████████████████████████████████████████████████████████████████| 22/22 [03:22<00:00,  9.20s/it]


Epoch 29 Loss: 0.7051


Epoch 30/50: 100%|█████████████████████████████████████████████████████████████████████| 22/22 [03:27<00:00,  9.44s/it]


Epoch 30 Loss: 0.7167


Epoch 31/50: 100%|█████████████████████████████████████████████████████████████████████| 22/22 [03:20<00:00,  9.12s/it]


Epoch 31 Loss: 0.6987


Epoch 32/50: 100%|█████████████████████████████████████████████████████████████████████| 22/22 [03:27<00:00,  9.44s/it]


Epoch 32 Loss: 0.6955


Epoch 33/50: 100%|█████████████████████████████████████████████████████████████████████| 22/22 [03:24<00:00,  9.31s/it]


Epoch 33 Loss: 0.6992


Epoch 34/50: 100%|█████████████████████████████████████████████████████████████████████| 22/22 [03:26<00:00,  9.37s/it]


Epoch 34 Loss: 0.6971


Epoch 35/50: 100%|█████████████████████████████████████████████████████████████████████| 22/22 [03:23<00:00,  9.24s/it]


Epoch 35 Loss: 0.7006


Epoch 36/50: 100%|█████████████████████████████████████████████████████████████████████| 22/22 [03:23<00:00,  9.26s/it]


Epoch 36 Loss: 0.7202


Epoch 37/50: 100%|█████████████████████████████████████████████████████████████████████| 22/22 [03:26<00:00,  9.37s/it]


Epoch 37 Loss: 0.7010


Epoch 38/50: 100%|█████████████████████████████████████████████████████████████████████| 22/22 [03:20<00:00,  9.12s/it]


Epoch 38 Loss: 0.6962


Epoch 39/50: 100%|█████████████████████████████████████████████████████████████████████| 22/22 [03:25<00:00,  9.34s/it]


Epoch 39 Loss: 0.6988


Epoch 40/50: 100%|█████████████████████████████████████████████████████████████████████| 22/22 [03:17<00:00,  8.96s/it]


Epoch 40 Loss: 0.6978


Epoch 41/50: 100%|█████████████████████████████████████████████████████████████████████| 22/22 [03:27<00:00,  9.43s/it]


Epoch 41 Loss: 0.6940


Epoch 42/50: 100%|█████████████████████████████████████████████████████████████████████| 22/22 [03:19<00:00,  9.06s/it]


Epoch 42 Loss: 0.6980


Epoch 43/50: 100%|█████████████████████████████████████████████████████████████████████| 22/22 [03:09<00:00,  8.61s/it]


Epoch 43 Loss: 0.6980


Epoch 44/50: 100%|█████████████████████████████████████████████████████████████████████| 22/22 [03:10<00:00,  8.64s/it]


Epoch 44 Loss: 0.7005


Epoch 45/50: 100%|█████████████████████████████████████████████████████████████████████| 22/22 [03:24<00:00,  9.31s/it]


Epoch 45 Loss: 0.6947


Epoch 46/50: 100%|█████████████████████████████████████████████████████████████████████| 22/22 [03:26<00:00,  9.38s/it]


Epoch 46 Loss: 0.6971


Epoch 47/50: 100%|█████████████████████████████████████████████████████████████████████| 22/22 [03:23<00:00,  9.26s/it]


Epoch 47 Loss: 0.6935


Epoch 48/50: 100%|█████████████████████████████████████████████████████████████████████| 22/22 [03:26<00:00,  9.39s/it]


Epoch 48 Loss: 0.6996


Epoch 49/50: 100%|█████████████████████████████████████████████████████████████████████| 22/22 [03:27<00:00,  9.43s/it]


Epoch 49 Loss: 0.6941


Epoch 50/50: 100%|█████████████████████████████████████████████████████████████████████| 22/22 [03:27<00:00,  9.42s/it]

Epoch 50 Loss: 0.6961





In [55]:
from sklearn.metrics import classification_report

model.eval()
all_preds = []
all_labels = []

with torch.no_grad():
    for inputs, labels in test_loader:
        inputs, labels = inputs.to(device), labels.to(device)
        outputs = model(inputs)
        _, predicted = torch.max(outputs, 1)
        all_preds.extend(predicted.cpu().numpy())
        all_labels.extend(labels.cpu().numpy())

# Report precision, recall, f1-score for each class

report = classification_report(all_labels, all_preds)
print("Classification Report:\n")
print(report)


Classification Report:

              precision    recall  f1-score   support

           0       0.00      0.00      0.00        23
           1       0.49      1.00      0.66        22

    accuracy                           0.49        45
   macro avg       0.24      0.50      0.33        45
weighted avg       0.24      0.49      0.32        45



  _warn_prf(average, modifier, f"{metric.capitalize()} is", len(result))
  _warn_prf(average, modifier, f"{metric.capitalize()} is", len(result))
  _warn_prf(average, modifier, f"{metric.capitalize()} is", len(result))
