# Normalização dos dados (zscore normalization)
* Essa normalização permite deixar os dados padronizados, uma vez que após a normalização a média do dado (volume) é 0 e o desvio padrão é 1.

* A normalização foi feita ao implementar a seguinte fórmula:

$$ X_{nor} =  (X - \mu) / (\sigma)$$

* Onde X é a matriz e $\mu$ e $\sigma$ são a média e o desvio padrão da matriz, repectivamente.

* Pode haver arredondamento nos cálculos ou uma pequena discrepância devido à precisão numérica. O que deixa os valores da média e desvio padrão próximo de 0 e 1 respectivamente, e não exatamente 0 e 1.

* Para manter os valores entre -1 e 1 foi feito a multiplicação por 2 e diminuição de 1. 

In [1]:
import nibabel as nib
import os
import glob
import numpy as np
def zscore_normalization(input_paths: str):
    for input_path in input_paths:
        patient_id = os.path.basename(input_path)
        T1_file = 'iso_brain_T1w.nii.gz'

        T1_data = nib.load(os.path.join(input_path, T1_file)).get_fdata().astype(np.float32)
        print(f"Sujeito {patient_id}")

        print(f"before normalization: mean de {np.mean(T1_data)} e standard deviation de {np.std(T1_data)}. Shape: {T1_data.shape}")

        T1_norm_zs = (T1_data - T1_data.mean()) / (T1_data.std())

        T1_norm_mm = (T1_norm_zs - T1_norm_zs.min()) / (T1_norm_zs.max() - T1_norm_zs.min())

        T1_norm_mm = (T1_norm_mm*2) - 1

        print(f"after gaussian normalization: mean de {np.mean(T1_norm_zs)} e standard deviation de {np.std(T1_norm_zs)}. Shape: {T1_norm_zs.shape}")

        label_file = 'iso_brainmask_T1w.nii.gz'

        print(f"minimo: {T1_norm_zs.min()}, maximo: {T1_norm_zs.max()}")
        
        print(f"after gaussian normalization (-1 e 1): mean de {np.mean(T1_norm_mm)} e standard deviation de {np.std(T1_norm_mm)}. Shape: {T1_norm_mm.shape}")
        print(f"minimo: {T1_norm_mm.min()}, maximo: {T1_norm_mm.max()}")

        label = nib.load(os.path.join(input_path, label_file))
        label_data = label.get_fdata().astype(np.uint8)
        mask = label_data

        print(f"máscara -> minimo: {mask.min()}, maximo: {mask.max()}")

        out_name = patient_id + '.npz'
        np.savez_compressed(os.path.join(input_path, out_name), data=T1_norm_mm, mask=mask)
    return T1_norm_mm

folder_mri = f"/home/joany/dataset_train/train"
input_paths = glob.glob(os.path.join(folder_mri, "*"))

image = zscore_normalization(input_paths)




Sujeito CC0018
before normalization: mean de 300.472412109375 e standard deviation de 465.2901611328125. Shape: (150, 256, 256)
after gaussian normalization: mean de 4.647175444461027e-07 e standard deviation de 0.9999952912330627. Shape: (150, 256, 256)
minimo: -1.084088921546936, maximo: 5.267523288726807
after gaussian normalization (-1 e 1): mean de -0.6586437821388245 e standard deviation de 0.3148791193962097. Shape: (150, 256, 256)
minimo: -1.0, maximo: 1.0
máscara -> minimo: 0, maximo: 1
Sujeito CC0241
before normalization: mean de 374.070556640625 e standard deviation de 545.2684936523438. Shape: (256, 196, 256)
after gaussian normalization: mean de 7.94703282736009e-07 e standard deviation de 0.9999997019767761. Shape: (256, 196, 256)
minimo: -0.6860300302505493, maximo: 9.906916618347168
after gaussian normalization (-1 e 1): mean de -0.8704742193222046 e standard deviation de 0.18880484998226166. Shape: (256, 196, 256)
minimo: -1.0, maximo: 1.0
máscara -> minimo: 0, maximo: