### Preparação do ambiente.
Download da base de imagens de RM em DICOM

In [None]:
!wget -c "https://zenodo.org/record/16956/files/DICOM.zip"

In [None]:
!unzip DICOM.zip

### Instalação dos pacotes

In [None]:
!pip install pydicom opencv-python scikit-image

In [None]:
!pip install pyradiomics

#### Leitura dos Dados da Ressonância

In [None]:
from __future__ import print_function
import six
import os  # needed navigate the system to get the input data

import SimpleITK as sitk
import radiomics
from radiomics import featureextractor  # This module is used for interaction with pyradiomics
import matplotlib.pyplot as plt
import numpy as np
import pydicom as dicom
import cv2
import math
import matplotlib.pyplot as plt

In [None]:
# -------------------------------------------------------------------------------------
# Define uma função para plotar o antes e depois
def comparison_plot(original_image, before, after, title="", images_title=("Imagem Original", "Antes", "Depois")):

  # Criação do plot
  subplot_config = (1, 3)
  plt.rcParams['figure.figsize'] = [17, 7]
  figure, axes = plt.subplots(subplot_config[0], subplot_config[1])
  figure.subplots_adjust(top=0.95)

  # Ajusta as informações de cada subplot
  ## Imagem Original
  axes[0].imshow(original_image, cmap="gray")
  axes[0].axis('off')
  axes[0].set_title(images_title[0])

  # Imagem Anterior
  axes[1].imshow(before, cmap="gray")
  axes[1].axis('off')
  axes[1].set_title(images_title[1])

  # Imagem Posterior
  axes[2].imshow(after, cmap="gray")
  axes[2].axis('off')
  axes[2].set_title(images_title[2])

  plt.suptitle(title)
  plt.show()
# -------------------------------------------------------------------------------------

In [None]:
# -------------------------------------------------------------------------------------

# Define o diretório que contém cada paciente
ROOT_DIR = "/content/DICOM/ST000000/"
# -------------------------------------------------------------------------------------

# Função que verifica se todos os arquivos são diretórios
def check_if_all_dirs(root_dir, files):

  for file_ in files:
    if(os.path.isfile(os.path.join(root_dir, file_))):
      return(False)
  
  return(True)
# -------------------------------------------------------------------------------------

# Função que lê as imagens DICOM a partir de uma lista de arquivos
def read_dicom_files(root_dir, dicom_files):

  # Define os dados que serão armazenados
  info = {
      "filenames": [],
      "images": [],
      "PixelSpacing": []
  }
  
  for file_ in dicom_files:
    full_path = os.path.join(root_dir, file_)

    # Ignora diretórios
    if(os.path.isfile(full_path)):

      # Lê a imagem
      dicom_struct = dicom.dcmread(full_path)
      image = dicom_struct.pixel_array

      # Normaliza para Escala de Cinza
      image_norm = image / image.max()
      image_norm = (image_norm * 255).astype(np.uint8)
      image = image_norm

      # Guarda o nome do arquivo e a imagem
      info["filenames"].append(file_)
      info["images"].append(image)
      info["PixelSpacing"].append(dicom_struct.PixelSpacing)


  return(info)
# -------------------------------------------------------------------------------------

# Função que lê o conjunto de dados
def read_dataset(root_dir):

  # Descobre quais são as sequências
  dirs = os.listdir(root_dir)
  res = []
  for sub in dirs:
    # checking for matching elements
    if sub[0].lower() == 's':
            res.append(sub)
    
  # Define um dicionário para salvar os dados referentes a cada paciente
  data = {"sequence": [], "info": []}

  for dir_ in res:
    full_dir_path = os.path.join(root_dir, dir_)
    
    # Descobre os arquivos DICOM de cada paciente
    dir_files = sorted(os.listdir(full_dir_path))

    # Verifica se os arquivos do diretório são arquivos ou apenas mais diretórios
    all_dirs = check_if_all_dirs(full_dir_path, dir_files)
    
    # Se forem somente arquivos, lê as imagens DICOM (ILD)
    if(not all_dirs):
      info = read_dicom_files(full_dir_path, dir_files)

      # Guarda as informações
      data["sequence"].append(dir_)
      data["info"].append(info)

    # Se forem apenas diretórios, faz o acesso aos sub-diretórios e lê as imagens DICOM (VESSEL)
    #else:

    #  for sub_dir in dir_files:

        # Descobre quais são os sub-diretórios
    #    full_sub_dir_path = os.path.join(full_dir_path, sub_dir)
    #    sub_dir_files = sorted(os.listdir(full_sub_dir_path))

        # Lê as imagens
    #    info = read_dicom_files(full_sub_dir_path, sub_dir_files)

        # Guarda as informações
    #    data["patient"].append(int(sub_dir[-4:]))
    #    data["info"].append(info)
  
  return(data)
# -------------------------------------------------------------------------------------

In [None]:
# Lê os dados
data = read_dataset(ROOT_DIR)

print("Conjunto de Dados:")
print("\n  - Número de Sequencias: {}".format(len(data["sequence"])))
print("\n  - Sequencias: {}".format(data["sequence"]))
print("\n  - Quantidade de Imagens por Sequencia:")

for seq_id in range(len(data["sequence"])):
  sequence = data["sequence"][seq_id]
  list_of_images = data["info"][seq_id]["images"]
  print("     - {}: {}".format(sequence, len(list_of_images)))

#### Visualização das Imagens de Ressonância

##### Matplotlib

In [None]:
import math
import matplotlib.pyplot as plt
# -------------------------------------------------------------------------------------

# Função para plotar as imagens de um paciente
def plot_dataset(info, title="", num_rows=6, range_=(9, 20), fig_size=(15 , 20)):

  # Define um intervalo específico de fatias para plotar
  images = info["images"][range_[0]:range_[1]]
  filenames = info["filenames"][range_[0]:range_[1]]

  # Definições do plot
  ## Número de colunas no plot
  num_images = len(images)
  is_divisible = num_images % num_rows
  num_cols = (num_images // num_rows) + 1 if is_divisible else num_images // num_rows

  ## Criação do plot
  subplot_config = (num_rows, num_cols)
  plt.rcParams['figure.figsize'] = list(fig_size)
  figure, axes = plt.subplots(subplot_config[0], subplot_config[1])
  figure.subplots_adjust(top=0.95)

  # Plota todas as imagens lidas
  for index in range(len(images)):

    # Calcula a posição da imagem no plot
    row = math.floor(index / subplot_config[1])
    col = index % subplot_config[1]
    
    # Ajusta as informações de cada subplot
    axes[row, col].imshow(images[index], cmap="gray")
    axes[row, col].axis('off')
    axes[row, col].set_title(filenames[index])

  # Deleta os plots que não foram associados a imagens
  ids_to_remove = (num_rows * num_cols) - num_images
  for i in range(ids_to_remove):
    figure.delaxes(axes[-1, -(i+1)])

  plt.suptitle(title)
  plt.show()
# -------------------------------------------------------------------------------------

In [None]:
# Define o paciente que será plotado
SEQ = 'SE000001'

# Descobre o índice do paciente
seq_index = data["sequence"].index(SEQ)

# Plota 12 fatias do paciente
plot_dataset(data["info"][seq_index],
             title="Imagens da Sequencia {}".format(SEQ),
             num_rows=4,
             range_=(9, 21))

In [None]:
# Função que limiariza as fatias escolhidas de um paciente e plota
def plot_thresholded_slices(data, seq_index, slice_range, type_="simple", value=67, block_size=11, c=2, apply_blur=False):

  # Seleciona as images e os nomes
  images = data["info"][seq_index]["images"][slice_range[0]:slice_range[1]]
  filenames = data["info"][seq_index]["filenames"][slice_range[0]:slice_range[1]]
  
  ## Criação do plot
  subplot_config = (2, 3)
  plt.rcParams['figure.figsize'] = [12, 8]
  figure, axes = plt.subplots(subplot_config[0], subplot_config[1])
  figure.subplots_adjust(top=0.90)

  # Plota todas as imagens lidas
  for index in range(len(images)):

    # Calcula a posição da imagem no plot
    row = math.floor(index / subplot_config[1])
    col = index % subplot_config[1]

    # Aplica ou não a técnica de borramento conforme informado
    if(apply_blur):
      image = cv2.GaussianBlur(images[index], (5, 5), 0)
    else:
      image = images[index]
    
    # Aplica o tipo de threshold informado:

    ## Threshold Simples
    if(type_ == "simples"):
      ret, thresh = cv2.threshold(image, value, 255, cv2.THRESH_BINARY_INV)

    ## Threshold Adaptativo
    elif(type_ == "adaptativo"):
      thresh = cv2.adaptiveThreshold(image, 255, cv2.ADAPTIVE_THRESH_MEAN_C, cv2.THRESH_BINARY_INV, block_size, c)

    ## Threshold Otsu
    elif(type_ == "otsu"):
      ret, thresh = cv2.threshold(image, 0, 255, cv2.THRESH_BINARY_INV + cv2.THRESH_OTSU)

    else:
      print("Erro: técnica não implementada.")
      return

    # Ajusta as informações de cada subplot
    axes[row, col].imshow(thresh, cmap="gray")
    axes[row, col].axis('off')
    axes[row, col].set_title(filenames[index])

  plt.suptitle("Threshold {} em {} Fatias do Paciente {}".format(slice_range[1] - slice_range[0],
                                                                 type_[0].upper() + type_[1:],
                                                                 data["patient"][seq_index]))
  plt.show()

##### Jupyter Slider

* Instalação dos Pacotes e Importações

In [None]:
# Instala do JupyterLite
!pip install -q ipywidgets
# -------------------------------------------------------------------------------------

# Importa todas as interações
from ipywidgets import interact, interactive, fixed, interact_manual
import ipywidgets as widgets
# -------------------------------------------------------------------------------------

* Visualização (por paciente)

In [None]:
# Define a barra de escolha do paciente
sequence_widget = widgets.Dropdown(
    options=sorted(data["sequence"]),
    value=None,
    description='Sequencia:'
)

# Define a barra de escolha do arquivo DICOM referente ao paciente
file_widget = widgets.Dropdown(
    options=[],
    value=None,
    description='Arquivo:'
)
# -------------------------------------------------------------------------------------

# Função que atualiza as escolhas de arquivos DICOM de acordo com o paciente indicado
def update_files(*args):
    sequence_index = data["sequence"].index(sequence_widget.value)
    file_widget.options = sorted(data["info"][sequence_index]["filenames"])
# -------------------------------------------------------------------------------------

# Função para mostrar a imagem de acordo com o nome dela
def show_image(sequence, filename):
  plt.rcParams['figure.figsize'] = [6, 6]
  if(sequence is None): 
    return

  # Busca o índice do paciente indicado
  sequences = data["sequence"]
  sequence_index = sequence.index(sequence)
  print("Sequence is: ", sequence)
  print("Valor Sequencia: ", filename)
  # Busca o índice do arquivo indicado
  paths = data["info"][sequence_index]["filenames"]
  file_index = paths.index(filename)

  # Plota a imagem
  plt.imshow(data["info"][sequence_index]["images"][file_index], cmap='gray')
  plt.axis('off')

  slice_ = int(filename[2:])
  
  plt.title("Sequencia {} na Fatia {}".format(sequence, slice_))
  plt.show()
# -------------------------------------------------------------------------------------

# Função que observa mudanças na seleção do paciente
sequence_widget.observe(update_files, 'value')

# Função de interação
_ = interact(show_image, sequence=sequence_widget, filename=file_widget)
# -------------------------------------------------------------------------------------

#### Segmentação com Threshold Simples


* Jupyter Slider

In [None]:
%matplotlib inline
import cv2
# -------------------------------------------------------------------------------------

# Define a imagem

SEQ = "SE000002"
FILENAME = "MR000012"

#Busca o índice do paciente indicado
sequence_index = data["sequence"].index(SEQ)


# Busca o índice do arquivo indicado
paths = data["info"][sequence_index]["filenames"]
file_index = paths.index(FILENAME)

image = data["info"][sequence_index]["images"][file_index]

# Define a barra de valores para interação
value_slider = widgets.IntSlider(min=0, max=255, step=1, value=67, description="Limiar")

# Define a função de plot
def show_thres_image(value):
  plt.rcParams['figure.figsize'] = [6, 6]
  ret, thresh = cv2.threshold(image, value, 255, cv2.THRESH_BINARY)
  plt.imshow(thresh, cmap="gray") 
  plt.axis("off")

  print(data["sequence"].index(SEQ)) #]["filenames"][SLICE_INDEX])
  plt.title("Threshold Simples na Fatia {} da Sequencia {}".format(FILENAME,
                                                                  SEQ))
  plt.show() 

# Plota e controla os eventos
_ = interact(show_thres_image, value=value_slider)
# ----------------------------------------------------------------------------------


### Criando uma subimagem

In [None]:
#cropped_image = image[80:112, 105:137]
cropped_image = image[50:82, 80:112]

# Criação do plot
subplot_config = (1, 3)
plt.rcParams['figure.figsize'] = [17, 7]
figure, axes = plt.subplots(subplot_config[0], subplot_config[1])
figure.subplots_adjust(top=0.95)


plt.close()
plt.imshow(cropped_image, cmap=plt.cm.gray)
plt.figure()
# O threshold tem que gerar a saída com valor 1, pois o arquivo do Pyradiomics
# busca esse valor na imagem que serve de máscara
_, thresh = cv2.threshold(cropped_image, 100, 1, cv2.THRESH_BINARY)


plt.imshow(thresh, cmap=plt.cm.gray)
plt.show()

## Utilização da biblioteca Pyradiomics
Exemplo de como utilizar as imagens do numpy para o biblioteca Pyradiomics e extrair as características.

https://github.com/AIM-Harvard/pyradiomics/issues/449

In [None]:
!wget -c https://raw.githubusercontent.com/AIM-Harvard/pyradiomics/master/examples/exampleSettings/Params.yaml

In [None]:
# get the pixel information into a numpy array
data_spacing= data["info"][sequence_index]["PixelSpacing"][file_index]
#data_spacing=[1,1,1]
data_spacing.append(1)
print('The image has {} x {} voxels'.format(data_spacing[0],
                                            data_spacing[1]))
img_slice = cropped_image 
sitk_img = sitk.GetImageFromArray(img_slice)
sitk_img.SetSpacing((float(data_spacing[0]), float(data_spacing[1]), float(data_spacing[2]) ))
sitk_img = sitk.JoinSeries(sitk_img)

sitk_mask = sitk.GetImageFromArray(thresh)
sitk_mask.SetSpacing((float(data_spacing[0]), float(data_spacing[1]), float(data_spacing[2]) ))
sitk_mask = sitk.JoinSeries(sitk_mask)
sitk_mask = sitk.Cast(sitk_mask, sitk.sitkInt32) # MAKE SURE IT IS CASTED IN INT

# prepare the settings and load
params = '/content/Params.yaml'
extractor = featureextractor.RadiomicsFeatureExtractor(params)   #RadiomicsFeaturesExtractor(params)

#extract 
features = {}
features = extractor.execute(sitk_img, sitk_mask)


#plt.close()
#plt.imshow(data, cmap=plt.cm.gray)
#plt.figure()
#plt.imshow(data_downsampling, cmap=plt.cm.gray)
#plt.show()

In [None]:
#print(features)
for key, val in six.iteritems(features):
  print("\t%s: %s" %(key, val))
