# Gray-scale image features extraction

In [None]:
import SimpleITK as sitk
import numpy as np
import cv2
import os

In [None]:
# Directorios de imágenes y segmentaciones
img_path = "../data/HAM10000/images/ISIC_0024306.jpg"  # Imagen en formato JPG
mask_path = "../data/HAM10000/segmentations/ISIC_0024306_segmentation.png"  # Máscara en formato PNG

In [None]:
# Leer imagen con OpenCV y convertir a escala de grises si es necesario
img = cv2.imread(img_path, cv2.IMREAD_GRAYSCALE)  # PyRadiomics usa imágenes en escala de grises

# Leer máscara con OpenCV
mask = cv2.imread(mask_path, cv2.IMREAD_GRAYSCALE)

# Convertir a formato Numpy y asegurarse de que los valores sean binarios en la máscara
mask = np.where(mask > 0, 1, 0).astype(np.uint8)

# Convertir la imagen y máscara a objetos SimpleITK
img_sitk = sitk.GetImageFromArray(img)
mask_sitk = sitk.GetImageFromArray(mask)

# Guardar como NIfTI (.nii.gz)
sitk.WriteImage(img_sitk, "test_output/gray/imagen.nii.gz")
sitk.WriteImage(mask_sitk, "test_output/gray/segmentacion.nii.gz")

print("Conversión completada: imagen.nii.gz y segmentacion.nii.gz generadas.")

In [None]:
from radiomics import featureextractor
import radiomics
import pandas as pd
import SimpleITK as sitk
import logging
radiomics.setVerbosity(logging.ERROR)

# Cargar la imagen y la máscara en formato NIfTI
imagen = sitk.ReadImage("test_output/gray/imagen.nii.gz")
mascara = sitk.ReadImage("test_output/gray/segmentacion.nii.gz")

# Ver dimensiones
print("Dimensiones de la imagen:", imagen.GetSize())
print("Dimensiones de la máscara:", mascara.GetSize())

# Crear extractor
extractor = featureextractor.RadiomicsFeatureExtractor()

# Desactivar todas las características por defecto
extractor.disableAllFeatures()

# Activar las clases de características que queremos calcular
features = ["firstorder", "glcm", "gldm", "glrlm", "glszm", "ngtdm", "shape2D"]
for feature in features:
    extractor.enableFeatureClassByName(feature)

# Extraer características
resultados = extractor.execute(imagen, mascara)

# Convertir a DataFrame y guardar
df_resultados = pd.DataFrame.from_dict(resultados, orient="index", columns=["Valor"])
df_resultados.to_csv("test_output/gray/caracteristicas_radiomicas.csv")

print("Extracción completada: características guardadas en caracteristicas_radiomicas.csv")


In [None]:
df_resultados.head(-1)

# Color-scale image features straction

In [None]:
import SimpleITK as sitk
import numpy as np
import cv2
import os

In [None]:
# Directorios de imágenes y segmentaciones
img_path = "../data/HAM10000/images/ISIC_0024306.jpg"  # Imagen en formato JPG
mask_path = "../data/HAM10000/segmentations/ISIC_0024306_segmentation.png"  # Máscara en formato PNG

In [None]:
# Leer imagen con OpenCV 
img = cv2.imread(img_path, cv2.IMREAD_COLOR)

img_r = img[:, :, 2]  # Canal Rojo
img_g = img[:, :, 1]  # Canal Verde
img_b = img[:, :, 0]  # Canal Azul

# Leer máscara con OpenCV
mask = cv2.imread(mask_path, cv2.IMREAD_GRAYSCALE)

# Convertir a formato Numpy y asegurarse de que los valores sean binarios en la máscara
mask = np.where(mask > 0, 1, 0).astype(np.uint8)

# Convertir la imagen y máscara a objetos SimpleITK
img_r_sitk = sitk.GetImageFromArray(img_r)
img_g_sitk = sitk.GetImageFromArray(img_g)
img_b_sitk = sitk.GetImageFromArray(img_b)

mask_sitk = sitk.GetImageFromArray(mask)

# Guardar como NIfTI (.nii.gz)
sitk.WriteImage(img_r_sitk, "test_output/color/imagen_rojo.nii.gz")
sitk.WriteImage(img_g_sitk, "test_output/color/imagen_verde.nii.gz")
sitk.WriteImage(img_b_sitk, "test_output/color/imagen_azul.nii.gz")

sitk.WriteImage(mask_sitk, "test_output/color/segmentacion.nii.gz")

print("Conversión completada: imagen_rojo.nii.gz, imagen_verde.nii.gz, imagen_azul.nii.gz y segmentacion.nii.gz generadas.")

In [None]:
from radiomics import featureextractor
import pandas as pd
import SimpleITK as sitk
import radiomics
import logging
radiomics.setVerbosity(logging.ERROR)

# Cargar la imagen y la máscara en formato NIfTI
imagen_r = sitk.ReadImage("test_output/color/imagen_rojo.nii.gz")
imagen_g = sitk.ReadImage("test_output/color/imagen_verde.nii.gz")
imagen_b = sitk.ReadImage("test_output/color/imagen_azul.nii.gz")
mascara = sitk.ReadImage("test_output/color/segmentacion.nii.gz")

# Ver dimensiones
print("Dimensiones de la imagen roja:", imagen_r.GetSize())
print("Dimensiones de la imagen verde:", imagen_g.GetSize())
print("Dimensiones de la imagen azul:", imagen_b.GetSize())

# Crear extractor
extractor = featureextractor.RadiomicsFeatureExtractor()

# Desactivar todas las características por defecto
extractor.disableAllFeatures()

# Activar las clases de características que queremos calcular
features = ["firstorder", "glcm", "gldm", "glrlm", "glszm", "ngtdm", "shape2D"]
for feature in features:
    extractor.enableFeatureClassByName(feature)


# Extraer características
resultados_r = extractor.execute(imagen_r, mascara)
resultados_g = extractor.execute(imagen_g, mascara)
resultados_b = extractor.execute(imagen_b, mascara)

# Convertir a DataFrame y guardar
df_resultados_r = pd.DataFrame.from_dict(resultados_r, orient="index", columns=["Valor"])
df_resultados_g = pd.DataFrame.from_dict(resultados_g, orient="index", columns=["Valor"])
df_resultados_b = pd.DataFrame.from_dict(resultados_b, orient="index", columns=["Valor"])

df_resultados_r.to_csv("test_output/color/caracteristicas_radiomicas_rojo.csv")
df_resultados_g.to_csv("test_output/color/caracteristicas_radiomicas_verde.csv")
df_resultados_b.to_csv("test_output/color/caracteristicas_radiomicas_azul.csv")



## Images conversion

In [7]:
import os
import pandas as pd
import numpy as np
import cv2
import SimpleITK as sitk

In [5]:
image_folder = "../data/HAM10000/images/"
mask_folder = "../data/HAM10000/segmentations/"

In [8]:
image_files = os.listdir(image_folder)
mask_files = os.listdir(mask_folder)

In [10]:
# Crear directorios de salida
output_types = ["images/blue/", "images/green/", "images/red/", "images/gray/"]
output_main_dir = "output/data/"
output_dirs = [os.path.join(output_main_dir, x) for x in output_types]
output_segmentation_dir = os.path.join(output_main_dir, "segmentations/")

In [None]:
print(output_segmentation_dir)

In [None]:
print(output_dirs)

In [None]:
from tqdm import tqdm

for image in tqdm(image_files, desc="Procesando imágenes"):
    # Leer imagen
    img_path = os.path.join(image_folder, image)
    img = cv2.imread(img_path, cv2.IMREAD_COLOR)
    img_gray = cv2.imread(img_path, cv2.IMREAD_GRAYSCALE)
    
    # Separar canales
    img_r = img[:, :, 2]  # Canal Rojo
    img_g = img[:, :, 1]  # Canal Verde
    img_b = img[:, :, 0]  # Canal Azul
    
    # Guardar imágenes
    img_r_sitk = sitk.GetImageFromArray(img_r)
    img_g_sitk = sitk.GetImageFromArray(img_g)
    img_b_sitk = sitk.GetImageFromArray(img_b)
    img_gray_sitk = sitk.GetImageFromArray(img_gray)
    sitk.WriteImage(img_r_sitk, output_dirs[2]+ image.replace(".jpg", ".nii.gz"))
    sitk.WriteImage(img_g_sitk, output_dirs[1]+ image.replace(".jpg", ".nii.gz"))
    sitk.WriteImage(img_b_sitk, output_dirs[0]+ image.replace(".jpg", ".nii.gz"))
    sitk.WriteImage(img_gray_sitk, output_dirs[3]+ image.replace(".jpg", ".nii.gz"))

In [None]:
for image in tqdm(mask_files, desc="Procesando segmentaciones"):
    # Leer máscara
    mask_path = os.path.join(mask_folder, image)
    mask = cv2.imread(mask_path, cv2.IMREAD_GRAYSCALE)
    mask = np.where(mask > 0, 1, 0).astype(np.uint8)
    
    # Guardar máscara
    mask_sitk = sitk.GetImageFromArray(mask)
    sitk.WriteImage(mask_sitk, output_segmentation_dir + image.replace(".png", ".nii.gz"))

# Feature extractor

In [1]:
from radiomics import featureextractor
import pandas as pd
import SimpleITK as sitk
from tqdm import tqdm
import radiomics
import logging
radiomics.setVerbosity(logging.ERROR)

In [2]:
# Crear extractor
extractor = featureextractor.RadiomicsFeatureExtractor()

# Desactivar todas las características por defecto
extractor.disableAllFeatures()

# Activar las clases de características que queremos calcular
features = ["firstorder", "glcm", "gldm", "glrlm", "glszm", "ngtdm", "shape2D"]
for feature in features:
    extractor.enableFeatureClassByName(feature)


# Crear DataFrame vacío con image_id como índice
df_resultados_r = pd.DataFrame()
df_resultados_g = pd.DataFrame()
df_resultados_b = pd.DataFrame()
df_resultados_gray = pd.DataFrame()


In [3]:
# Función para convertir listas/arrays a valores escalares
def convertir_a_escalar(valor):
    if isinstance(valor, (list, tuple, set)):  # Si es lista/tupla/conjunto
        return valor[0]  # Tomar solo el primer valor
    elif isinstance(valor, dict):  # Si es un diccionario, convertir a string
        return str(valor)
    return valor  # Si ya es escalar, devolverlo sin cambios

In [11]:
# Iterar sobre las imágenes
for image in tqdm(image_files, desc="Extrayendo características"):
    image_id = image.replace(".jpg", "")  # Obtener ID de la imagen

    # Cargar imágenes en diferentes canales
    img_r = sitk.ReadImage(output_dirs[2] + image.replace(".jpg", ".nii.gz"))
    img_g = sitk.ReadImage(output_dirs[1] + image.replace(".jpg", ".nii.gz"))
    img_b = sitk.ReadImage(output_dirs[0] + image.replace(".jpg", ".nii.gz"))
    img_gray = sitk.ReadImage(output_dirs[3] + image.replace(".jpg", ".nii.gz"))

    # Cargar máscara
    mask = sitk.ReadImage(output_segmentation_dir + image_id + "_segmentation.nii.gz")

    # Extraer características
    resultados_r = extractor.execute(img_r, mask)
    resultados_g = extractor.execute(img_g, mask)
    resultados_b = extractor.execute(img_b, mask)
    resultados_gray = extractor.execute(img_gray, mask)

    # Convertir características a escalares y eliminar metadatos
    df_r = pd.DataFrame({k: [convertir_a_escalar(v)] for k, v in resultados_r.items() if "diagnostics_" not in k}, index=[image_id])
    df_g = pd.DataFrame({k: [convertir_a_escalar(v)] for k, v in resultados_g.items() if "diagnostics_" not in k}, index=[image_id])
    df_b = pd.DataFrame({k: [convertir_a_escalar(v)] for k, v in resultados_b.items() if "diagnostics_" not in k}, index=[image_id])
    df_gray = pd.DataFrame({k: [convertir_a_escalar(v)] for k, v in resultados_gray.items() if "diagnostics_" not in k}, index=[image_id])

    # Concatenar resultados en el DataFrame final
    df_resultados_r = pd.concat([df_resultados_r, df_r])
    df_resultados_g = pd.concat([df_resultados_g, df_g])
    df_resultados_b = pd.concat([df_resultados_b, df_b])
    df_resultados_gray = pd.concat([df_resultados_gray, df_gray])




Extrayendo características: 100%|██████████| 10015/10015 [2:08:46<00:00,  1.30it/s] 


In [12]:
# Asignar nombre a la columna del índice
df_resultados_r.index.name = "image_id"
df_resultados_g.index.name = "image_id"
df_resultados_b.index.name = "image_id"
df_resultados_gray.index.name = "image_id"

# Guardar resultados
df_resultados_r.to_csv("output/features/caracteristicas_radiomicas_rojo.csv")
df_resultados_g.to_csv("output/features/caracteristicas_radiomicas_verde.csv")
df_resultados_b.to_csv("output/features/caracteristicas_radiomicas_azul.csv")
df_resultados_gray.to_csv("output/features/caracteristicas_radiomicas_gray.csv")

print("Extracción finalizada. Los archivos CSV están guardados correctamente.")

Extracción finalizada. Los archivos CSV están guardados correctamente.
