<a href="https://colab.research.google.com/github/josueocampol/Soldadura_IA_XAI_Tesis/blob/main/Conversi%C3%B3n_de_Metadatos.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

In [None]:
# Primero, instala las librerías necesarias para manejar archivos RAR.
# Esto incluye la herramienta 'unrar' del sistema y la librería de Python 'rarfile'.
!pip install SimpleITK
!pip install rarfile
!sudo apt-get install unrar -y

import SimpleITK as sitk
import os
from google.colab import files
import rarfile

# --- PASO 1: Subir y descomprimir la carpeta DICOM (formato RAR) ---

print("--- Paso 1: Subiendo el archivo RAR de tu carpeta DICOM ---")
print("Por favor, selecciona el archivo .rar que contiene tu serie DICOM.")
uploaded = files.upload()

rar_file_name = list(uploaded.keys())[0]

print(f"\nDescomprimiendo '{rar_file_name}' en la carpeta 'dicom_data'...")
with rarfile.RarFile(rar_file_name, 'r') as rar_ref:
    rar_ref.extractall("dicom_data")
print("¡Descompresión completa!")

# --- PASO 2: Encontrar las subcarpetas con series DICOM ---

print("\n--- Paso 2: Buscando series de imágenes DICOM en las subcarpetas ---")

# Usamos os.walk para recorrer recursivamente todas las carpetas.
dicom_series_folders = []
for root, dirs, files in os.walk("dicom_data"):
    # Para cada carpeta, intentamos obtener una serie DICOM.
    # Si la carpeta contiene archivos DICOM, GetGDCMSeriesIDs devolverá una lista de IDs.
    series_ids = sitk.ImageSeriesReader.GetGDCMSeriesIDs(root)
    if series_ids:
        # Si se encuentra al menos un ID, la carpeta es una serie DICOM válida.
        dicom_series_folders.append(root)

if not dicom_series_folders:
    print("¡Advertencia! No se encontraron series DICOM en ninguna de las subcarpetas.")
    print("Por favor, verifica que los archivos DICOM estén en la estructura de tu RAR.")
else:
    print(f"Se encontraron {len(dicom_series_folders)} series DICOM para procesar.")

    # --- PASO 3: Procesar cada serie y exportarla a NIfTI ---
    for i, series_path in enumerate(dicom_series_folders):
        print(f"\nProcesando serie {i+1} en: '{series_path}'")
        try:
            series_reader = sitk.ImageSeriesReader()

            # Obtenemos los nombres de los archivos de la serie.
            # SimpleITK hace la magia de identificarlos por sus metadatos, no por la extensión.
            dicom_names = series_reader.GetGDCMSeriesFileNames(series_path)

            series_reader.SetFileNames(dicom_names)
            image_3d = series_reader.Execute()

            print(f"Serie {i+1} procesada exitosamente.")
            print(f"  Dimensiones del volumen: {image_3d.GetSize()}")

            # Asignamos un nombre único a cada archivo NIfTI para evitar sobrescribirlos.
            output_nifti_path = f"volumen_medico_serie_{i+1}.nii.gz"
            print(f"  Guardando en formato NIfTI como '{output_nifti_path}'...")
            sitk.WriteImage(image_3d, output_nifti_path)

            # Descargamos cada archivo NIfTI a tu máquina local.
            print(f"  Descargando '{output_nifti_path}' a tu máquina...")
            files.download(output_nifti_path)
            print(f"  ¡Descarga completada para la serie {i+1}!")

        except Exception as e:
            print(f"Ocurrió un error inesperado al procesar la serie: {e}")

    print("\n--- ¡Proceso finalizado! ---")

Reading package lists... Done
Building dependency tree... Done
Reading state information... Done
unrar is already the newest version (1:6.1.5-1ubuntu0.1).
0 upgraded, 0 newly installed, 0 to remove and 35 not upgraded.
--- Paso 1: Subiendo el archivo RAR de tu carpeta DICOM ---
Por favor, selecciona el archivo .rar que contiene tu serie DICOM.


Saving DICOM0.rar to DICOM0.rar

Descomprimiendo 'DICOM0.rar' en la carpeta 'dicom_data'...
¡Descompresión completa!

--- Paso 2: Buscando series de imágenes DICOM en las subcarpetas ---
Se encontraron 1 series DICOM para procesar.

Procesando serie 1 en: 'dicom_data/DICOM0'
Serie 1 procesada exitosamente.
  Dimensiones del volumen: (512, 512, 1)
  Guardando en formato NIfTI como 'volumen_medico_serie_1.nii.gz'...
  Descargando 'volumen_medico_serie_1.nii.gz' a tu máquina...
Ocurrió un error inesperado al procesar la serie: 'list' object has no attribute 'download'

--- ¡Proceso finalizado! ---


In [None]:
# Primero, instala las librerías necesarias para manejar archivos RAR.
# Esto incluye la herramienta 'unrar' del sistema y la librería de Python 'rarfile'.
!pip install SimpleITK
!pip install rarfile
!sudo apt-get install unrar -y

import SimpleITK as sitk
import os
from google.colab import files
import rarfile

# --- PASO 1: Subir y descomprimir la carpeta DICOM (formato RAR) ---

print("--- Paso 1: Subiendo el archivo RAR de tu carpeta DICOM ---")
print("Por favor, selecciona el archivo .rar que contiene tu serie DICOM.")
uploaded = files.upload()

rar_file_name = list(uploaded.keys())[0]

print(f"\nDescomprimiendo '{rar_file_name}' en la carpeta 'dicom_data'...")
with rarfile.RarFile(rar_file_name, 'r') as rar_ref:
    rar_ref.extractall("dicom_data")
print("¡Descompresión completa!")

# --- PASO 2: Encontrar las subcarpetas con series DICOM ---

print("\n--- Paso 2: Buscando series de imágenes DICOM en las subcarpetas ---")

# Usamos os.walk para recorrer recursivamente todas las carpetas.
dicom_series_folders = []
for root, dirs, file_list in os.walk("dicom_data"):
    # Para cada carpeta, intentamos obtener una serie DICOM.
    # Si la carpeta contiene archivos DICOM, GetGDCMSeriesIDs devolverá una lista de IDs.
    series_ids = sitk.ImageSeriesReader.GetGDCMSeriesIDs(root)
    if series_ids:
        # Si se encuentra al menos un ID, la carpeta es una serie DICOM válida.
        dicom_series_folders.append(root)

if not dicom_series_folders:
    print("¡Advertencia! No se encontraron series DICOM en ninguna de las subcarpetas.")
    print("Por favor, verifica que los archivos DICOM estén en la estructura de tu RAR.")
else:
    print(f"Se encontraron {len(dicom_series_folders)} series DICOM para procesar.")

    # --- PASO 3: Procesar cada serie y exportarla a NIfTI ---
    for i, series_path in enumerate(dicom_series_folders):
        print(f"\nProcesando serie {i+1} en: '{series_path}'")
        try:
            series_reader = sitk.ImageSeriesReader()

            # Obtenemos los nombres de los archivos de la serie.
            # SimpleITK hace la magia de identificarlos por sus metadatos, no por la extensión.
            dicom_names = series_reader.GetGDCMSeriesFileNames(series_path)

            series_reader.SetFileNames(dicom_names)
            image_3d = series_reader.Execute()

            print(f"Serie {i+1} procesada exitosamente.")
            print(f"  Dimensiones del volumen: {image_3d.GetSize()}")

            # Asignamos un nombre único a cada archivo NIfTI para evitar sobrescribirlos.
            output_nifti_path = f"volumen_medico_serie_{i+1}.nii.gz"
            print(f"  Guardando en formato NIfTI como '{output_nifti_path}'...")
            sitk.WriteImage(image_3d, output_nifti_path)

            # Descargamos cada archivo NIfTI a tu máquina local.
            print(f"  Descargando '{output_nifti_path}' a tu máquina...")
            files.download(output_nifti_path)
            print(f"  ¡Descarga completada para la serie {i+1}!")

        except Exception as e:
            print(f"Ocurrió un error inesperado al procesar la serie: {e}")

    print("\n--- ¡Proceso finalizado! ---")

Reading package lists... Done
Building dependency tree... Done
Reading state information... Done
unrar is already the newest version (1:6.1.5-1ubuntu0.1).
0 upgraded, 0 newly installed, 0 to remove and 35 not upgraded.
--- Paso 1: Subiendo el archivo RAR de tu carpeta DICOM ---
Por favor, selecciona el archivo .rar que contiene tu serie DICOM.


Saving DICOM0.rar to DICOM0 (1).rar

Descomprimiendo 'DICOM0 (1).rar' en la carpeta 'dicom_data'...
¡Descompresión completa!

--- Paso 2: Buscando series de imágenes DICOM en las subcarpetas ---
Se encontraron 1 series DICOM para procesar.

Procesando serie 1 en: 'dicom_data/DICOM0'
Serie 1 procesada exitosamente.
  Dimensiones del volumen: (512, 512, 1)
  Guardando en formato NIfTI como 'volumen_medico_serie_1.nii.gz'...
  Descargando 'volumen_medico_serie_1.nii.gz' a tu máquina...


<IPython.core.display.Javascript object>

<IPython.core.display.Javascript object>

  ¡Descarga completada para la serie 1!

--- ¡Proceso finalizado! ---


In [None]:
# Primero, instala las librerías necesarias para manejar archivos RAR.
# Esto incluye la herramienta 'unrar' del sistema y la librería de Python 'rarfile'.
!pip install SimpleITK
!pip install rarfile
!sudo apt-get install unrar -y

import SimpleITK as sitk
import os
from google.colab import files
import rarfile

# --- PASO 1: Subir y descomprimir la carpeta DICOM (formato RAR) ---

print("--- Paso 1: Subiendo el archivo RAR de tu carpeta DICOM ---")
print("Por favor, selecciona el archivo .rar que contiene tu serie DICOM.")
uploaded = files.upload()

rar_file_name = list(uploaded.keys())[0]

print(f"\nDescomprimiendo '{rar_file_name}' en la carpeta 'dicom_data'...")
with rarfile.RarFile(rar_file_name, 'r') as rar_ref:
    rar_ref.extractall("dicom_data")
print("¡Descompresión completa!")

# --- PASO 2: Encontrar las subcarpetas con series DICOM ---

print("\n--- Paso 2: Buscando series de imágenes DICOM en las subcarpetas ---")

# Usamos os.walk para recorrer recursivamente todas las carpetas.
dicom_series_folders = []
for root, dirs, file_list in os.walk("dicom_data"):
    # Para cada carpeta, intentamos obtener una serie DICOM.
    # Si la carpeta contiene archivos DICOM, GetGDCMSeriesIDs devolverá una lista de IDs.
    series_ids = sitk.ImageSeriesReader.GetGDCMSeriesIDs(root)
    if series_ids:
        # Si se encuentra al menos un ID, la carpeta es una serie DICOM válida.
        dicom_series_folders.append(root)

if not dicom_series_folders:
    print("¡Advertencia! No se encontraron series DICOM en ninguna de las subcarpetas.")
    print("Por favor, verifica que los archivos DICOM estén en la estructura de tu RAR.")
else:
    print(f"Se encontraron {len(dicom_series_folders)} series DICOM para procesar.")

    # --- PASO 3: Procesar cada serie y exportarla a NIfTI ---
    for i, series_path in enumerate(dicom_series_folders):
        print(f"\nProcesando serie {i+1} en: '{series_path}'")
        try:
            series_reader = sitk.ImageSeriesReader()

            # Obtenemos los nombres de los archivos de la serie.
            # SimpleITK hace la magia de identificarlos por sus metadatos, no por la extensión.
            dicom_names = series_reader.GetGDCMSeriesFileNames(series_path)

            series_reader.SetFileNames(dicom_names)
            image_3d = series_reader.Execute()

            print(f"Serie {i+1} procesada exitosamente.")
            print(f"  Dimensiones del volumen: {image_3d.GetSize()}")

            # Asignamos un nombre único a cada archivo NIfTI para evitar sobrescribirlos.
            output_nifti_path = f"volumen_medico_serie_{i+1}.nii.gz"
            print(f"  Guardando en formato NIfTI como '{output_nifti_path}'...")
            sitk.WriteImage(image_3d, output_nifti_path)

            # Descargamos cada archivo NIfTI a tu máquina local.
            print(f"  Descargando '{output_nifti_path}' a tu máquina...")
            files.download(output_nifti_path)
            print(f"  ¡Descarga completada para la serie {i+1}!")

        except Exception as e:
            print(f"Ocurrió un error inesperado al procesar la serie: {e}")

    print("\n--- ¡Proceso finalizado! ---")

Reading package lists... Done
Building dependency tree... Done
Reading state information... Done
unrar is already the newest version (1:6.1.5-1ubuntu0.1).
0 upgraded, 0 newly installed, 0 to remove and 35 not upgraded.
--- Paso 1: Subiendo el archivo RAR de tu carpeta DICOM ---
Por favor, selecciona el archivo .rar que contiene tu serie DICOM.


Saving 25071622.rar to 25071622.rar

Descomprimiendo '25071622.rar' en la carpeta 'dicom_data'...
¡Descompresión completa!

--- Paso 2: Buscando series de imágenes DICOM en las subcarpetas ---
Se encontraron 4 series DICOM para procesar.

Procesando serie 1 en: 'dicom_data/25071622/06080001'
Serie 1 procesada exitosamente.
  Dimensiones del volumen: (512, 512, 39)
  Guardando en formato NIfTI como 'volumen_medico_serie_1.nii.gz'...
  Descargando 'volumen_medico_serie_1.nii.gz' a tu máquina...


<IPython.core.display.Javascript object>

<IPython.core.display.Javascript object>

  ¡Descarga completada para la serie 1!

Procesando serie 2 en: 'dicom_data/25071622/06080000'
Serie 2 procesada exitosamente.
  Dimensiones del volumen: (512, 512, 1)
  Guardando en formato NIfTI como 'volumen_medico_serie_2.nii.gz'...
  Descargando 'volumen_medico_serie_2.nii.gz' a tu máquina...


<IPython.core.display.Javascript object>

<IPython.core.display.Javascript object>

  ¡Descarga completada para la serie 2!

Procesando serie 3 en: 'dicom_data/25071622/06080002'
Serie 3 procesada exitosamente.
  Dimensiones del volumen: (512, 2219, 117)
  Guardando en formato NIfTI como 'volumen_medico_serie_3.nii.gz'...
  Descargando 'volumen_medico_serie_3.nii.gz' a tu máquina...


<IPython.core.display.Javascript object>

<IPython.core.display.Javascript object>

  ¡Descarga completada para la serie 3!

Procesando serie 4 en: 'dicom_data/DICOM0'
Serie 4 procesada exitosamente.
  Dimensiones del volumen: (512, 512, 1)
  Guardando en formato NIfTI como 'volumen_medico_serie_4.nii.gz'...
  Descargando 'volumen_medico_serie_4.nii.gz' a tu máquina...


<IPython.core.display.Javascript object>

<IPython.core.display.Javascript object>

  ¡Descarga completada para la serie 4!

--- ¡Proceso finalizado! ---
