# Cuaderno de Segmentación y Análisis Calibrado de Astrocitos

**Objetivo:** Este notebook detalla un flujo de trabajo para identificar núcleos de astrocitos, guardando y visualizando cada paso de filtrado. El análisis y la visualización están **calibrados con las dimensiones físicas del vóxel** para asegurar la precisión y reproducibilidad científica.

**Flujo de Trabajo:**
1.  **Configuración**: Definición de rutas y parámetros de calibración física y procesamiento.
2.  **Carga de Datos**: Carga de la imagen original (DAPI, GFAP y Microglía).
3.  **Pre-procesamiento (Otsu)**: Limpieza del canal DAPI.
4.  **Segmentación (Cellpose)**: Segmentación de todos los núcleos.
5.  **Filtrado Combinado**: Selección de núcleos por señal GFAP y exclusión por proximidad a señal de Microglía.
6.  **Post-procesamiento (Tamaño Físico)**: Limpieza final por volumen físico (µm³).
7.  **Visualización Integrada**: Visualización de todas las máscaras intermedias y finales en Napari.

## Paso 0: Activar el Backend Gráfico

**Importante:** Ejecuta esta celda una sola vez por sesión. El comando mágico `%gui qt` prepara el notebook para mostrar ventanas interactivas como las de Napari.

In [21]:
%gui qt

## Paso 1: Configuración de Rutas y Parámetros

Esta celda centraliza todas las variables que controlan el flujo de trabajo. Definir los parámetros aquí permite ajustar fácilmente el análisis para diferentes imágenes sin modificar el código en las celdas posteriores.

### Fundamento del Filtrado y Reproducibilidad Científica 🔬

La estrategia de este cuaderno se basa en un **filtrado secuencial**, un método robusto y común en el análisis de imágenes biológicas. En lugar de depender de un único algoritmo "mágico", aplicamos una serie de filtros lógicos, cada uno diseñado para eliminar un tipo específico de artefacto o señal no deseada.

Este enfoque mejora la **reproducibilidad científica** por varias razones:
1.  **Transparencia**: Cada paso del filtrado (Otsu, Cellpose, Co-localización, Tamaño) es explícito y sus parámetros están claramente definidos.
2.  **Objetividad**: Al definir umbrales y parámetros numéricos, reducimos la subjetividad inherente a la selección manual.
3.  **Adaptabilidad**: Si se utiliza un nuevo set de imágenes, solo es necesario reajustar los parámetros en esta celda para adaptar el mismo flujo de trabajo lógico, manteniendo la consistencia del método.
4.  **Calibración**: El script ahora utiliza la librería `aicsimageio` en el Paso 2 para leer las dimensiones del vóxel (en X, Y, y Z) directamente de los metadatos del archivo `.tif` o `.lif`. Esto asegura la máxima precisión y elimina un posible punto de error humano. Las variables `PHYSICAL_SCALE` y `VOXEL_VOLUME_UM3` se calculan automáticamente a partir de estos valores leídos.

---

### Variables de Parámetros de Procesamiento

* **`NUCLEUS_DIAMETER`**:
    * **Uso**: En la **Celda de Segmentación con Cellpose**.
    * **Explicación**: Es el parámetro más importante para Cellpose. Le informa al modelo sobre el tamaño esperado (en píxeles) de los objetos que debe buscar. Un valor correcto mejora drásticamente la precisión de la segmentación.

* **`MAX_DILATION_ITERATIONS`**:
    * **Uso**: En la **Celda de Filtrado Combinado**.
    * **Explicación**: Controla la **distancia máxima de búsqueda** para la señal de GFAP o microglía alrededor de cada núcleo. El script expandirá un anillo hasta este número de iteraciones buscando una señal significativa.

* **`GFAP_INTENSITY_THRESHOLD`**:
    * **Uso**: En la **Celda de Filtrado Combinado**.
    * **Explicación**: Es el umbral de decisión para considerar que una señal GFAP es positiva. Si la intensidad media en el anillo de búsqueda supera este valor (y se encuentra antes que la señal de microglía), el núcleo es aceptado.

* **`MICROGLIA_INTENSITY_THRESHOLD`** (Nuevo):
    * **Uso**: En la **Celda de Filtrado Combinado**.
    * **Explicación**: Es el umbral de decisión para la exclusión. Si la intensidad media de la microglía en el anillo de búsqueda supera este valor antes que la señal de GFAP, el núcleo se descarta.

* **`MIN_VOLUME_UM3`**:
    * **Uso**: En la **Celda de Post-procesamiento por Tamaño**.
    * **Explicación**: Es el parámetro para el filtro de limpieza final, **definido en unidades físicas (micrómetros cúbicos, µm³)**. El script lo convierte automáticamente a un umbral en vóxeles (`MIN_VOLUME_VOXELS`) usando las dimensiones de calibración.

In [22]:
from pathlib import Path

# --- Rutas de Archivos ---
project_root = Path.cwd().parent
base_filename = "Inmuno 26-07-23.lif - CTL 1-2 a"
subfolder = "CTL/CTL 1-2"
image_path = project_root / f"data/raw/{subfolder}/{base_filename}.tif"

# --- Rutas de Salida ---
output_dir = project_root / "data/processed" / base_filename
output_dir.mkdir(parents=True, exist_ok=True)
otsu_mask_path = output_dir / "01_otsu_mask.tif"
cellpose_mask_path = output_dir / "02_cellpose_mask.tif"
gfap_filtered_mask_path = output_dir / "03_gfap_microglia_filtered_mask.tif"
final_mask_path = output_dir / "04_final_astrocytes_mask.tif"

# --- Parámetros de Procesamiento ---
# NOTA: Los parámetros de calibración física se leerán automáticamente del archivo de imagen.
NUCLEUS_DIAMETER = 30
MAX_DILATION_ITERATIONS = 40
GFAP_INTENSITY_THRESHOLD = 10
MICROGLIA_INTENSITY_THRESHOLD = 50
MIN_VOLUME_UM3 = 75

# La conversión de MIN_VOLUME_UM3 a vóxeles se hará después de leer la calibración.
print("Parámetros de procesamiento definidos. La calibración física se obtendrá de los metadatos de la imagen.")

Parámetros de procesamiento definidos. La calibración física se obtendrá de los metadatos de la imagen.


## Paso 2: Carga de Datos y Calibración Automática

Utilizamos `aicsimageio` para abrir el archivo. Esta librería lee no solo los datos de la imagen como un array de NumPy, sino también los metadatos importantes, como las dimensiones físicas de cada vóxel. Una vez leídos, calculamos los parámetros de calibración y procedemos a separar los canales.

In [23]:
import numpy as np
import pandas as pd
from aicsimageio import AICSImage  # Usamos AICSImage en lugar de tifffile
from cellpose import models
from skimage.measure import regionprops, regionprops_table
from skimage.filters import threshold_otsu
from scipy.ndimage import binary_dilation
import napari

# --- Lectura de Imagen y Metadatos con AICSImageIO ---
print(f"Cargando imagen y metadatos desde: {image_path.name}...")
img = AICSImage(image_path)
image_stack = img.get_image_data("ZCXY", T=0) # Obtenemos el array en orden Z, Canal, Y, X

# --- CALIBRACIÓN AUTOMÁTICA ---
# Extraemos las dimensiones físicas de los metadatos (devueltas en µm)
Z_SPACING_UM = img.physical_pixel_sizes.Z
PIXEL_HEIGHT_UM = img.physical_pixel_sizes.Y
PIXEL_WIDTH_UM = img.physical_pixel_sizes.X

# Calculamos los parámetros de calibración sobre la marcha
VOXEL_VOLUME_UM3 = PIXEL_WIDTH_UM * PIXEL_HEIGHT_UM * Z_SPACING_UM
PHYSICAL_SCALE = (Z_SPACING_UM, PIXEL_HEIGHT_UM, PIXEL_WIDTH_UM)

# Ahora que tenemos la calibración, calculamos el umbral de volumen en vóxeles
MIN_VOLUME_VOXELS = int(MIN_VOLUME_UM3 / VOXEL_VOLUME_UM3)

print("\n--- Calibración Automática Exitosa ---")
print(f"Dimensiones del Vóxel (Z, Y, X) en µm: ({Z_SPACING_UM:.4f}, {PIXEL_HEIGHT_UM:.4f}, {PIXEL_WIDTH_UM:.4f})")
print(f"Umbral de {MIN_VOLUME_UM3} µm³ equivale a {MIN_VOLUME_VOXELS} vóxeles.")
print("--------------------------------------\n")


# --- Separación de Canales ---
dapi_channel = image_stack[:, 0, :, :]
gfap_channel = image_stack[:, 1, :, :]
microglia_channel = image_stack[:, 2, :, :]
print("Canales DAPI, GFAP y Microglía cargados y listos para el análisis.")

Cargando imagen y metadatos desde: Inmuno 26-07-23.lif - CTL 1-2 a.tif...

--- Calibración Automática Exitosa ---
Dimensiones del Vóxel (Z, Y, X) en µm: (1.0071, 0.3788, 0.3788)
Umbral de 75 µm³ equivale a 519 vóxeles.
--------------------------------------

Canales DAPI, GFAP y Microglía cargados y listos para el análisis.


## Paso 2: Carga de Datos e Importaciones

In [24]:
import tifffile
import numpy as np
import pandas as pd
from cellpose import models
from skimage.measure import regionprops, regionprops_table
from skimage.filters import threshold_otsu
from scipy.ndimage import binary_dilation
import napari

print(f"Cargando imagen: {image_path.name}...")
image_stack = tifffile.imread(image_path)
dapi_channel = image_stack[:, 0, :, :]
gfap_channel = image_stack[:, 1, :, :]
microglia_channel = image_stack[:, 2, :, :]
print("Canales DAPI, GFAP y Microglía cargados.")

Cargando imagen: Inmuno 26-07-23.lif - CTL 1-2 a.tif...
Canales DAPI, GFAP y Microglía cargados.


## Paso 3: Pre-procesamiento con Umbral de Otsu
Limpiamos el canal DAPI para eliminar ruido de fondo y guardamos el resultado.

In [25]:
print("Aplicando umbral de Otsu...")
otsu_threshold = threshold_otsu(dapi_channel)
otsu_mask = dapi_channel > otsu_threshold
dapi_channel_cleaned = np.where(otsu_mask, dapi_channel, 0)

tifffile.imwrite(otsu_mask_path, otsu_mask.astype(np.uint8))
print(f"Máscara de Otsu guardada en: {otsu_mask_path}")

Aplicando umbral de Otsu...
Máscara de Otsu guardada en: /home/daniel/Proyectos/astrocitos-3d-analysis/data/processed/Inmuno 26-07-23.lif - CTL 1-2 a/01_otsu_mask.tif


### Visualización: Máscara de Otsu (Calibrada)

In [26]:
viewer_otsu = napari.Viewer()
viewer_otsu.add_image(dapi_channel, name='DAPI Original', colormap='blue', scale=PHYSICAL_SCALE)
viewer_otsu.add_image(microglia_channel, name='Microglía Original', colormap='red', scale=PHYSICAL_SCALE)
viewer_otsu.add_image(gfap_channel, name='GFAP Original', colormap='green', scale=PHYSICAL_SCALE)
viewer_otsu.add_labels(otsu_mask, name='Máscara de Otsu', scale=PHYSICAL_SCALE)

<Labels layer 'Máscara de Otsu' at 0x7afe44787e00>

## Paso 4: Segmentación de Núcleos con Cellpose
Ejecutamos Cellpose sobre el canal DAPI limpio y guardamos la máscara de etiquetas resultante.

In [27]:
model = models.CellposeModel(gpu=True)
print("Ejecuting segmentación con Cellpose...")
cellpose_masks, _, _ = model.eval(
    dapi_channel_cleaned,
    diameter=NUCLEUS_DIAMETER,
    z_axis=0,
    do_3D=True
)

tifffile.imwrite(cellpose_mask_path, cellpose_masks.astype(np.uint16))
print(f"Máscara de Cellpose guardada en: {cellpose_mask_path}")

if cellpose_masks.max() > 0:
    props = regionprops_table(cellpose_masks, properties=('label',))
    print(f"\nNúmero total de núcleos encontrados por Cellpose: {len(props['label'])}")
else:
    print("\nNo se encontraron objetos en la segmentación inicial.")

Ejecuting segmentación con Cellpose...
Máscara de Cellpose guardada en: /home/daniel/Proyectos/astrocitos-3d-analysis/data/processed/Inmuno 26-07-23.lif - CTL 1-2 a/02_cellpose_mask.tif

Número total de núcleos encontrados por Cellpose: 363


### Visualización: Resultado de Cellpose (Calibrada)

In [None]:
viewer_cellpose = napari.Viewer()
viewer_cellpose.add_image(dapi_channel, name='DAPI Original', colormap='blue', scale=PHYSICAL_SCALE)
viewer_cellpose.add_labels(cellpose_masks, name='Resultado Cellpose (Crudo)', scale=PHYSICAL_SCALE)

<Labels layer 'Resultado Cellpose (Crudo)' at 0x7afe467fac60>



## Paso 5: Filtrado Combinado por Co-localización GFAP y Exclusión por Microglía

Este es el paso de filtrado principal, ahora con la lógica actualizada. Para cada núcleo, expandimos un anillo a su alrededor, píxel por píxel, y comprobamos qué señal (GFAP o Microglía) supera primero su umbral.

- **Éxito (Candidato a Astrocito)**: Si la señal GFAP es la primera en ser detectada.
- **Fallo (Núcleo Excluido)**: Si la señal de Microglía es detectada primero o al mismo tiempo.

In [29]:
MAX_DILATION_ITERATIONS = 50
GFAP_INTENSITY_THRESHOLD = 10
MICROGLIA_INTENSITY_THRESHOLD = 50


print("Iniciando filtrado combinado por señal GFAP y exclusión por Microglía...")
astrocyte_labels_candidate = []
nuclei_props = regionprops(cellpose_masks)

for nucleus in nuclei_props:
    nucleus_mask = (cellpose_masks == nucleus.label)
    current_mask = nucleus_mask
    
    for i in range(MAX_DILATION_ITERATIONS):
        dilated_mask = binary_dilation(current_mask)
        shell_mask = dilated_mask & ~current_mask
        
        if not np.any(shell_mask):
            break
            
        shell_gfap_intensity = gfap_channel[shell_mask].mean()
        shell_microglia_intensity = microglia_channel[shell_mask].mean()
        
        if shell_microglia_intensity > MICROGLIA_INTENSITY_THRESHOLD:
            break
            
        if shell_gfap_intensity > GFAP_INTENSITY_THRESHOLD:
            astrocyte_labels_candidate.append(nucleus.label)
            break
        
        current_mask = dilated_mask

gfap_filtered_mask = np.where(np.isin(cellpose_masks, astrocyte_labels_candidate), cellpose_masks, 0)

tifffile.imwrite(gfap_filtered_mask_path, gfap_filtered_mask.astype(np.uint16))
print(f"Máscara filtrada guardada en: {gfap_filtered_mask_path}")
print(f"\nProceso completado. Quedan {len(astrocyte_labels_candidate)} candidatos a astrocitos después del filtro combinado.")

Iniciando filtrado combinado por señal GFAP y exclusión por Microglía...
Máscara filtrada guardada en: /home/daniel/Proyectos/astrocitos-3d-analysis/data/processed/Inmuno 26-07-23.lif - CTL 1-2 a/03_gfap_microglia_filtered_mask.tif

Proceso completado. Quedan 251 candidatos a astrocitos después del filtro combinado.


### Visualización: Candidatos a Astrocitos (Calibrada)

In [11]:
viewer_gfap = napari.Viewer()
viewer_gfap.add_image(gfap_channel, name='GFAP', colormap='green', scale=PHYSICAL_SCALE)
viewer_gfap.add_image(microglia_channel, name='Microglia', colormap='magenta', scale=PHYSICAL_SCALE)
viewer_gfap.add_labels(gfap_filtered_mask, name='Candidatos a Astrocitos', scale=PHYSICAL_SCALE)

<Labels layer 'Candidatos a Astrocitos' at 0x7afe6c37bec0>

## Paso 6: Post-procesamiento por Tamaño Físico
Aplicamos el filtro final de limpieza, eliminando objetos con un volumen físico (µm³) menor al umbral definido.

In [30]:
print("Aplicando filtro final de tamaño...")
final_props = regionprops(gfap_filtered_mask)
final_astrocyte_labels = [prop.label for prop in final_props if prop.area >= MIN_VOLUME_VOXELS]

final_mask = np.where(np.isin(gfap_filtered_mask, final_astrocyte_labels), gfap_filtered_mask, 0)

tifffile.imwrite(final_mask_path, final_mask.astype(np.uint16))
print(f"Máscara final guardada en: {final_mask_path}")
print(f"Número final de astrocitos identificados: {len(final_astrocyte_labels)}")

Aplicando filtro final de tamaño...
Máscara final guardada en: /home/daniel/Proyectos/astrocitos-3d-analysis/data/processed/Inmuno 26-07-23.lif - CTL 1-2 a/04_final_astrocytes_mask.tif
Número final de astrocitos identificados: 169


## Paso 7: Visualización Final Integrada
Visualizamos la imagen original multi-canal junto a todas las máscaras generadas en el pipeline, permitiendo una revisión completa del proceso. Cada máscara se puede activar o desactivar para comparar los resultados de cada paso.

In [20]:
print("Abriendo Napari con todas las capas del pipeline...")

# Cargamos todas las máscaras guardadas para asegurar que tenemos las versiones correctas
otsu_mask_viz = tifffile.imread(otsu_mask_path)
cellpose_mask_viz = tifffile.imread(cellpose_mask_path)
gfap_filtered_mask_viz = tifffile.imread(gfap_filtered_mask_path)
final_mask_viz = tifffile.imread(final_mask_path)

viewer_final = napari.Viewer(title="Pipeline de Segmentación de Astrocitos")

# Capas de las señales originales
viewer_final.add_image(
    image_stack,
    channel_axis=1,
    name=["DAPI", "GFAP", "Microglia"],
    colormap=["blue", "green", "magenta"],
    scale=PHYSICAL_SCALE
)

# Capas de las máscaras generadas
viewer_final.add_labels(otsu_mask_viz, name='01 - Máscara Otsu', scale=PHYSICAL_SCALE, visible=False)
viewer_final.add_labels(cellpose_mask_viz, name='02 - Máscara Cellpose', scale=PHYSICAL_SCALE, visible=False)
viewer_final.add_labels(gfap_filtered_mask_viz, name='03 - Filtro GFAP y Microglia', scale=PHYSICAL_SCALE, visible=False)
viewer_final.add_labels(final_mask_viz, name='04 - Astrocitos Finales', scale=PHYSICAL_SCALE, visible=True)

Abriendo Napari con todas las capas del pipeline...


<Labels layer '04 - Astrocitos Finales' at 0x7afe45104980>