# **Segmentación y Tracking de células madre usando la librería DeepCell**

## Realizado por Elena Tomás Vela y Tadeo Cabrera Gómez

# Indice
- Abstract
- Introduccion
- Seccion teórica
  - DeepCell
  - Segmentación
  - Tracking
- Seccion practica
  - Introduccion
  - Segmentacion
  - Tracking
- Conclusiones
- Bibliografia
- Tabla de tiempos

# **1. Abstract**
En este trabajo usaremos la librería DeepCell, basada en TensorFlow, para poder realizar segmentación y tracking de células madre

# **2. Introducción**

La visión por ordenador, también llamada visión informática o artificial es una rama de la ingeniería informática que trata métodos para adquirir, procesar, analizar y comprender imágenes con el fin de reproducir información numérica o simbólica de dichas imágenes que puedan ser tratados por un ordenador.

Uno de los usos de la visión por ordenador, y el que se desarrollará en este trabajo, es la segmentación y seguimiento (o tracking) de células en imágenes biomédicas. La segmentación celular consiste en identificar y delimitar cada célula dentro de una imagen, separándola del fondo, mientras que en el tracking TOOOOOOOOOOOOOOOOOOOOOODOOOOOOOOOOOOOOOOOOOOOOOO


Pasos:

### Paso 1. Cargar datos

La documentación de DeepCell cita [**una fuente para descargar datos**](https://datasets.deepcell.org/).

### Paso 2. Preprocesado de datos

Una vez hemos cargado los datos, el siguiente paso para entrenar un modelo de Machine Learning es realizar un **preprocesado**, donde TTTTTTTOOOOOOOOOODDDDDDDDDOOOOOOOOOO

- Normalización del histograma:
- Creación de generadores de datos
- Aplicación de transformaciones especializadas
- Generación de datos con las transformaciones
- Visualización de datos preprocesados

### Paso 3. Creación del modelo

Una vez preprocesados los datos, el siguiente paso es la creación del modelo. Para crear el modelo, hay que configurar los hiperparámetros. La librería clasifica los hiperparámetros en estas distintas secciones

- **HIPERPARÁMETROS DE LA ARQUITECTURA DEL MODELO**
    - **backbone**: Define la red neuronal base para la extracción de características.
    - **location**: Activa el uso de información de ubicación espacial en la red. Esto puede mejorar la segmentación al permitir que la red aprenda patrones espaciales.
    - **pyramid_levels**: Especifica los niveles de la Feature Pyramid Network (FPN). Cada nivel representa una escala diferente de la imagen, permitiendo detectar objetos de distintos tamaños.

- **HIPERPARÁMETROS DE AUMENTO DE DATOS Y TRANSFORMACIONES:** Estos parámetros definen cómo se manipulan las imágenes antes de ingresarlas a la red.
    - **seed**: Semilla aleatoria para asegurar la reproducibilidad en las transformaciones de datos.
    - **min_objects**: Establece el mínimo número de objetos (células) requeridos en una imagen para ser considerada válida.
    - **zoom_min**: Define el factor mínimo de zoom aleatorio aplicado a las imágenes. Por ejemplo, si una imagen tiene 256x256 píxeles, se puede escalar hasta un 75% de su tamaño original.
    - **crop_size**: Define el tamaño de recorte de las imágenes de entrada.
    - **outer_erosion_width**: Determina la cantidad de erosión aplicada a los bordes exteriores de los objetos segmentados.
    - **inner_distance_alpha**: Parámetro que ajusta automáticamente la distancia interna de los objetos en la segmentación.
    - **inner_distance_beta**: Controla la escala de la distancia interna entre objetos. Un valor mayor enfatiza la distancia entre células en la segmentación.
    - **inner_erosion_width**: Define cuánto se erosionan los bordes internos de los objetos segmentados. 0 significa que no se aplica erosión interna.
      
- **HIPERPARÁMETROS DE POST PROCESADO:** Estos parámetros afectan cómo se refinan los resultados después de que el modelo hace una predicción.
    - **maxima_threshold**: Define el umbral para identificar máximos locales en el mapa de predicción.
    - **interior_threshold**: Umbral para definir qué partes de una célula se consideran su interior en la segmentación. Valores bajos permiten detectar células más pequeñas.
    - **exclude_border**: Determina si se excluyen los objetos en los bordes de la imagen durante la segmentación.
    - **small_objects_threshold**: Tamaño mínimo para considerar un objeto segmentado como válido (0 significa que no se eliminan objetos pequeños).
    - **min_distance**: Define la distancia mínima entre objetos detectados para considerarlos como separados.

- **HIPERPARÁMETROS DE ENTRENAMIENTO:** Estos parámetros controlan cómo se entrena la red neuronal.
    - **epochs**: Número de veces que la red ve el conjunto de datos completos durante el entrenamiento.
    - **batch_size**: Número de imágenes procesadas simultáneamente en cada paso de entrenamiento.
    - **lr**: Tasa de aprendizaje del optimizador, es decir, cuánto ajusta los pesos en cada iteración.

### Paso 4. Entrenamiento del modelo


### Paso 5. Evaluación del modelo


Tabla de tiempos:
- Investigación de distintas propuestas de métodos de trabajo: 30 minutos
- Martes 25: 1 h 30 min
- Sección teórica

  - Abstract: 
  - Introducción: 
  - Segmentación: 

Bibliografia:
- [Cell Tracking Challenge](https://celltrackingchallenge.net/)

### Paso 1. Cargar datos

TODO

LUNES: 30 min
MARTES: 1h 30min
MIERCOLES: 12:30 ~ ??:??

### Paso 3. Creación del modelo

In [13]:
import os

import matplotlib.pyplot as plt
import numpy as np
from skimage.feature import peak_local_max
import tensorflow as tf

from deepcell.applications import NuclearSegmentation
from deepcell.image_generators import CroppingDataGenerator
from deepcell.losses import weighted_categorical_crossentropy
from deepcell.model_zoo.panopticnet import PanopticNet
from deepcell.utils.train_utils import count_gpus, rate_scheduler
from deepcell_toolbox.deep_watershed import deep_watershed
from deepcell_toolbox.metrics import Metrics
from deepcell_toolbox.processing import histogram_normalization

In [16]:
data_dir = '/data'
model_path = 'NuclearSegmentation'
metrics_path = 'metrics.yaml'
train_log = 'train_log.csv'

In [17]:
with np.load(os.path.join(data_dir, 'train.npz')) as data:
    X_train = data['X']
    y_train = data['y']

with np.load(os.path.join(data_dir, 'val.npz')) as data:
    X_val = data['X']
    y_val = data['y']

with np.load(os.path.join(data_dir, 'test.npz')) as data:
    X_test = data['X']
    y_test = data['y']

FileNotFoundError: [Errno 2] No such file or directory: '/data\\train.npz'

In [14]:
# Model architecture
backbone = "efficientnetv2bl"
location = True
pyramid_levels = ["P1","P2","P3","P4","P5","P6","P7"]

# Augmentation and transform parameters
seed = 0
min_objects = 1
zoom_min = 0.75
crop_size = 256
outer_erosion_width = 1
inner_distance_alpha = "auto"
inner_distance_beta = 1
inner_erosion_width = 0

# Post processing parameters
maxima_threshold = 0.1
interior_threshold = 0.01
exclude_border = False
small_objects_threshold = 0
min_distance = 10

# Training configuration
epochs = 16
batch_size = 16
lr = 1e-4

In [15]:
input_shape = (crop_size, crop_size, 1)

model = PanopticNet(
    backbone=backbone,
    input_shape=input_shape,
    norm_method=None,
    num_semantic_classes=[1, 1, 2],
    location=location,
    include_top=True,
    backbone_levels=["C1", "C2", "C3", "C4", "C5"],
    pyramid_levels=pyramid_levels,
)

Downloading data from https://storage.googleapis.com/tensorflow/keras-applications/efficientnet_v2/efficientnetv2-l_notop.h5
 27000832/473176280 [>.............................] - ETA: 2:47

KeyboardInterrupt: 

In [None]:
def semantic_loss(n_classes):
    def _semantic_loss(y_pred, y_true):
        if n_classes > 1:
            return 0.01 * weighted_categorical_crossentropy(y_pred, y_true, n_classes=n_classes)
        return tf.keras.losses.MSE(y_pred, y_true)

    return _semantic_loss

loss = {}

# Give losses for all of the semantic heads
for layer in model.layers:
    if layer.name.startswith("semantic_"):
        n_classes = layer.output_shape[-1]
        loss[layer.name] = semantic_loss(n_classes)

optimizer = tf.keras.optimizers.Adam(lr=lr, clipnorm=0.001)

model.compile(loss=loss, optimizer=optimizer)