<style>
    pre {
        white-space: pre-wrap;
        word-wrap: break-word;
    }
</style>

<div style="display:flex; justify-content:space-around; align-items:center; background-color:#cccccc; padding:5px; border:2px solid #333333;">
    <a href="https://www.um.es/web/estudios/grados/ciencia-ingenieria-datos/" target="_blank">
    <img src="https://www.um.es/documents/1073494/42130150/LogosimboloUMU-positivo.png" alt="UMU" style="height:200px; width:auto;">
    <a href="https://estudios.upct.es/grado/5251/inicio" target="_blank">
    <img src="https://www.upct.es/contenido/universidad/galeria/identidad-2021/logos/logos-upct/marca-upct/marca-principal/horizontal/azul.png" alt="UPCT" style="height:145px; width:auto;">
</div>

# Asignatura: **Deep Learning**

## Titulación: **Grado en Ciencia e Ingeniería de Datos**

## Práctica 2: Redes Convolucionales
### **Sesión 3/3: Segmentación de imágenes**

**Autores**: Antonio Martínez Sánchez, Juan Morales Sánchez, José Luís Sancho Gómez y Juan Antonio Botía Blaya

<div style="page-break-before: always;"></div>

### Contenidos
- [Requisitos](#requisitos)
- [Segmentación de imágenes](#segmentacion)
- [El dataset](#dataset)
- [Ejercicios](#ejercicios)
- [Ejercicios extra: reconstrucción 3D](#3D)

### Requisitos
<a class='anchor' id='requisitos'></a>

Se trabajará con notebooks de [Jupyter](https://jupyter.org/install) con código Python empleando como intérprete la última versión de [Miniconda](https://docs.anaconda.com/miniconda/). Se requiere la preinstalación (se recomienda utilizar [pip](https://pypi.org/project/pip/)) de los siguientes paquetes de Python:

- [Numpy](https://pypi.org/project/numpy/) (computación numérica)
- [Scipy](https://pypi.org/project/scipy/) (computación científica)
- [Tensorflow](https://www.tensorflow.org/install/pip?hl=es-419#linux) que incluye a Keras (deep Learning)
- [Scikit-learn](https://pypi.org/project/scikit-learn/) (machine Learning)
- [Mrcfile](https://pypi.org/project/mrcfile/) (operaciones E/S para ficheros MRC)
- [Matplotlib](https://pypi.org/project/matplotlib/) and [Seaborn](https://pypi.org/project/seaborn/) (visualización de datos)

Además, para la visualización 3D se recomienda la utilización de [Paraview](https://www.paraview.org/).

### Segmentación de imágenes
<a class='anchor' id='segmentacion'></a>

En esta sección vamos a adaptar la red U-Net que construimos para restaurar imágenes en la sección anterior, en esta sección la usaremos para segmentar las imágenes contenidas en tomogramas. Un tomograma es una imagen volumétrica (3D) donde los píxeles, cuadrados, pasan a ser vóxeles, cubos. No obstante, ahora no vamos a procesar los tomogramas completos, si no que vamos a ir extrayendo cortes, imágenes 2D, para procesarlos de manera independiente. Trabajar en 3D suele requerir de unos recursos computacionales mayores de los que presenta un ordenador de escritorio. Un tomograma tiene tres ejes: X, Y y Z. Por lo que se pueden realizar cortes directos (no requieren de interpolaciones complejas): en los planos X-Y a lo largo de todas las coordenadas del eje Z, en los planos X-Z a lo largo de todas las coordenadas del eje Y y en los planos Y-Z a lo largo de todas las coordenadas del eje X. La siguiente imagen permite visualizar un ejemplo de corte en los planos X-Y, X-Z e Y-Z para un tomograma.

![TomoSlices](tomo_slices.png)

El problema de segmentación semántica consiste en clasificar, asignar una etiqueta, todos los píxeles (o vóxeles) de una imagen. Es una de las tareas más complejas en visión por computador, se necesita analizar un entorno amplio de las imágenes para determinar su contenido, pero a la vez hay que ser preciso en la asignación de las clases para cada píxel. En 2015 la arquitectura U-Net se diseñó para resolver el problema de la segmentación de imágenes y aún sigue siendo la más exitosa para resolver esta tarea.

### El dataset
<a class='anchor' id='dataset'></a>

El conjunto de datos de partida son dos tomogramas:
- Original: tomograma sintético generado con [PolNet](https://github.com/anmartinezs/polnet) simulando versión simplificada del contexto celular visualizado a escala nanométrica a través de un microscopio electrónico. Este tomograma contine elevados niveles de ruido y distorsiones generados durante los procesos de adquisición de la micrografías y la reconstrucción tomográfica.
- Ground truth: tomograma segmentado con 6 clases, 0-background, 1-membranas, 2-microtubulo, 3-complejo molecular de gran tamaño, 4-complejo molecular de tamaño medio, 5-proteina de membrana.

![Segmentation](segmentation.png)

Los tomogramas tienen formato MRC, así que se pueden abrir con la función presentada en la sesión anterior, y se encuentran en el directorio **imgs/tomo**. En la sección de [Ejercicios](ejercicios) no veremos un tomograma como una imagen 3D, si no como la acumulación de muchas imágenes. Gracias a esto podremos entrenar un modelo a partir de los datos de un solo tomograma sin requerir computación de altas prestaciones.

### Ejercicios
<a class='anchor' id='ejercicios'></a>

**E1:** Adapta la red empleada anteriormente para restauración de imágenes para resolver el problema de la segmentación semántica.

**E2:** Carga los tomogramas del dataset y genera un conjunto de imágenes 2D resultados cortar el tomograma en el plano X-Y (las dos primeras dimensiones) para todas la coordenadas del eje Z (la última dimensión).

**E3:** Entrena un modelo y evalúa sus prestaciones. 

**E4:** Visualiza un par de cortes para verificar los resultados numéricos comparando con el ground truth.

**E5:** Repite los ejercicios 2 e 3 pero esta vez generando un dataset mayor añadiendo los cortes en los planos X-Z, a lo largo del eje Y, e Y-Z, a lo largo del eje X. 

### Ejercicios extra: reconstrucción 3D
<a class='anchor' id='3D'></a>

Se proponen unos ejercicios extra que permitirán obtener hasta **dos puntos adicionales** en la evaluación de la práctica 2. Solo sería necesario **hacer uno** de ellos. En ambos ejercicios, trataremos de obtener por vías diferentes segmentaciones completas (en 3D) de los tomogramas, en lugar de simples cortes en 2D.

![Segmentacion3D](seg_3d.png)

**Extra 1:** Con el último modelo entrenado, procesa todo el tomograma y reconstruye la segmentación en 3D. Para ello tendrás que reconstruir 3 tomogramas, uno para cada uno de los tres tipos de cortes X-Y, X-Z e Y-Z, y después definir un criterio fusionar los tres tomogramas en uno solo de tal modo que a un vóxel solo le corresponda una clase.

<!---
**Extra 2:** Para segmentar tomogramas, en lugar de trabajar con cortes 2D como hemos hecho en la sección anterior, tiene más sentido trabajar directamente en 3D. No obstante, entrenar modelos 3D suele ser mucho más costoso computacionalmente y además se requieren más datos de entrenamiento puesto que las redes tienen más parámetros. En la práctica, se requieren sistemas de computación de altas prestaciones para entrenar modelos y procesar datos en 3D. Este ejercicio propone entrenar un modelo para la segmentación directa de los tomogramas en 3D. Para el entrenamiento se proporcionan 10 tomogramas, más los 10 tomogramas de ground truth correspondientes, accesibles a través del servicio de cálculo científico [ATLAS](https://scc.atica.um.es/intro.html) de la Universidad de Murcia. El entrenamiento y procesamiento tiene que realizarse en los computadores de este servicio.
-->