# Deteccion de crecimiento urbano con imagenes del satélite Sentinel - 1

## 1_ Entrenamiento del modelo

   En este nootbook se realiza el entrenamiento del modelo de de ML. Es una red neuronal convolucional CNN con una arquitectura U-Net. Dicha red requiere un dataset compuesto por imágenes y máscaras para el entrenamiento. Estas ultimas son imagenes binarias que delimitan el objeto de interés, donde los píxeles tienen valor 1 donde está el objeto y 0 donde no. 
   
### Importación de librerias y definición de variables

In [None]:
from unetseg.train import TrainConfig, train
from unetseg.evaluate import plot_data_generator
import os

In [None]:
MODELO_INFO = "VHd_VVd_VHdVVd"
#bucket con las imagenes de entrenamiento
BUCKET_TRAIN = "gs://dym-indunor-temp/immap/v3_3/training/*.tif" 
#creamos la carpeta a donde descargaremos las imagenes
BASE_PATH            = "../"
PATH_S1_IMAGES_TRAIN = f"{BASE_PATH}imagenes_{MODELO_INFO}/training_images/"
#files con las anotaciones de poligonos y la region de interes para el entrenamiento 
ANNOTATIONS_FILE_NAME = f"gt_atlantico_plus_newanotations_4326.geojson"
AOI_FILE_NAME = f"detections_atlantico_plusnewanotations_buff1km_4326.geojson"
#tamaño de la imagen del dataset
SIZE =100
STEP_SIZE = 30
#nombre del modelo
MODELO = f'UNet_TEST_160x160_spe100_3N_spe300_colombia_{MODELO_INFO}.h5'
#bucket donde se guarda el modelo
SAVE = True
BUCKET_MODELO = "gs://dym-indunor-temp/immap/v3_3/models/"


### Generacion del data set de entrenamiento

   En esta etapa generamos el dataset de entrenamiento mediante el uso de **Satproc**. Esta herramienta permite generar el dataset con todas las caracteristicas necesarias para el modelo: tamaño , cantidad de imagenes, rango de valores, etc.

**Descarga de imágenes**

In [None]:
!mkdir -p $PATH_S1_IMAGES_TRAIN   #crea la carpeta
!gsutil -m cp -r $BUCKET_TRAIN   $PATH_S1_IMAGES_TRAIN # descarga de imagenes

Podemos verificar que los archivos fueron correctamente descargados

In [None]:
#!ls $PATH_S1_IMAGES_TRAIN # descomentar para ver el listado de imagenes

**Satproc**

Con la herramienta **satproc_extract_chips** se generan, a partir de las imágenes descargadas del bucket, imágenes (chips) generalmente mas pequeñas y máscaras (utilizando las anotaciones de verdad de campo).

In [None]:
path_to_files   = f'{PATH_S1_IMAGES_TRAIN}/*.tif' #carpeta a las imagenes
dataset_folder  = f'{BASE_PATH}dataset_{MODELO_INFO}/data_train/{str(SIZE)}_{str(STEP_SIZE)}/' #carpeta de destino del dataset
vector_file     = f'{BASE_PATH}data/shp/gt/'+ ANNOTATIONS_FILE_NAME # archivo vectorial de verdad de campo
vector_file_aoi = f'{BASE_PATH}data/shp/' + AOI_FILE_NAME

**OBS** : tanto las imagenes como el archivo vectorial deben tener la misma georeferencia, por ejemplo 4326

Ejecutamos satproc

In [None]:
!satproc_extract_chips \
                $path_to_files \
                -o  $dataset_folder \
                --size $SIZE \
                --step-size $STEP_SIZE \
                --aoi $vector_file_aoi \
                --labels $vector_file \
                --label-property 'class' \
                --classes 'A' \
                --rescale \
                --rescale-mode values  --min -15 --max 5

###### Los argumentos:

* **path_to_files** es la ruta a las imágenes 

* **o** es la ruta de destino 

Recomendamos que dicha ruta sea descriptiva, por ejemplo “data_train/120_40/ ” describe : Data_train → datos usados para entrenar; 120_40 → <tamaño de la imagen >_ <tamaño del step-size> 

* **size** tamaño de las imágenes resultantes o chips (las imágenes son cuadradas) 
* **step-size** paso del proceso. Debe ser menor o igual a *size*. Si *step-size* es igual que el *size* entonces no hay overlap en las imágenes resultantes. 

En ocasiones es útil para el entrenamiento generar los chips con un overlap de este modo tenemos más datos para entrenar. 


* **label-property** nombre del campo donde se define cada categoría (solo se usa para el entrenamiento) 

* **classes** nombres de las clases (como aparecen en el geojson), separados por espacios

* **aoi** ruta al archivo vectorial donde están definidas las anotaciones. Al definir una region de interés solo se procesan las imágenes que interceptan esas anotaciones.

* **rescale** lleva los valores de las bandas a 0-255 

Este comando va a generar dos carpetas en la ruta de destino : “images” y “extent”. Los archivos de la primera van a ser de tipo Tiff de 3 bandas (rgb) y los de la segunda van a ser también de tipo Tiff, pero de N bandas, donde cada una es una máscara binaria. N representa el número de clases, en este caso sólo una. 


## Entrenamiento

Generamos el entrenamiento del modelo utilizando los datasets creados en el paso previo. El modelo es una red neuronal CNN basado en la arquitectura U-Net. Este considera las imágenes y las máscaras binarias como inputs y genera una imagen con la probabilidad de encontrar al objeto de interés.

En esta etapa debemos definir la configuración del modelo de ML.

*Obs*: Es util usar un nombre para el archivo de pesos que de información sobre los parametros de entrenamiento. por ejemplo: < modelo >_< proyecto >_< dim_de_las_imagenes >_< size >_< step_size >_< step_per_epoch >.h5 o similares

In [None]:
config = TrainConfig(width      = 160,  #  tamaño de la imagen procesada por la UNet (debe ser multiplos de 16 , por ej 160, 320,etc; y no menor a 80)
                     height     = 160,
                     n_channels = 3,  #  número de canales de la imagen, rgb -> 3
                     n_classes  = 1, # número de clases a clasificar
                     apply_image_augmentation = True, #  si es True , amplia el dataset generando imagenes nuevas a partir de pequeñas variaciones de las ya existentes (rotación,)
                     seed       = 42,
                     epochs     = 20, # Cantidad de veces que el dataset entero puede pasar por el proceso de entrenamiento
                     batch_size = 16, #cantidad de datos que se procesan por vez, puede ser limitado por la memoria de gpu disponible (debe ser multiplo de 16)
                     steps_per_epoch          = 300, #  típicamente debe ser igual al numero de imágenes / el batch_size, si es mayor incrementara el número de imágenes generadas con image augmentation
                     early_stopping_patience  = 5, # a medida que entrena se guardan los resultados del entrenamiento despues de cada epoch, si el error no varió luego de ¿¿10 ?? iteraciones , se corta el proceso porque se entiende que el error ya disminuyó significativamente 
                     validation_split   = 0.2, # se divide la muestra en training (80% de los datos) y validation (20% de los datos) para calcular el error durante el proceso de entrenamiento
                     test_split         = 0.1, # Cantidad de imágenes del dataset
                     images_path        = dataset_folder,#ruta a las imágenes generadas con Satproc
                     model_path         = os.path.join(BASE_PATH,'data/weights/', MODELO),#  ruta del modelo entrenado
                     model_architecture = 'unet',
                     evaluate           = True  ,
                     class_weights      = [1]) 

Podemos visualizar alguna de las imágenes y máscaras del dataset de entrenamiento. A la izquierda se muestra la imágen y a la derecha la máscara 

In [None]:
plot_data_generator(num_samples=3, fig_size=(10, 10), train_config=config,img_ch = 3)

Corremos el entrenamiento.

In [None]:
res_config = train(config)

Graficamos las métricas generadas.

In [None]:
import matplotlib.pyplot as plt

plt.figure(figsize=(16,4))

plt.subplot(121)
plt.plot(res_config.history['loss'])
plt.plot(res_config.history['val_loss'])
plt.title('Loss')
plt.ylabel('Loss')
plt.xlabel('Epoch')
plt.legend(['Train', 'Val'], loc='upper left')

plt.subplot(122)
plt.plot(res_config.history['mean_io_u'])
plt.plot(res_config.history['val_mean_io_u'])
plt.title('mean_iou')
plt.ylabel('val_mean_iou')
plt.xlabel('Epoch')
plt.legend(['Train', 'Val'], loc='upper left')


plt.show()


In [None]:
if SAVE: 
    !gsutil cp -r config.model_path $BUCKET_MODELO