In [None]:
!pip install pysatproc
!pip install unetseg

In [None]:
!pip install --force-reinstall numpy==1.20

In [None]:
!pip install unetseg

# 2_ Predicción

## Generación del data set de predicción

Descarga las imagenes del bucket

In [None]:
PATH_s1_images_train = ""

!mkdir -p $PATH_s1_images_train

In [None]:
bucket = "gs://" 
!gsutil -m cp -r $bucket $PATH_s1_images_train

In [None]:
!gdalbuildvrt *.vrt *.tif

### Satproc

Con esta herramienta genereamos un dataset de imágenes de predicción que, a diferencia del de entrenamiento, solo contiene imágenes.

Pasamos la ruta de las imágenes de predicción y la ruta donde queremos que se guarde el resultado.



In [None]:
!ls ../images_immap/images_s1/s1_2021_edited/zonas_prediccion/

In [None]:
size =160
step_size = size
path_to_files = ".vrt"
output_folder = "../dataset/data_predict/"+str(size)+"_"+str(step_size)+"/"
vector_file_aoi = "../data/shp/.geojson" 

*Obs*: Dado que aquí nos interesa predecir sobre toda la imágen y por ende no tener overlaps,  *step_size* debe ser igual a *size*.

In [None]:
#!satproc_extract_chips --help

In [None]:
!satproc_extract_chips \
                $path_to_files \
                -o  $output_folder \
                --size $size \
                --step-size $step_size \
                --aoi $vector_file_aoi \
                --rescale \
                --rescale-mode values --min -15 --max 5

## Prediccion

In [None]:
from unetseg.predict import PredictConfig, predict
from unetseg.evaluate import plot_data_results
import os

Definimos la configuración para la predicción. Debemos pasar la ruta de las imágenes en el dataset de predicción, que es la ruta de salida de la línea anterior, y la correspondiente al modelo que entrenamos.

In [None]:
model = "UNet_160x160_spe100_3N_spe600_colombia_modelo4_vhvv2.h5"
predict_config = PredictConfig(
                                    images_path=os.path.join('../dataset/data_predict//',"","",str(size)+'_'+str(step_size)), # ruta a las imagenes sobre las cuales queremos predecir
                                    results_path=os.path.join('../dataset/data_results//','','','',str(size)+'_'+str(step_size)), # ruta de destino para nuestra predicción
                                    batch_size=16,
                                    model_path=os.path.join('../data/weights',model),  #  ruta al modelo (.h5)
                                    height=160,
                                    width=160,
                                    n_channels=3,
                                    n_classes=1,
                                    class_weights= [1])
          

A continuación ejecutamos la predicción .

In [None]:
predict(predict_config)  # Ejecuta la predicción

Podemos ver algunos resultados preliminares de la predicción. A la izquierda se encuentra la imágen y a la derecha, la predicción.

In [None]:
plot_data_results(num_samples=2, fig_size=(2, 2), predict_config=predict_config, img_ch =2, n_bands=3)

## Post procesamiento

En esta etapa se aplican los siguientes métodos de post-procesamiento a los resultados de la predicción realizada por el modelo:

* Filtrado por umbral
* Poligonizado

In [None]:
from satproc.postprocess.polygonize import polygonize 
from satproc.filter import filter_by_max_prob

## Filtrado por umbral
En este proceso se realiza un filtrado de las imágenes mediante la aplicación de un umbral sobre los valores de los rásteres, que en este caso representan la probabilidad (valores entre 0 y 1), quedandonos así con las de mayor precisión.

In [None]:
thr=5
size=160
input_dir = pred_slope
folder = os.path.join('../dataset/data_results/'+str(size)+'_'+str(step_size)) # ruta de destino para nuestra predicción
                                 
!mkdir -p  $folder

In [None]:
print(pred_slope)

In [None]:
filter_by_max_prob(input_dir  = input_dir,
                   output_dir = folder,
                   threshold  = 0.5)

## Poligonizado
La siguiente función aplica una rutina de poligonización sobre los resultados de la predicción del modelo y genera un archivo vectorial en formato GeoPackage (GPKG). La rutina aplica `gdal_polygonize.py` a cada chip resultado generando un GPKG para cada chip, y luego une todos estos archivos en uno solo, de manera eficiente.



In [None]:
input_path = "../dataset/data_results//tif/"
thr = '03'
output_path = '../dataset/data_results/60x160_thr'+str(thr)+'_woutmontains.gpkg'

print(input_path)
polygonize(threshold=0.3, input_dir=input_path,      output=output_path)

In [None]:
src_file =output_path
dst_file = output_path[:-5] + '_utm.gpkg'
print(src_file)
print(dst_file)
!ogr2ogr -s_srs EPSG:4326 -t_srs EPSG:32720 -f 'GPKG' $dst_file $src_file

In [None]:
!ogrinfo -al $dst_file | head -n25

In [None]:
min_area = 10000

input_path = dst_file
output_path = dst_file[:-5]+ "_up10000.gpkg"

tabla =  "modelo3_5_municipios_3D_VHVV2_s1_2021_160x160_thr03_woutmontains"
print(tabla)
print(input_path)
print(output_path)

In [None]:

!ogr2ogr \
    -t_srs EPSG:32720 \
    -f "GPKG" \
    -sql "SELECT * FROM $tabla m WHERE (ST_Area(geom) > $min_area)" \
    -dialect SQLITE \
    -nln results \
    $output_path \
    $input_path