# SCANEO


Como paso final para crear nuestro conjunto de datos de entrenamiento, necesitamos preparar los datos para IA. Aquí se pueden realizar numerosas tareas, como:

- **Limpieza de datos**: eliminar imágenes corruptas, eliminar imágenes con demasiada nubosidad, etc.
- **Ingeniería de características**: calcular índices de vegetación, calcular estadísticas, etc.
- **Análisis de datos**: representar series temporales, representar histogramas, etc.
- **Etiquetado**: crear etiquetas para las imágenes, etc.

Para cada caso, puedes usar tus herramientas favoritas. Aquí demostraremos el etiquetado con [SCANEO](https://github.com/earthpulse/scaneo).

SCANEO es una aplicación web de etiquetado que permite etiquetar imágenes satelitales (para identificar, por ejemplo, objetos presentes, tipos de terreno, etc.) de forma fácil y rápida. El servicio que ofrece SCANEO es vital, ya que es necesario preparar los datos satelitales para que puedan ser procesados ​​por redes neuronales, lo que permite el aprendizaje activo.

Antes de ejecutar la interfaz web, debemos asegurarnos de tener el paquete `scaneo` instalado en nuestra máquina y, si no, instalarlo.


In [None]:
# !uv add scaneo

You can run `scaneo` with the following options.


In [None]:
!uv run scaneo --help

Puedes ejecutar `scaneo` abriendo una terminal y ejecutando:

```
uv run scaneo
```

Luego, puedes acceder a la interfaz web en `http://localhost:8000`.

> Puedes cambiar el host y el puerto con `scaneo --host 0.0.0.0 --port 8000`.

¡Vamos a ver lo que nos puede ofrecer!


![scaneo](img/scaneo.png)


Para hacer la demostración de SCANEO vamos a utilizar un dataset diferente al que hemos creado, porque así podemos enseñar una de las mejores capacidades de SCANEO: ¡el etiquetado automático!

Para ello, primero necesitamos preparar el conjunto de entrenamiento de prueba, cómo no, utilizando la CLI del EOTDL. La primera vez puede tomar un poco de tiempo, tened paciencia! Además, también estamos descargando un modelo de segmentación de carreteras.


In [None]:
!uv run eotdl models get SCANEO -p .. -a -f   # Como path le damos el directorio del proyecto,
                                              # -a para que se descarguen los archivos STAC
                                              # -f para que se fuerce la descarga

Ahora sí, ya tenemos nuestro dataset. ¡Vamos a etiquetarlo!


## Etiquetado asistido por IA


Una vez hayamos jugado con las herramientas de etiquetado podemos probar la mejor funcionalidad de SCANEO, que es añadir e integrar tus propios modelos para el etiquetado automático del conjunto de entrenamiento. Como podéis imaginar, esto acelera mucho los tiempos de etiquetado.

Antes de nada, debemos desplegar la API de inferencia de SCANEO. Para ello, haremos lo siguiente


In [None]:
!git clone https://github.com/earthpulse/scaneo ../scaneo-api

Ahora cpiamos el modelo de `SCANEO/models/` a `scaneo-api/inference/`


In [None]:
cp -rf ../SCANEO/models ../scaneo-api/inference

Y levantamos la API


In [None]:
!cd ../scaneo-api && make inference

Ahora podemos ir a la API de inferencia en http://0.0.0.0:8001/docs. El modelo de segmentación de carreteras con imágenes de Sentinel-2 está en http://0.0.0.0:8001/s2-roads

Ahora, para activar nuestro modelo, debemos seguir los siguientes pasos:

1. Vamos a http://localhost:8000/models y creamos un nuevo modelo.
2. Le ponemos un nombre y descripción, que puede ser algo relacionado con `SIG Libre 2025`, y como url ponemos `http://0.0.0.0:8001/s2-roads`. Como tarea, segmentación. No es necesario hacer nada más.
3. Ahora, vamos a nuestra campaña, al apartado de settings, y añadimos nuestro modelo. Es importante indicar que para que funcione correctamente, debemos poner la clase de `roads` como 1 y las demás dejarlas vacías, sin valor, ni siquiera 0. Y guardamos.
4. Volvemos a la campaña, seleccionamos una imagen, la clase de `roads` y en la pestaña superior izquierda, hacemos clic en `Run inference model`. ¡Y voilà! ¡Etiquetado!

Con esto, las ventajas son claras. Se puede etiquetar un dataset pequeño, entrenar un modelo, y utilizar el mismo modelo para seguir etiquetando el conjunto de entrenamiento, y así iterativamente, haciéndolo mucho más rápido.


## Oportunidades de discusión y contribución


No dudes en hacer preguntas ahora (en directo o a través de Discord) y sugerir mejoras futuras.

- ¿Ya utilizas alguna herramienta de etiquetado?
- ¿Cuál sería tu herramienta de etiquetado ideal?
