# Laborat√≥rio 4

Mosaicos e classifica√ß√£o supervisionada de imagens no GEE


Objetivos:

1. Remo√ß√£o de nuvens
2. Composi√ß√µes e mosaicos de imagens
3. Classifica√ß√£o supervisionada no GEE


In [None]:
import ee
import geemap

In [None]:
ee.Authenticate()
ee.Initialize()

## Preparar dados


### Filtrar cole√ß√£o de imagens (nuvens, datas e regi√£o)


Dessa vez vamos utilizar uma cole√ß√£o de imagens ao inv√©s de uma imagem √∫nica,
isso garantir√° maior robustez ao nosso modelo de classifica√ß√£o.

Adicionalmente neste laborat√≥rio, diferentemente do anterior, utilizar imagens sem nuvens ser√£o essenciais.
Para eliminar as nuvens, captura-se m√∫ltiplas imagens da mesma √°rea, remove-se as nuvens e, usando a t√©cnica do mosaico, integram-se todas em uma √∫nica imagem.
Isso preenche lacunas deixadas pelas nuvens removidas, pois os pixels faltantes em uma imagem s√£o substitu√≠dos por pixels v√°lidos de outras.
O GEE prioriza o pixel da imagem que est√° no topo da cole√ß√£o para compor o mosaico.

Vamos ver como fazer isso.


In [None]:
# Essa √© uma fun√ß√£o padr√£o do
def mask_s2_clouds(image):
    """Masks clouds in a Sentinel-2 image using the QA band.

    Args:
        image (ee.Image): A Sentinel-2 image.

    Returns:
        ee.Image: A cloud-masked Sentinel-2 image.
    """
    qa = image.select("QA60")

    # Bits 10 and 11 are clouds and cirrus, respectively.
    cloud_bit_mask = 1 << 10
    cirrus_bit_mask = 1 << 11

    # Both flags should be set to zero, indicating clear conditions.
    mask = qa.bitwiseAnd(cloud_bit_mask).eq(0).And(qa.bitwiseAnd(cirrus_bit_mask).eq(0))

    return image.updateMask(mask).divide(10000)

Para nos ajudar com a an√°lise, vamos filtrar somente as imagens que passam por
S√£o Paulo.
Para isso definimos um ponto e depois utilizamos o m√©todo `filterBounds()` do GEE


In [None]:
sao_paulo = ee.Geometry.Point(-46.711, -23.641)
sao_paulo

Vamos definir os limites para cobertura de nuvem e filtrar a cole√ß√£o de imagens.
Agora vamos filtrar o per√≠odo em que queremos trabalhar com as imagens.

Alguns coment√°rios:

- Selecionar um per√≠odo muito longo pode resultar em uma cole√ß√£o muito grande e pesada para trabalhar
- Para fins de exemplos vamos cobrir o ano de 2020

üí° A dica aqui √© trabalhar com o intervalo de datas e valor de cobertura por
nuvens at√© se obter uma cole√ß√£o de tamanho suficiente para a composi√ß√£o da imagem
de forma apropriada


In [None]:
limite_cobertura_nuvem = 5  # m√°ximo de 10% de cobertura de nuvem
data_inicial, data_final = "2018-01-01", "2022-01-30"

dataset = (
    ee.ImageCollection("COPERNICUS/S2_SR_HARMONIZED")
    .filterBounds(sao_paulo)
    .filterDate(data_inicial, data_final)
    .filter(ee.Filter.lt("CLOUDY_PIXEL_PERCENTAGE", limite_cobertura_nuvem))
    .map(mask_s2_clouds)
)
dataset

Podemos verificar o n√∫mero de imagens resultantes na cole√ß√£o com o m√©todo `size()`:


In [None]:
print(f"total de imagens na cole√ß√£o: {dataset.size().getInfo()}")

### Recortar a regi√£o de interesse (_Region of Interest - ROI_)


Primeiramente vamos definir um pol√≠gino de interesse para nossa an√°lise.

A fins de exemplo, vamos definir programaticamente um pol√≠gono retangular
que cobre a cidade de S√£o Paulo.
Mas tenha em mente que voc√™ tamb√©m pode selecionar no mapa usando a ferramenta
de desenho.


In [None]:
# roi: regi√£o de interesse
roi = ee.Geometry.BBox(
    west=-46.88655, south=-23.6906, east=-46.611642, north=-23.590958
)
roi

Como no trabalho a ideia √© utilizar uma cole√ß√£o de imagens, o m√©todo `clip()`
n√£o pode ser aplicado diretamente.

Para efetuar o procedimento uma fun√ß√£o personalizada deve ser criada.
No caso, abaixo criamos a fun√ß√£o `clip_img_collection()`, que recebe uma
cole√ß√£o de imagens e uma geometria (no caso, o nosso pol√≠gono de interesse)
e retorna a cole√ß√£o j√° recortada.


In [None]:
def clip_img_collection(dataset, geometria):
    """Recorta todas as imagens de uma cole√ß√£o de imagens do Earth Engine para
    uma regi√£o espec√≠fica definida por uma geometria.

    Essa fun√ß√£o cria internamente uma fun√ß√£o de recorte espec√≠fica para a
    geometria fornecida e aplica essa fun√ß√£o a cada imagem na cole√ß√£o de imagens
    usando o m√©todo map().

    Parameters
    ----------
    dataset : ee.ImageCollection
        A cole√ß√£o de imagens a ser recortada. Cada imagem da cole√ß√£o ser√°
        recortada para se adequar √† geometria fornecida.

    geometria : ee.Geometry
        A geometria que define a regi√£o de interesse para onde as imagens ser√£o
        recortadas. A geometria pode ser um ponto, linha, pol√≠gono, etc.

    Returns
    -------
    ee.ImageCollection
        Uma nova cole√ß√£o de imagens com cada imagem recortada para a regi√£o
        definida pela geometria fornecida.
    """

    def clip_func(image):
        return image.clip(geometria)

    return dataset.map(clip_func)

In [None]:
# Faz o clip da regi√£o desejada em toda cole√ß√£o.
clipped_dataset = clip_img_collection(dataset, roi)
clipped_dataset

### Remo√ß√£o de valores inv√°lidos


Ap√≥s a remo√ß√£o das nuvens, para melhorar ao conjunto de dados, vamos eliminar
valores discrepantes.

Sabemos que a reflect√¢ncia deve ser menor do que 1, ent√£o vamos criar uma m√°scara
para eliminar valores maiores do que 1.

As m√°scaras s√£o geradas a partir do comparador `lt()` (_less than_ - menor do que)
do GEE.


In [None]:
# Fun√ß√£o para remo√ß√£o de valores inv√°lidos
def remove_valores_invalidos(collection, bandas):
    """Aplica uma m√°scara para remover valores inv√°lidos em uma cole√ß√£o de
    imagens.

    Os valores considerados inv√°lidos s√£o aqueles maiores que 1 para as bandas
    especificadas.

    Parameters
    ----------
    collection : ee.ImageCollection
        A cole√ß√£o de imagens a ser processada.
    bandas : list of str
        Lista com os nomes das bandas que ser√£o processadas.

    Returns
    -------
    ee.ImageCollection
        A cole√ß√£o de imagens com valores inv√°lidos removidos.
    """

    def mask_out_of_range_reflectance(imagem):
        """Mascara valores de reflect√¢ncia acima de 1"""
        for banda in bandas:
            imagem = imagem.updateMask(imagem.select(banda).lt(1))
        return imagem

    return collection.map(mask_out_of_range_reflectance)

In [None]:
# Executa a fun√ß√£o de remo√ß√£o dos valores inv√°lidos na cole√ß√£o.
clipped_dataset = remove_valores_invalidos(clipped_dataset, ["B2", "B3", "B4", "B8"])
clipped_dataset

### Composi√ß√£o e Mosaico


Para se criar um mosaico a partir de uma cole√ß√£o de imagens, basta invocar o
m√©todo `mosaic()` da cole√ß√£o de interesse.

J√° para a cria√ß√£o de uma composi√ß√£o, um m√©todo do tipo reducer que faz um
c√°lculo pixel a pixel deve ser chamado a partir do objeto que cont√©m a cole√ß√£o.
Nesse caso, os pixels transparentes s√£o ignorados durante os c√°lculos.

Os c√°lculos s√£o feitos de forma separada para cada banda das imagens da cole√ß√£o,
resultando assim em uma imagem com as mesmas bandas da cole√ß√£o, onde cada pixel
de cada banda √© preenchido por um valor calculado a partir da banda de mesmo nome na cole√ß√£o.


In [None]:
# Cria√ß√£o de mosaico a partir da cole√ß√£o.
mosaico = clipped_dataset.mosaic()
# TODO: n√£o vamos usar o mosaico pra nada? Roteiro antigo n√£o ajudou muito.

# Cria√ß√£o de composi√ß√£o a partir da cole√ß√£o.
composition = clipped_dataset.mean()

Vamos conferir o resultado da composi√ß√£o atrav√©s do m√©todo `bandTypes()` que
retorna as bandas da imagem.


In [None]:
composition.bandTypes()
# TODO: for a strange reason, it is giving me numbers higher than 1.0, needs checking

### Calcular NDVI


Agora queremos calcular a banda de √≠ndice de vegeta√ß√£o (`NDVI`) para cada imagem
da cole√ß√£o.
Vamos seguir os mesmos passos do laborat√≥rio anterior!

Alguns coment√°rios:

- `B2` √© a banda azul
- `B3` √© a banda verde
- `B4` √© a banda vermelha
- `B8` √© a banda infravermelho pr√≥ximo (NIR)
- `MSK_CLDPRB` √© a banda de probabilidade de nuvens
- `SCL` √© fruto de um processo de classifica√ß√£o pelo algoritmo de classifica√ß√£o de cena ([_Scene Classification_](https://earth.esa.int/web/sentinel/technical-guides/sentinel-2-msi/level-2a/algorithm))

üí° Sempre verifique a documenta√ß√£o oficial: https://developers.google.com/earth-engine/datasets/catalog/COPERNICUS_S2_SR_HARMONIZED#bands


In [None]:
# calcular a banda NDVI conforme visto no laborat√≥rio anterior.

img_bd_nir = composition.select("B8")
img_bd_red = composition.select("B4")

## adicionar a banda NDVI √† cole√ß√£o de imagens
composition = composition.addBands(
    img_bd_nir.subtract(img_bd_red).divide(img_bd_nir.add(img_bd_red)).rename("NDVI"),
    ["NDVI"],
)
composition

### Sele√ß√£o de bandas para a classifica√ß√£o


Vamos criar listas com nomes das bandas para utilizarmos ao longo deste laborat√≥rio.


In [None]:
# Lista com somente as bandas de interesse para a classifica√ß√£o
classification_bands = ["B2", "B3", "B4", "B8", "NDVI"]

In [None]:
# Descarta as bandas usadas para se eliminar efeitos de nuvens.
composition = composition.select(classification_bands)
composition

## Classifica√ß√£o supervisionada


### Definindo amostras conhecidas


Vamos come√ßar a definir visualmente regi√µes conhecidas para treinamento do
modelo de classifica√ß√£o.
Em outras palavras, precisamos gerar amostras sobre a imagem para que o modelo
aprenda a classificar os pixels.

Essa √© a magia da classifica√ß√£o supervisionada... O ser humano aponta para
alguns pol√≠gonos e diz para o computador: "olha, isso aqui √© √°gua, isso aqui √©
vegeta√ß√£o, isso aqui √© solo exposto, etc".
Em seguida, o computador aprende a classificar os pixels da imagem de acordo
com o que foi definido pelo ser humano.


Essa √© uma etapa t√£o especial que merece ser apresentada pelo pr√≥prio
[Dr. Qiusheng Wu](https://github.com/giswqs), criador do `geemap` e
Prof. da Universidade do Tennessee, nos EUA.
Veja:


In [None]:
import geemap

# TODO: the process described in the video is temporally broken
# see: https://github.com/gee-community/geemap/discussions/1816
geemap.show_youtube("https://youtu.be/VWh5PxXPZw0")

Vamos definir um dicion√°rio para armazenar os par√¢metros de visualiza√ß√£o b√°sicos para o mapa.


In [None]:
visualization = {
    "min": 0.0,
    "max": 0.3,
    "bands": ["B4", "B3", "B2"],
}

Agora de fato come√ßaremos a definir as regi√µes de treinamento.
Devido a um [erro](https://github.com/gee-community/geemap/discussions/1816) no
`geemap`, vamos coletar classe a classe e depois juntar tudo em um √∫nico
`FeatureCollection`.

Voc√™ deve seguir os seguintes passos:

1. Execute a c√©lula que come√ßa com `my_map = geemap.Map(`
2. Clique no bot√£o `toolbar` no canto superior direito do mapa
3. Clique no bot√£o `expand tool bar` (sinal de `+`)
4. Clique no bot√£o `collect training samples` (s√≠mbolo de um dedo indicador)
5. Altere o campo `Required` para `classe`
6. Altere o campo `Integer` para um n√∫mero inteiro de sua escolha. Recomenda-se come√ßar com 0 e ir aumentando de 1 em 1 para cada classe. **√â extremamente importante que cada classe receba um n√∫mero diferente neste campo**, por exemplo, 0=agua, 1=vegetacao, 2=solo exposto, etc.
7. Altere o campo `Optional` para `label`
8. Altere o campo `String` para o nome da classe, por exemplo, `agua`, `vegetacao`, `solo exposto`, etc.
9. Clique no bot√£o `Draw a polygon` (s√≠mbolo de um hex√°gono) no canto esquerdo do mapa
10. Desenhe um pol√≠gono sobre a imagem que aparece no mapa.
11. Ao desenhar todos seus pol√≠gonos, execute a c√©lula que vem logo em seguida a esta. N√£o volte a executar a mesma c√©lula novamente, pois isso ir√° apagar todas as suas amostras de treinamento.


In [None]:
# executar esta c√©lula e desenhar pol√≠gonos de AGUA
my_map = geemap.Map(lite_mode=False)
my_map.set_center(-46.711, -23.641, 12)
my_map.addLayer(composition, visualization, "mosaico")
my_map

In [None]:
# executar esta c√©lula somente ap√≥s desenhar todos os pol√≠gonos de AGUA
agua = my_map.user_rois
agua

In [None]:
# executar esta c√©lula e desenhar pol√≠gonos de VEGETACAO RASTEIRA
my_map = geemap.Map(lite_mode=False)
my_map.set_center(-46.711, -23.641, 12)
my_map.addLayer(composition, visualization, "mosaico")
my_map

In [None]:
# executar esta c√©lula somente ap√≥s desenhar todos os pol√≠gonos de VEGETACAO RASTEIRA
vegeta_baixa = my_map.user_rois
vegeta_baixa

In [None]:
# executar esta c√©lula e desenhar pol√≠gonos de VEGETACAO ARBUSTIVA
my_map = geemap.Map(lite_mode=False)
my_map.set_center(-46.711, -23.641, 12)
my_map.addLayer(composition, visualization, "mosaico")
my_map

In [None]:
# executar esta c√©lula somente ap√≥s desenhar todos os pol√≠gonos de VEGETACAO ALTA
vegeta_alta = my_map.user_rois
vegeta_alta

In [None]:
# executar esta c√©lula e desenhar pol√≠gonos de CONSTRU√á√ïES
my_map = geemap.Map(lite_mode=False)
my_map.set_center(-46.711, -23.641, 12)
my_map.addLayer(composition, visualization, "mosaico")
my_map

In [None]:
# executar esta c√©lula somente ap√≥s desenhar todos os pol√≠gonos de CONSTRU√á√ïES
construcoes = my_map.user_rois
construcoes

In [None]:
# executar esta c√©lula e desenhar pol√≠gonos de SOLO EXPOSTO
my_map = geemap.Map(lite_mode=False)
my_map.set_center(-46.711, -23.641, 12)
my_map.addLayer(composition, visualization, "mosaico")
my_map

In [None]:
# executar esta c√©lula somente ap√≥s desenhar todos os pol√≠gonos de SOLO EXPOSTO
solo_exposto = my_map.user_rois
solo_exposto

### Mesclando amostras em uma √∫nica feature collection


Os objetos `agua`, `vegeta_baixa`, `vegeta_alta`, `construcoes` e `solo_exposto`
s√£o do tipo `ee.FeatureCollection`.
Vamos mesclar todos em uma √∫nica feature collection para facilitar a manipula√ß√£o
dos dados.
Utilizaremos o m√©todo `merge()` do GEE.


In [None]:
# Cria√ß√£o de um √∫nico objeto do tipo ee.FeatureCollection com todos os objetos.
collection = (
    agua.merge(vegeta_baixa).merge(vegeta_alta).merge(construcoes).merge(solo_exposto)
)
collection

### Sampling


O procedimento anterior apenas delimitou as regi√µes de onde se deseja coletar
amostra, associando-as com suas respectivas classes, e n√£o colheu nenhuma
amostra propriamente.

Vamos fazer a coleta dos valores de pixels nas regi√µes.


Adicionalmente, vamos definir a escala que queremos trabalhar, nesse caso 10 metros pois √© o
menor valor (mais preciso) dispon√≠vel para o Sentinel-2.


In [None]:
# Ajuste este valor para aumentar ou diminuir a √°rea de amostragem
SCALE = 10  # meters

In [None]:
# Extrai o valor de todos os pixels nas regi√µes amostradas.
amostra_treinamento = composition.sampleRegions(
    collection=collection, properties=["classe"], scale=SCALE
)

### Treinamento


Para treinar o modelo, basta utilizar um classificador com os par√¢metros desejados
e utilizar o m√©todo `train()`.

Vamos utilizar o classificador [Random Forest](https://developers.google.com/earth-engine/apidocs/ee-classifier-smilerandomforest).

O primeiro par√¢metro do `train()` √© a amostra a ser utilizada para treinar o modelo, o segundo √© a propriedade que cont√©m o n√∫mero que identifica a classe e o √∫ltimo, a lista com as bandas que ser√£o utilizadas para classifica√ß√£o.

Na instancia√ß√£o do classificador, `smileRandomForest()`, o par√¢metro √© a quantidade de √°rvores de decis√£o que devem ser criadas.
Esse valor pode, e deve, ser ajustado de acordo com os resultados no conjunto de valida√ß√£o.

Outros par√¢metros podem ser encontrados na documenta√ß√£o do GEE e a explica√ß√£o da utilidade dos mesmos em literatura apropriada.


In [None]:
# // Instancia um classificador na mem√≥ria com os par√¢metros dados e treinando no conjunto de treinamento.
classificador_treinado = ee.Classifier.smileRandomForest(50).train(
    amostra_treinamento, "classe", classification_bands
)
classificador_treinado

Um primeiro teste pode ser feito com a pr√≥pria amostra de treinamento, com a cria√ß√£o da matriz de confus√£o a partir do m√©todo `confusionMatrix()`.

A acur√°cia provavelmente ser√° alt√≠ssima, visto que foi o pr√≥prio conjunto utilizado no treinamento que foi avaliado.

Caso o desempenho tenha sido ruim sobre o conjunto de treinamento, √© um prov√°vel caso de [underfitting](https://en.wikipedia.org/wiki/Overfitting).


In [None]:
# // Matriz de confus√£o do conjunto de treinamento e acur√°cia.
matriz_confusao = classificador_treinado.confusionMatrix()
matriz_confusao

In [None]:
print(
    f"Acur√°cia no conjunto de treinamento: {matriz_confusao.accuracy().getInfo()*100:.2f}%"
)

### Classifica√ß√£o


Para classificar a imagem a partir do treinamento, invoca-se o m√©todo `classify()` a partir da imagem e com o classificador treinado escolhido como par√¢metro.

O resultado √© um objeto do tipo imagem com uma √∫nica banda em que os pixels
armazenam o valor relativo √†s classes que foram atribu√≠das no momento do desenho
das regi√µes das amostras em tela.


In [None]:
# Classifica a imagem com o classificador treinado e com os par√¢metros definidos.
imagem_classificada = composition.classify(classificador_treinado)
imagem_classificada

### Visualiza√ß√£o


Para visualizar a imagem, primeiro uma paleta de cores deve ser definida.

Essa paleta deve ser feita como uma lista de strings em que cada cor √© uma sequ√™ncia de seis d√≠gitos em hexadecimal.

A ordem em que as cores est√£o na string representa o n√∫mero inteiro associado com a classe a partir de 0.


In [None]:
# Paleta de cores para adicionar a imagem classificada ao mapa.
paleta_cores_classes = [
    "#1f77b4",  # √Ågua - um azul mais suave e claro.
    "#98df8a",  # Vegeta√ß√£o rasteira - um verde claro para diferenciar da vegeta√ß√£o alta.
    "#2ca02c",  # Vegeta√ß√£o alta - um verde mais vibrante e menos saturado.
    "#7f7f7f",  # Constru√ß√£o - um cinza m√©dio que representa √°reas constru√≠das.
    "#ff7f0e",  # Solo exposto - um laranja mais vibrante e atraente.
]

Finalmente, podemos visualizar a imagem classificada.


In [None]:
final_map = geemap.Map(lite_mode=False)
final_map.centerObject(roi, 12)
vis_params = {
    "min": 0,
    "max": 5,
    "bands": ["classification"],
    "palette": paleta_cores_classes,
}
final_map.addLayer(
    imagem_classificada.clip(roi), vis_params, "Imagem Classificada", True
)
final_map

## Atividade


Este laborat√≥rio n√£o requer uma atividade espec√≠fica.
Voc√™ pode aproveitar esse tempo para aplicar os conceitos no seu trabalho pr√°tico.
