# Calculando S√©rie Temporal

__Autoria:__ Sabrina Paes Leme P. Correa <br>
__Cria√ß√£o:__ 31/05/2024 <br>
__Modifica√ß√£o:__ 31/05/2024

__Dificuldade:__ M√©dia <br>
__Descri√ß√£o:__ Este tutorial mostra como calcular m√©dia e mediana de uma S√©rie Temporal no Python.
<br>
<br>
__Contato:__ <br>
üìß paeslemesa@gmail.com <br>
üîó https://www.linkedin.com/in/paeslemesa/?locale=pt_BR <br>
üê± https://github.com/paeslemesa

## 0. Preparativos para este tutorial

‚ú® Antes de mais nada, precisamos ter nossos dados baixados. Caso voc√™ n√£o saiba como fazer isso de forma simplificada, deixo aqui a sugest√£o do meu tutorial de como baixar s√©ries temporais: [Tutorial decomo Baixar S√©ries Temporais](https://github.com/paeslemesa/tutoriaisPython/blob/main/02_Download_SerieTemporal_GEE.ipynb).


üß© As imagens em que vamos trabalhar tamb√©m j√° devem estar todas na mesma pasta e devem ter a mesma extens√£o

## 1. Importando bibliotecas e Definindo os arquivos de saida

Por incr√≠vel que pare√ßa, este tutorial vai se basear majoritariamente em quatro bibliotecas:

* <code>rasterio</code> para ler, e escrever os rasters
* <code>numpy</code> para gente calcular as m√©dias e medianas
* <code>os</code> para manipula√ß√£o de arquivos no computador
* <code>glob</code> para pesquisar arquivos em uma pasta

In [1]:
import rasterio
import numpy as np

import os
from glob import glob

In [2]:
diretorio = r"/home/jovyan/sabrina/ECURS/LandsatSeries/2015" # diretorio onde est√£o as imagens


# Os nomes de sa√≠da dos arquivos s√£o determinados aqui
nome_media_saida = os.path.join(diretorio, "media.tif") # nome do arquivo de sa√≠da
nome_std_saida = os.path.join(diretorio, "std.tif") # nome do arquivo de sa√≠da
nome_mediana_saida = os.path.join(diretorio, "mediana.tif") # nome do arquivo de sa√≠da

In [3]:
# Agora vamos listar todas as imagens do diretorio
lista_imagens = glob(os.path.join(diretorio, "*.tif")) # o operador * quer dizer "qualquer coisa", ent√£o estamos procurando "qualquer coisa" e depois que tenha ".tif" na pasta

print( "Total de imagens encontradas:", len(lista_imagens))

Total de imagens encontradas: 24


## 2. C√°lculo de S√©rie temporal por partes

ü™Ä Este processo ser√° feito num loop, onde usarei o comando <code>for</code> para rodar por todas as bandas das inagens e todas as  imagens da pasta. Fiz esse fluxograma que talvez ajudem voc√™s a entenderem um pouquinho melhor o processo.

As imagens que estou trabalhando no momento s√£o do senor OLI, com as bandas: __Azul, Verde, Vermelho, NIR, SWIR1, SWIR2__

![image-2.png](attachment:image-2.png)

In [4]:
# Primeiro vamos criar uma lista com os nomes das bandas das imagens
nomes_bandas = ["Azul", "Verde", "Vermelho", "NIR", "SWIR1", "SWIR2"]

### 2.1. Qubrando em peda√ßos

üõü Primeiro vamos calcular os valores para uma banda s√≥ para que n√≥s possamos checar se o que estamos fazendo est√° dando certo, depois vamos juntar isso para todas as bandas.

In [5]:
j = 0  # usaremos primeiro a banda 0 da nossa lista de bandas, mas mais pra baixo, vamos mudar isso, ok?

for arquivo_imagem in lista_imagens:
    # lendo UMA BANDA de todas as imagens da pasta
    with rasterio.open(arquivo_imagem) as src:
        temp = src.read(j+1) # lendo a banda j+1 (pois o √≠ndice em Python come√ßa em 0 e no Rasterio come√ßa em 1)
        metadados = src.profile # pegando os metadados da imagem

        # Testando se o arquivo do loop √© o primeiro da lista
        if arquivo_imagem == lista_imagens[0]:
            imagem = temp[np.newaxis,:,:] # Se sim, a vari√°vel imagem recebe a primeira banda da primeira imagem
            # a fun√ß√£o "np.newaxis" √© usada para adicionar uma dimens√£o ao array, pois a vari√°vel "imagem" √© 3D ("banda j da imagens i", linhas, colunas)
        else:
            imagem = np.concatenate((imagem, temp[np.newaxis,:,:]), axis=0) # Se n√£o, a banda lida √© concatenada com a vari√°vel imagem no eixo 0

üö® Vamos conferir se deu certo?

Para dar certo, a vari√°vel <code>imagem</code> deve ter as dimens√µes ($n_{imagens}, linhas, colunas$). Para isso, podemos abrir uma imagem qualquer da nossa lista e conferir.

In [6]:
with rasterio.open(arquivo_imagem) as src: # lendo o √∫ltimo arquivo rodado no loop
    print("N√∫mero de bandas:", src.count) # printa o n√∫mero de bandas
    print("Linhas:", src.height) # printa o n√∫mero de linhas
    print("Colunas:", src.width) # printa o n√∫mero de colunas


N√∫mero de bandas: 6
Linhas: 464
Colunas: 1376


üß∞ Agora vamos testar a nossa imagem resultante?

In [7]:
print(imagem.shape) # printa as dimens√µes da vari√°vel imagem

print("Numero de imagens:", imagem.shape[0]) # printa o n√∫mero de imagens
print("Numero de linhas:", imagem.shape[1]) # printa o n√∫mero de linhas
print("Numero de colunas:", imagem.shape[2]) # printa o n√∫mero de colunas


(24, 464, 1376)
Numero de imagens: 24
Numero de linhas: 464
Numero de colunas: 1376


üíØ Opa! Parece que est√° tudo certinho! <br>
Temos 21 imagens no nosso diret√≥rio e a imagem realmente tem 464 linhas e 1376 colunas. Podemos ent√£o calcular as estat√≠sticas desse array!

### 2.2.1 Calculando as estat√≠sticas dessa banda

üí• Devemos ter em mente que a vari√°vel <code>imagem</code> quer dizer a jun√ß√£o todas as bandas 0 (Azul) que est√£o ali na pasta e precisamos transformar isso numa banda s√≥. Ent√£o vamos calcular m√©dia, mediana e o desvio padr√£o (std) desse array <code>imagem</code>.

üî¶ Precisamos prestar aten√ß√£o que estamos calculando a m√©dia de __cada pixel__ das 21 imagens, ent√£o vamos selecionar que estamos calculando as estat√≠sticas no __eixo 0__.

In [8]:
media_bandaJ = np.nanmean(imagem, axis=0) # calcula a m√©dia da banda j
std_bandaJ = np.nanstd(imagem, axis=0) # calcula o desvio padr√£o da banda j
mediana_bandaJ = np.nanmedian(imagem, axis=0) # calcula a mediana da banda j

Para conferir se estamos fazendo tudo certinho, vamos printar as dimens√µes (<code>.shape</code>) das nossas estat√≠scias. E parece estar tudo certinho.

In [9]:
print(media_bandaJ.shape) # printa as dimens√µes da vari√°vel media_bandaJ
print(std_bandaJ.shape) # printa as dimens√µes da vari√°vel std_bandaJ
print(mediana_bandaJ.shape) # printa as dimens√µes da vari√°vel mediana_bandaJ

(464, 1376)
(464, 1376)
(464, 1376)


üí° Agora, tudo o que falta √© concatenar esse valor m√©dio/mediano/desvio padr√£o com os metadados da imagem e salvar o arquivo final.

## 3. Calulando a s√©rie temporal de todas as bandas

‚öôÔ∏è Agora a gente vai pegar o comando <code>for</code> ali de cima e colocar ele dentro de outro comando <code>for</code> para rodar tudo de uma vez s√≥.

Observe que agora n√£o estamos mais definindo o <code>j=0</code>, porque $j$ vai variar de 0 at√© 5.

In [10]:
for j, banda in enumerate(nomes_bandas): # vamos usar a fun√ß√£o "enumerate" para pegar o √≠ndice e o valor da lista ao mesmo tempo
    print("Calculando banda:", banda)
    # PEDA√áO QUE J√Å TINHAMOS PRONTO
    #--------------------------------------------------------------------------------------------
    for arquivo_imagem in lista_imagens:
        # lendo UMA BANDA de todas as imagens da pasta
        with rasterio.open(arquivo_imagem) as src:
            temp = src.read(j+1) # lendo a banda j+1 (pois o √≠ndice em Python come√ßa em 0 e no Rasterio come√ßa em 1)
            metadados = src.profile # pegando os metadados da imagem

            # Testando se o arquivo do loop √© o primeiro da lista
            if arquivo_imagem == lista_imagens[0]:
                imagem = temp[np.newaxis,:,:] # Se sim, a vari√°vel imagem recebe a primeira banda da primeira imagem
                # a fun√ß√£o "np.newaxis" √© usada para adicionar uma dimens√£o ao array, pois a vari√°vel "imagem" √© 3D ("banda j da imagens i", linhas, colunas)
            else:
                imagem = np.concatenate((imagem, temp[np.newaxis,:,:]), axis=0) # Se n√£o, a banda lida √© concatenada com a vari√°vel imagem no eixo 0
    
    media_bandaJ = np.nanmean(imagem, axis=0) # calcula a m√©dia da banda j
    std_bandaJ = np.nanstd(imagem, axis=0) # calcula o desvio padr√£o da banda j
    mediana_bandaJ = np.nanmedian(imagem, axis=0) # calcula a mediana da banda j
    #--------------------------------------------------------------------------------------------

    # Agora precisamos testar se estamos trabalhando com a banda 0 para criar as var√°veis "m√©dia", "mediana" e "std"

    if j == 0: # Se a banda for a primeira
        media = media_bandaJ[np.newaxis,:,:] # Se sim, a vari√°vel media recebe a m√©dia da banda j
        std = std_bandaJ[np.newaxis,:,:] # Se sim, a vari√°vel std recebe o desvio padr√£o da banda j
        mediana = mediana_bandaJ[np.newaxis,:,:] # Se sim, a vari√°vel mediana recebe a mediana da banda j
    else: # para todos os demais casos (else = se n√£o)
        media = np.concatenate((media, media_bandaJ[np.newaxis,:,:]), axis=0)
        std = np.concatenate((std, std_bandaJ[np.newaxis,:,:]), axis=0)
        mediana = np.concatenate((mediana, mediana_bandaJ[np.newaxis,:,:]), axis=0)

Calculando banda: Azul
Calculando banda: Verde
Calculando banda: Vermelho
Calculando banda: NIR
Calculando banda: SWIR1
Calculando banda: SWIR2


## 3. Salvando as imagens

üîì Uma coisa que eu gosto muito de fazer √© dar os nomes das bandas nas imagens que salvo para n√£o precisar lembrar depois, por isso determinei ali os nomes das bandas. A gente costuma fazer isso no momento em que salvamos as imagens.

üîë Para salvar uma imagem com o <code>rasterio</code> a principio pode parecer complicado, mas calma! A gente consegue!


‚ú≥Ô∏è Para salvar uma imagem com o rasterio, a gente precisar "criar um arquivo" em branco e falar pro programa que vamos escrever nele. Depois, mostramos para o rasterio quais s√£o os par√¢metros da nossa imagem (n√∫mero de linhas, colunas, transforma√ß√£o, CRS, etc.). Por fim, n√≥s escrevemos banda por banda nesse arquivo, para poder colocar o nome da banda.

‚õìÔ∏è Dessa forma: <br>
* A gente vai "abrir o raster em branco" como se estiv√©ssemos abrindo um raster normal, e vamos assinalar o comando <code>'w'</code> (do ingl√™s, _write_, escrever).
* Depois vamos usar o comando <code>**</code>para que a gente n√£o precise passar par√¢metro por par√¢metro, ele vai alocar "sozinho"
* Vamos escrever banda por banda do raster com o <code>dst.write</code> assinalando qual √© o array que vai entrar em cada banda
* Por fim, vamos determina√ß√£o a descri√ß√£o de cada banda com o comando  <code>dst.set_band_description</code>.

Lembrando que as vari√°veis de sa√≠da j√° foram determinadas l√° em cima como:
* nome_media_saida
* nome_std_saida
* nome_mediana_saida

In [11]:
# Aqui estamos pegando os metadasdos da √∫ltima imagem no comando for para copiar essas informa√ß√µes
with rasterio.open(arquivo_imagem) as src:
    metadados = src.profile

metadados

{'driver': 'GTiff', 'dtype': 'float64', 'nodata': 0.0, 'width': 1376, 'height': 464, 'count': 6, 'crs': CRS.from_epsg(4326), 'transform': Affine(0.00026949458523585647, 0.0, -108.3939561168843,
       0.0, -0.00026949458523585647, 57.07544972334633), 'blockxsize': 256, 'blockysize': 256, 'tiled': True, 'compress': 'deflate', 'interleave': 'band'}

Se formos observar, n√£o precisamos alterar nenhuma informa√ß√£o dos metadados, porque:
* O n√∫mero de bandas √© o mesmo
* Os tamanhos das linhas e colunas s√£o os mesmos
* O tipo dos valores (float) s√£o os mesmo
* O CRS √© o mesmo
Na verdade, √© tudo o mesmo, tirando os pr√≥prios valores das bandas (que n√£o ficam nos metadados).

In [12]:
# Salvando o valor da m√©dia
with rasterio.open(nome_media_saida, 'w', **metadados) as dst:
    for i, band in enumerate(nomes_bandas):
        dst.write(media[i], i+1)
        dst.set_band_description(i+1, band)
print("M√©dia salva com sucesso!")

# Salvando o valor do desvio padr√£o
with rasterio.open(nome_std_saida, 'w', **metadados) as dst:
    for i, band in enumerate(nomes_bandas):
        dst.write(std[i], i+1)
        dst.set_band_description(i+1, band)
print("Desvio padr√£o salvo com sucesso!")

# Salvando o valor da mediana
with rasterio.open(nome_mediana_saida, 'w', **metadados) as dst:
    for i, band in enumerate(nomes_bandas):
        dst.write(mediana[i], i+1)
        dst.set_band_description(i+1, band)        
print("Mediana salva com sucesso!")

M√©dia salva com sucesso!
Desvio padr√£o salvo com sucesso!
Mediana salva com sucesso!


Se abrirmos essas imagens no QGIS, poderemos checar os nomes das bandas e os valores, al√©m de conferir se est√° tudo certinho.

![image.png](attachment:image.png)