In [None]:
!pip install xarray
!pip install goes2go
!pip install rioxarray
!pip install geopandas
!pip install matplotlib
!pip install pandas==2.2.2
!pip install numpy
!pip install netCDF4

Collecting goes2go
  Downloading goes2go-2025.2.0-py3-none-any.whl.metadata (13 kB)
Collecting cartopy>=0.22.0 (from goes2go)
  Downloading Cartopy-0.24.1-cp311-cp311-manylinux_2_17_x86_64.manylinux2014_x86_64.whl.metadata (7.9 kB)
Collecting metpy (from goes2go)
  Downloading MetPy-1.6.3-py3-none-any.whl.metadata (8.6 kB)
Collecting s3fs>=2023.6.0 (from goes2go)
  Downloading s3fs-2025.3.0-py3-none-any.whl.metadata (1.9 kB)
Collecting aiobotocore<3.0.0,>=2.5.4 (from s3fs>=2023.6.0->goes2go)
  Downloading aiobotocore-2.21.1-py3-none-any.whl.metadata (24 kB)
Collecting fsspec==2025.3.0.* (from s3fs>=2023.6.0->goes2go)
  Downloading fsspec-2025.3.0-py3-none-any.whl.metadata (11 kB)
Collecting pint>=0.17 (from metpy->goes2go)
  Downloading Pint-0.24.4-py3-none-any.whl.metadata (8.5 kB)
Collecting aioitertools<1.0.0,>=0.5.1 (from aiobotocore<3.0.0,>=2.5.4->s3fs>=2023.6.0->goes2go)
  Downloading aioitertools-0.12.0-py3-none-any.whl.metadata (3.8 kB)
Collecting botocore<1.37.2,>=1.37.0 (from

In [None]:
!pip install dask



In [None]:

from goes2go import GOES

# Defina o intervalo de datas
G = GOES(satellite=16, product="ABI-L2-SSTF", domain='C')
files = G.timerange(start='2024-02-16 00:00', end='2024-02-16 23:00')

# Mostra todos os arquivos disponíveis
for file in files:
    print(file)

 ╭─goes2go──────────────────────────────────────────────╮
 │ INFO: Created a default config file.                 │
 │ You may view/edit goes2go's configuration here:      │
 │           /root/.config/goes2go/config.toml          │
 ╰──────────────────────────────────────────────────────╯

📦 Finished downloading [23] files to [/root/data/noaa-goes16/ABI-L2-SSTF].
file
product_mode
satellite
start
end
creation
product
mode_bands
mode
band


In [None]:

from goes2go import GOES

from datetime import datetime, timedelta

# Defina o intervalo de datas
G = GOES(satellite=16, product="ABI-L2-SSTF", domain='C')

start_date = datetime(2024, 2, 1)  # Start date: February 1, 2024
end_date = datetime(2024, 2, 29)  # End date: February 29, 2024 (assuming a leap year)

for day in range((end_date - start_date).days + 1):
    current_date = start_date + timedelta(days=day)
    start_time_str = current_date.strftime('%Y-%m-%d 00:00')
    end_time_str = current_date.strftime('%Y-%m-%d 23:00')

    files = G.timerange(start=start_time_str, end=end_time_str)

    # Mostra todos os arquivos disponíveis para o dia atual
    for file in files:
        print(file)

📦 Finished downloading [23] files to [/root/data/noaa-goes16/ABI-L2-SSTF].
file
product_mode
satellite
start
end
creation
product
mode_bands
mode
band
📦 Finished downloading [23] files to [/root/data/noaa-goes16/ABI-L2-SSTF].
file
product_mode
satellite
start
end
creation
product
mode_bands
mode
band
📦 Finished downloading [23] files to [/root/data/noaa-goes16/ABI-L2-SSTF].
file
product_mode
satellite
start
end
creation
product
mode_bands
mode
band
📦 Finished downloading [23] files to [/root/data/noaa-goes16/ABI-L2-SSTF].
file
product_mode
satellite
start
end
creation
product
mode_bands
mode
band
📦 Finished downloading [23] files to [/root/data/noaa-goes16/ABI-L2-SSTF].
file
product_mode
satellite
start
end
creation
product
mode_bands
mode
band
📦 Finished downloading [23] files to [/root/data/noaa-goes16/ABI-L2-SSTF].
file
product_mode
satellite
start
end
creation
product
mode_bands
mode
band
📦 Finished downloading [23] files to [/root/data/noaa-goes16/ABI-L2-SSTF].
file
product_mode
s

In [None]:
import gc
import rioxarray as rxr
import numpy as np
import pandas as pd
import os
import xarray as xr
from glob import glob
from pathlib import Path
import matplotlib.pyplot as plt

epsg = 4674

# Defina o caminho base onde os arquivos estão localizados
base_path = '/root/data/noaa-goes16/ABI-L2-SSTF'
# Use glob para buscar todos os arquivos .nc em subdiretórios
pattern = os.path.join(base_path, '**', '*.nc')
arqs = glob(pattern, recursive=True)

# Função para salvar a média calculada em um arquivo NetCDF
def salvar_media(mes_ano, da_media_mensal, caminho_arquivo):
    da_media_mensal.to_netcdf(caminho_arquivo)

# Função para plotar e salvar a média
def plotar_media(da_media_mensal, mes_ano):
    plt.figure(figsize=(10, 7))
    da_media_mensal.plot(cmap='jet')
    plt.title(f'Média de Temperatura em °C - {mes_ano}')
    plt.grid(True)
    #plt.xlim(-140, -40)
    #plt.ylim(-50, 15)
    plt.savefig(f'MediaMensal_{mes_ano}.png')
    #plt.show()

# Dicionário para armazenar dados mensais
dados_mensais = {}

# Processamento dos arquivos
for arq in arqs:
    arq = Path(arq)
    strTempo = arq.name.split('_')[3][1:]
    data = pd.to_datetime(strTempo, format='%Y%j%H%M%S%f')
    mes_ano = data.strftime('%d-%m')

    # Abrir o arquivo NetCDF
    dsTemp = rxr.open_rasterio(arq, chunks={'x': 600, 'y': 600})
    daTempKelvin = dsTemp['SST'][0]

    # Filtrar valores de preenchimento
    daTempKelvin = daTempKelvin.where(daTempKelvin != 65535)

    # Aplicar o scale_factor e o add_offset
    scale_factor = daTempKelvin.attrs.get('scale_factor', 1.0)
    add_offset = daTempKelvin.attrs.get('add_offset', 0.0)

    # Calcular a temperatura em Kelvin
    daTempKelvin = (daTempKelvin * scale_factor) + add_offset

    # Converter para Celsius e filtrar valores anômalos
    daTempCelsius = daTempKelvin - 273.15
    daTempCelsius = daTempCelsius.where((daTempCelsius > -30) & (daTempCelsius < 50))

    # Reprojetar para o EPSG desejado
    #daTempCelsius = daTempCelsius.rio.write_crs(dsTemp.rio.crs)
    #dsTempReprojetado = daTempCelsius.rio.reproject(dst_crs=f'EPSG:{epsg}')

    # Armazenar os dados na lista do mês correspondente
    if mes_ano not in dados_mensais:
        dados_mensais[mes_ano] = []
    dados_mensais[mes_ano].append(daTempCelsius)

    # Limpar a memória após cada iteração
    rec = dsTemp['SST'][0]
    del dsTemp, daTempKelvin, daTempCelsius
    gc.collect()


# Calcular a média para cada mês, fazer a reprojeção, e salvar
for mes_ano, lista_dados in dados_mensais.items():
    # Alinhar dimensões dos dados e calcular a média ignorando NaNs
    stack_dados = np.stack([da.values for da in lista_dados], axis=0)
    media_mensal = np.nanmean(stack_dados, axis=0)

    # Criar um novo Dataset com a média mensal e a variável SST
    ds_media_mensal = xr.Dataset(
    {'SST': ([ 'y','x'], media_mensal)},
    coords={'y': lista_dados[0].coords['y'], 'x': lista_dados[0].coords['x']},
    attrs={'units': '°C', 'scale_factor': 1.0, 'add_offset': 0.0, 'EPSG': epsg}
    )

    # Reprojetar a média mensal antes de plotar
    ds_media_mensal = ds_media_mensal.rio.write_crs(rec.rio.crs)
    ds_media_mensal_reprojetado =  ds_media_mensal.rio.reproject(dst_crs=f'EPSG:{epsg}')

    # Salvar a média em um arquivo NetCDF
    caminho_arquivo = f'/root/data/noaa-goes16/media_{mes_ano}.nc'
    salvar_media(mes_ano, ds_media_mensal_reprojetado, caminho_arquivo)

    # Plotar a média reprojetada
    #media_nova = ds_media_mensal_reprojetado['SST']

    # Removing the np.linalg.inv() call as it's causing the error.
    #plotar_media(media_nova, mes_ano)


    # Limpar a memória após salvar e plotar
    del stack_dados, media_mensal, ds_media_mensal, ds_media_mensal_reprojetado
    gc.collect()

  media_mensal = np.nanmean(stack_dados, axis=0)
  media_mensal = np.nanmean(stack_dados, axis=0)
  media_mensal = np.nanmean(stack_dados, axis=0)
  media_mensal = np.nanmean(stack_dados, axis=0)
  media_mensal = np.nanmean(stack_dados, axis=0)
  media_mensal = np.nanmean(stack_dados, axis=0)
  media_mensal = np.nanmean(stack_dados, axis=0)
  media_mensal = np.nanmean(stack_dados, axis=0)
  media_mensal = np.nanmean(stack_dados, axis=0)
  media_mensal = np.nanmean(stack_dados, axis=0)
  media_mensal = np.nanmean(stack_dados, axis=0)
  media_mensal = np.nanmean(stack_dados, axis=0)
  media_mensal = np.nanmean(stack_dados, axis=0)
  media_mensal = np.nanmean(stack_dados, axis=0)
  media_mensal = np.nanmean(stack_dados, axis=0)
  media_mensal = np.nanmean(stack_dados, axis=0)
  media_mensal = np.nanmean(stack_dados, axis=0)
  media_mensal = np.nanmean(stack_dados, axis=0)
  media_mensal = np.nanmean(stack_dados, axis=0)
  media_mensal = np.nanmean(stack_dados, axis=0)
  media_mensal = np.

In [None]:
!cp -r /root/data/noaa-goes16/ /content/drive/MyDrive