# Plot ABI 

## Para que serve?

Código para realizar o download de arquivos NetCDF (nc) do tipo ABI de um determinado dia, hora e região geográfica. É feito um tratamento dos dados, resultando em um plot das informações em uma imagem png. Para exemplificar, nesse código foi utilizado o produto de temperatura da superfície (LST), o qual não é utilizado no projeto GaiaSenses, mas dessa forma foi possível mostrar a generalidade do código (funciona para a maioria dos produtos ABI), ressaltando o que deve ser alterado caso altere o produto. 

## Bibliotecas necessárias:

In [None]:
# Required modules
from netCDF4 import Dataset                     # Read / Write NetCDF4 files
import matplotlib.pyplot as plt                 # Plotting library
from datetime import datetime                   # Basic Dates and time types
import cartopy, cartopy.crs as ccrs             # Plot maps
import os                                       # Miscellaneous operating system interfaces
from osgeo import gdal                          # Python bindings for GDAL
from osgeo import osr                           # Python bindings for GDAL
import numpy as np                              # Scientific computing with Python
from matplotlib import cm                       # Colormap handling utilities
import cartopy.io.shapereader as shpreader      # Import shapefiles
import boto3                                    # Amazon Web Services (AWS) SDK for Python
from botocore import UNSIGNED                   # boto3 config
from botocore.config import Config              # boto3 config
from PIL import Image
gdal.PushErrorHandler('CPLQuietErrorHandler')   # Ignore GDAL warnings

## Detalhando o código...

Abaixo temos a função para mudar a projeção cartográfica de acordo com a extensão desejada:

In [None]:
def reproject(file_name, ncfile, array, extent, undef):

    # Read the original file projection and configure the output projection
    source_prj = osr.SpatialReference()
    source_prj.ImportFromProj4(ncfile.GetProjectionRef())
    target_prj = osr.SpatialReference()
    target_prj.ImportFromProj4("+proj=longlat +ellps=WGS84 +datum=WGS84 +no_defs")
   
    # Reproject the data
    GeoT = ncfile.GetGeoTransform()
    driver = gdal.GetDriverByName('MEM')
    raw = driver.Create('raw', array.shape[0], array.shape[1], 1, gdal.GDT_Float32)
    raw.SetGeoTransform(GeoT)
    raw.GetRasterBand(1).WriteArray(array)

    # Define the parameters of the output file  
    kwargs = {'format': 'netCDF', \
            'srcSRS': source_prj, \
            'dstSRS': target_prj, \
            'outputBounds': (extent[0], extent[3], extent[2], extent[1]), \
            'outputBoundsSRS': target_prj, \
            'outputType': gdal.GDT_Float32, \
            'srcNodata': undef, \
            'dstNodata': 'nan', \
            'resampleAlg': gdal.GRA_NearestNeighbour}

    # Write the reprojected file on disk
    gdal.Warp(file_name, raw, **kwargs)

A seguir, temos a função para download do arquivo nc, faz-se uma conexão com o servidor da Amazon Web Services através da biblioteca boto3, e então baixa-se o arquivo buscando-o pelo nome e data escolhida.

In [None]:
def download_PROD(yyyymmddhhmn, product_name, path_dest, bucket_name):

  os.makedirs(path_dest, exist_ok=True)

  year = datetime.strptime(yyyymmddhhmn, '%Y%m%d%H%M').strftime('%Y')
  day_of_year = datetime.strptime(yyyymmddhhmn, '%Y%m%d%H%M').strftime('%j')
  hour = datetime.strptime(yyyymmddhhmn, '%Y%m%d%H%M').strftime('%H')
  min = datetime.strptime(yyyymmddhhmn, '%Y%m%d%H%M').strftime('%M')

  # Initializes the S3 client
  s3_client = boto3.client('s3', config=Config(signature_version=UNSIGNED))

  # File structure
  prefix = f'{product_name}/{year}/{day_of_year}/{hour}/OR_{product_name}-M6_G16_s{year}{day_of_year}{hour}{min}'

  # Seach for the file on the server
  s3_result = s3_client.list_objects_v2(Bucket=bucket_name, Prefix=prefix, Delimiter = "/")

  # Check if there are files available
  if 'Contents' not in s3_result: 
    # There are no files
    print(f'No files found for the date: {yyyymmddhhmn}, Product-{product_name}')
    return -1
  else:
    # There are files
    for obj in s3_result['Contents']: 
      key = obj['Key']
      # Print the file name
      file_name = key.split('/')[-1].split('.')[0]

      # Download the file
      if os.path.exists(f'{path_dest}/{file_name}.nc'):
        print(f'File {path_dest}/{file_name}.nc exists')
      else:
        print(f'Downloading file {path_dest}/{file_name}.nc')
        s3_client.download_file(bucket_name, key, f'{path_dest}/{file_name}.nc')
  return f'{file_name}'

Primeiramente, define-se algumas variáveis:
- input: diretório em que ficará o arquivo nc a ser baixado
- output: diretório em que ficará o arquivo nc reprojetado e a imagem gerada do plot
- extent: recorte da extensão desejada, deve-se colocar a mínima longitude, mínima latitude, máxima longitude e máxima latitude, respectivamente. Os valores abaixo são do recorte do Brasil
- bucket_name: nome do satélite 
- product_name: nome do produto desejado, deve ser escrito exatamente como no site da Amazon (servidor utilizado)
- var: variável desejada do produto. É possível visualizar as variáveis disponíveis extraindo o conteúdo do arquivo nc, o que pode ser feito com Matlab (buscar pelo comando ncdisp)
- rate: caso haja alguma taxa sendo avaliada, pode-se colocar como nome para legenda 
- title: título da imagem

As informações usadas nesse código são voltadas para o produto da temperatura de superfície Land Surface Temperature ('ABI-L2-LSTF'), sendo a variável a própria temperatura ('LST'). Contudo, o código pode ser adaptado para outros produtos que sejam do tipo ABI, que seguem esse mesmo modelo, seria apenas necessário trocar o product_name e a var.

In [None]:
# Input and output directories
input = "Samples"; os.makedirs(input, exist_ok=True)
output = "Output"; os.makedirs(output, exist_ok=True)

# Desired data:
extent = [-75.0, -34, -34, 5.5] # Min lon, Min lat, Max lon, Max lat
bucket_name = 'noaa-goes16'
product_name = 'ABI-L2-LSTF'
var = 'LST'
rate = ""
title = ""

Arquivos nc geralmente são organizados em uma matriz multidimensional, cujo tamanho é dado pelo próprio arquivo (pode ser obtido extraindo seu conteúdo, usualmente o cabeçalho). Grande parte dos produtos ABI trabalhados nesse projeto possuem o tamanho (5424,5424), mas isso não é uma regra! Note que o produto da temperatura de superfície possue um tamanho diferente (1086,1086), ou seja, sempre deve-se consultar isso no arquivo nc e alterar no código caso necessário. 

In [None]:
#array = np.zeros((5424,5424))
array = np.zeros((1086,1086))

Por padrão o código baixaria o último produto disponível, que para o tipo ABI geralmente há um intervalo de 10 minutos, tal é a conta e formatação feita com a biblioteca datetime para a variável yyyymmddhhmn abaixo. Contudo, isso não é uma regra para todos os produtos! A saber, o produto LST (exemplo que está sendo trabalhado nesse código) possue apenas um único produto por hora, então o minuto sempre será '00', por isso há uma linha file_name comentada e na outra a data foi colocada manualmente, respeitando essa condição. Ou seja, sempre deve-se conferir no [site de download](https://home.chpc.utah.edu/~u0553130/Brian_Blaylock/cgi-bin/goes16_download.cgi?source=aws&satellite=noaa-goes16&domain=C&product=ABI-L2-LST&date=2022-07-19&hour=16) qual é o intervalo de cada produto.

In [None]:
minute = int(datetime.now().strftime('%M'))
yyyymmddhhmn = datetime.now().strftime('%Y%m%d%H' + str(minute - (minute % 10))) 

# Download and open the file
file_name = download_PROD("201908201200", product_name, input, bucket_name)
#file_name = download_PROD(yyyymmddhhmn, product_name, input, bucket_name)

Depois de baixado, o arquivo e sua flag de qualidade (dqf) são lidos. O dqf é útil para que trabalhemos apenas com dados válidos, por exemplo, há informações que podem ter sido encobertas por nuvens e o satélite não conseguiu ter acesso, logo tais dados estão "poluídos" e devem ser descartados. Além disso, é aplicada a escala (dada pelo próprio arquivo) e feita a reprojeção, salvando em um novo arquivo e o carregando no código.

In [None]:
img = gdal.Open(f'NETCDF:{input}/{file_name}.nc:' + var)
dqf = gdal.Open(f'NETCDF:{input}/{file_name}.nc:DQF')

# Read the header metadata
metadata = img.GetMetadata()
scale = float(metadata.get(var + '#scale_factor'))
offset = float(metadata.get(var + '#add_offset'))
undef = float(metadata.get(var + '#_FillValue'))
dtime = metadata.get('NC_GLOBAL#time_coverage_start')
unit = metadata.get(var + '#units')

# Load the data
ds = img.ReadAsArray(0, 0, img.RasterXSize, img.RasterYSize).astype(float)
ds_dqf = dqf.ReadAsArray(0, 0, dqf.RasterXSize, dqf.RasterYSize).astype(float)

# Remove undef
ds[ds == undef] = np.nan

# Apply the scale and offset 
ds = (ds * scale + offset) 

# Apply NaN's where the quality flag is greater than 1
ds[ds_dqf > 1] = np.nan

# Reproject the file
array = np.nansum(np.dstack((array, ds)),2)
filename = f'{output}/{product_name}_{yyyymmddhhmn}.nc'
reproject(filename, img, array, extent, undef)

# Open the reprojected GOES-R image
file = Dataset(filename)
data = file.variables['Band1'][:] 
data[data < 23] = np.nan

Assim, são colocadas as configurações do plot da imagem, como tamanho, quantidade de pixels, extensão geográfica, etc.

In [None]:
# Choose the plot size (width x height, in inches)
dpi = 125
plt.figure(figsize=(data.shape[1]/float(dpi),data.shape[0]/float(dpi)), dpi=dpi)

# Use the Geostationary projection in cartopy
ax = plt.axes(projection=ccrs.PlateCarree())

# Define the image extent
img_extent = [extent[0], extent[2], extent[1], extent[3]]
 
# Modify the colormap to zero values are white
colormap = cm.get_cmap('jet', 240)
newcolormap = colormap(np.linspace(0, 1, 240))
newcolormap[:1, :] = np.array([1, 1, 1, 1])
cmap = cm.colors.ListedColormap(newcolormap)

# Plot the image
img = ax.imshow(data, vmin=0, vmax=150, cmap=cmap, origin='upper', extent=img_extent)

Também são feitas algumas outras configurações de estilo, como shapefile, que é um arquivo a parte que coloca o desenho do contorno dos estados do Brasil (no caso), de acordo com a cor e tamanho desejados, mas lembre-se que este deve estar na mesma pasta do código (ou indicar outro diretório) para funcionar. Também são adicionadas linhas de fronteira, bordas, linhas de grade e um colorbar (legenda/escala da taxa sendo avaliada), esses podem ser configurados com cor, grossura, formato, entre outros. Há algumas linhas comentadas, que podem ser adicionadas caso desejado, por exemplo o título da imagem. Esse é um exemplo de estética do plot que foi satisfatório, mas que pode ser alterado conforme outras preferências.

In [None]:
# Add a shapefile
# https://geoftp.ibge.gov.br/organizacao_do_territorio/malhas_territoriais/malhas_municipais/municipio_2019/Brasil/BR/br_unidades_da_federacao.zip
shapefile = list(shpreader.Reader('BR_UF_2019.shp').geometries())
ax.add_geometries(shapefile, ccrs.PlateCarree(), edgecolor='black',facecolor='none', linewidth=0.3)

# Add coastlines, borders and gridlines
ax.coastlines(resolution='10m', color='black', linewidth=0.8)
ax.add_feature(cartopy.feature.BORDERS, edgecolor='black', linewidth=0.5)
gl = ax.gridlines(crs=ccrs.PlateCarree(), color='gray', alpha=1.0, linestyle='--', linewidth=0.25, xlocs=np.arange(-180, 180, 5), ylocs=np.arange(-90, 90, 5), draw_labels=True)
gl.top_labels = False
gl.right_labels = False
 
# Add a colorbar
plt.colorbar(img, label=rate, extend='max', orientation='horizontal', pad=0.05, fraction=0.05)

# Add a title
#plt.title(title, fontweight='bold', fontsize=10, loc='left')
#plt.title(datetime.strptime(yyyymmddhhmn, '%Y%m%d%H%M').strftime('%Y-%m-%d %H:%M'), fontsize=10, loc='right')

Por fim, a imagem é salva no formato png e mostrada na tela.

In [None]:
# Save the image
plt.savefig(f'{output}/{product_name}_{yyyymmddhhmn}.png') 

# Show the image
plt.show()

Cabe ressaltar que o código foi feito com a ajuda do curso “Processamento de Dados de Satélites Geoestacionários com Python” fornecido pelo INPE (Instituto Nacional de Pesquisas Espaciais).