# üîß PACE OCI - Notebook de Diagn√≥stico

Execute c√©lula por c√©lula para identificar onde est√° o problema.

In [15]:
# C√âLULA 1: Instalar depend√™ncias
import sys, subprocess
subprocess.check_call([sys.executable, "-m", "pip", "install", 
                       "earthaccess", "xarray", "netCDF4", "h5netcdf", "--quiet"])
print("‚úì Pacotes instalados")

‚úì Pacotes instalados


In [16]:
# C√âLULA 2: Imports e verifica√ß√£o de vers√£o
import earthaccess
import xarray as xr
from pathlib import Path

print(f"earthaccess version: {earthaccess.__version__}")
print(f"xarray version: {xr.__version__}")

earthaccess version: 0.15.1
xarray version: 2025.12.0


In [17]:
# C√âLULA 3: Verificar credenciais salvas
print("="*60)
print("VERIFICANDO CREDENCIAIS SALVAS")
print("="*60)

netrc_path = Path.home() / '.netrc'
print(f"\nPath ~/.netrc: {netrc_path}")
print(f"Existe: {netrc_path.exists()}")

if netrc_path.exists():
    with open(netrc_path) as f:
        content = f.read()
        if 'urs.earthdata.nasa.gov' in content:
            print("‚úì Credenciais Earthdata encontradas em ~/.netrc")
            # Show username (but not password)
            for line in content.split('\n'):
                if 'urs.earthdata.nasa.gov' in line:
                    print(f"  {line.split('login')[0]}login ***")
        else:
            print("‚ö† ~/.netrc existe mas N√ÉO cont√©m credenciais Earthdata")
else:
    print("‚ö† ~/.netrc N√ÉO existe - credenciais n√£o salvas")

VERIFICANDO CREDENCIAIS SALVAS

Path ~/.netrc: /home/desenvolvedor/.netrc
Existe: True
‚úì Credenciais Earthdata encontradas em ~/.netrc
  machine urs.earthdata.nasa.govlogin ***


In [18]:
# C√âLULA 4: Tentar autentica√ß√£o autom√°tica
print("="*60)
print("TENTANDO AUTENTICA√á√ÉO")
print("="*60)

try:
    auth = earthaccess.login()
    print(f"\nResultado: {auth}")
    print(f"Tipo: {type(auth)}")
    
    # Check store
    if earthaccess.__store__ is not None:
        print("\n‚úì AUTENTICA√á√ÉO OK!")
        print("  Store inicializado corretamente")
    else:
        print("\n‚ö† Store √© None - autentica√ß√£o pode ter falhado")
        
except Exception as e:
    print(f"\n‚úó Erro na autentica√ß√£o: {e}")
    print("\n‚Üí Execute a pr√≥xima c√©lula para autentica√ß√£o interativa")

TENTANDO AUTENTICA√á√ÉO

Resultado: <earthaccess.auth.Auth object at 0x797ff80ae6f0>
Tipo: <class 'earthaccess.auth.Auth'>

‚úì AUTENTICA√á√ÉO OK!
  Store inicializado corretamente


In [None]:
# C√âLULA 5: AUTENTICA√á√ÉO INTERATIVA
# ================================
# Descomente e execute se a c√©lula anterior falhou
# Voc√™ precisar√° inserir seu usu√°rio e senha NASA Earthdata

# auth = earthaccess.login(strategy='interactive')
# print(f"Auth: {auth}")
# print(f"Store: {earthaccess.__store__ is not None}")

In [19]:
# C√âLULA 6: Testar busca de dados
print("="*60)
print("TESTANDO BUSCA DE DADOS")
print("="*60)

test_date = "2024-06-15"
short_name = "PACE_OCI_L3M_CHL"

print(f"\nBuscando {short_name} para {test_date}...")

try:
    results = earthaccess.search_data(
        short_name=short_name,
        temporal=(test_date, test_date),
        granule_name="*.DAY.*.0p1deg.*"
    )
    
    print(f"‚úì Encontrados: {len(results)} arquivo(s)")
    
    if results:
        for r in results:
            url = r.data_links()[0]
            print(f"  ‚Üí {url.split('/')[-1]}")
            print(f"    URL: {url[:80]}...")
    else:
        print("‚ö† Nenhum arquivo encontrado para esta data")
        
except Exception as e:
    print(f"‚úó Erro na busca: {e}")
    results = []

TESTANDO BUSCA DE DADOS

Buscando PACE_OCI_L3M_CHL para 2024-06-15...
‚úì Encontrados: 1 arquivo(s)
  ‚Üí PACE_OCI.20240615.L3m.DAY.CHL.V3_1.chlor_a.0p1deg.nc
    URL: https://obdaac-tea.earthdatacloud.nasa.gov/ob-cumulus-prod-public/PACE_OCI.20240...


In [20]:
# C√âLULA 7: Testar abertura de arquivo (PASSO CR√çTICO)
print("="*60)
print("TESTANDO ABERTURA DE ARQUIVO")
print("="*60)

if not results:
    print("‚ö† Execute a c√©lula anterior primeiro (busca)")
else:
    print(f"\nTentando abrir com earthaccess.open()...")
    
    try:
        fileset = earthaccess.open(results)
        print(f"‚úì Fileset criado!")
        print(f"  Tipo: {type(fileset)}")
        print(f"  Quantidade: {len(fileset)}")
        print(f"  Item type: {type(fileset[0])}")
        
    except AttributeError as e:
        if "'NoneType'" in str(e):
            print("")
            print("="*60)
            print("‚úó ERRO DE AUTENTICA√á√ÉO DETECTADO!")
            print("="*60)
            print("""
O earthaccess.__store__ √© None, indicando que a 
autentica√ß√£o n√£o foi conclu√≠da corretamente.

SOLU√á√ÉO:
1. Volte √† c√©lula 5 e descomente as linhas
2. Execute para autenticar interativamente
3. Insira suas credenciais NASA Earthdata
4. Execute esta c√©lula novamente

Se n√£o tem conta, registre em:
https://urs.earthdata.nasa.gov
""")
        else:
            print(f"‚úó Erro: {e}")
            
    except Exception as e:
        print(f"‚úó Erro: {e}")
        import traceback
        traceback.print_exc()

TESTANDO ABERTURA DE ARQUIVO

Tentando abrir com earthaccess.open()...


QUEUEING TASKS | :   0%|          | 0/1 [00:00<?, ?it/s]

PROCESSING TASKS | :   0%|          | 0/1 [00:00<?, ?it/s]

COLLECTING RESULTS | :   0%|          | 0/1 [00:00<?, ?it/s]

‚úì Fileset criado!
  Tipo: <class 'list'>
  Quantidade: 1
  Item type: <class 'earthaccess.store.EarthAccessFile'>


In [21]:
# C√âLULA 8: Testar leitura com xarray
print("="*60)
print("TESTANDO LEITURA COM XARRAY")
print("="*60)

try:
    print("\nAbrindo dataset com xarray...")
    ds = xr.open_dataset(fileset[0])
    
    print(f"\n‚úì Dataset aberto com sucesso!")
    print(f"\nDimens√µes: {dict(ds.dims)}")
    print(f"Vari√°veis: {list(ds.data_vars)}")
    print(f"Lat range: {float(ds.lat.min()):.1f} a {float(ds.lat.max()):.1f}")
    print(f"Lon range: {float(ds.lon.min()):.1f} a {float(ds.lon.max()):.1f}")
    
    # Subset test
    print(f"\nTestando subset para Cape Hatteras...")
    ds_sub = ds.sel(
        lat=slice(50, 30),
        lon=slice(-80, -60)
    )
    print(f"Dimens√µes subset: {dict(ds_sub.dims)}")
    print(f"Tamanho estimado: {ds_sub.nbytes / 1e6:.1f} MB")
    
    ds.close()
    print("\n‚úì TUDO FUNCIONANDO!")
    
except NameError:
    print("‚ö† Execute a c√©lula anterior primeiro (fileset n√£o definido)")
except Exception as e:
    print(f"‚úó Erro: {e}")
    import traceback
    traceback.print_exc()

TESTANDO LEITURA COM XARRAY

Abrindo dataset com xarray...

‚úì Dataset aberto com sucesso!

Dimens√µes: {'lat': 1800, 'lon': 3600, 'rgb': 3, 'eightbitcolor': 256}
Vari√°veis: ['chlor_a', 'palette']
Lat range: -90.0 a 89.9
Lon range: -179.9 a 180.0

Testando subset para Cape Hatteras...
Dimens√µes subset: {'lat': 200, 'lon': 200, 'rgb': 3, 'eightbitcolor': 256}
Tamanho estimado: 0.2 MB

‚úì TUDO FUNCIONANDO!


  print(f"\nDimens√µes: {dict(ds.dims)}")
  print(f"Dimens√µes subset: {dict(ds_sub.dims)}")


In [14]:
# C√âLULA 9: Download de teste completo
print("="*60)
print("DOWNLOAD DE TESTE")
print("="*60)

output_file = "./teste_pace_chl.nc"

try:
    print("\n1. Buscando dados...")
    results = earthaccess.search_data(
        short_name="PACE_OCI_L3M_CHL",
        temporal=("2024-06-15", "2024-06-15"),
        granule_name="*.DAY.*.0p1deg.*"
    )
    print(f"   Encontrados: {len(results)}")
    
    print("\n2. Abrindo arquivo remoto...")
    fileset = earthaccess.open(results)
    print(f"   Fileset: {len(fileset)} arquivo(s)")
    
    print("\n3. Lendo com xarray...")
    ds = xr.open_dataset(fileset[0])
    print(f"   Dims: {dict(ds.dims)}")
    
    print("\n4. Aplicando subset...")
    ds_sub = ds.sel(
        lat=slice(50, 30),
        lon=slice(-80, -60)
    )
    print(f"   Subset dims: {dict(ds_sub.dims)}")
    
    print("\n5. Carregando dados na mem√≥ria...")
    ds_sub.load()
    print(f"   ‚úì Carregado: {ds_sub.nbytes / 1e6:.1f} MB")
    
    print(f"\n6. Salvando em {output_file}...")
    ds_sub.to_netcdf(output_file)
    print(f"   ‚úì Salvo!")
    
    ds_sub.close()
    ds.close()
    
    # Verify
    import os
    size_mb = os.path.getsize(output_file) / 1e6
    print(f"\n" + "="*60)
    print(f"‚úì DOWNLOAD COMPLETO!")
    print(f"  Arquivo: {output_file}")
    print(f"  Tamanho: {size_mb:.1f} MB")
    print("="*60)
    
except Exception as e:
    print(f"\n‚úó ERRO: {e}")
    import traceback
    traceback.print_exc()

DOWNLOAD DE TESTE

1. Buscando dados...
   Encontrados: 1

2. Abrindo arquivo remoto...


QUEUEING TASKS | :   0%|          | 0/1 [00:00<?, ?it/s]

PROCESSING TASKS | :   0%|          | 0/1 [00:00<?, ?it/s]

COLLECTING RESULTS | :   0%|          | 0/1 [00:00<?, ?it/s]

   Fileset: 1 arquivo(s)

3. Lendo com xarray...
   Dims: {'lat': 1800, 'lon': 3600, 'rgb': 3, 'eightbitcolor': 256}

4. Aplicando subset...
   Subset dims: {'lat': 200, 'lon': 200, 'rgb': 3, 'eightbitcolor': 256}

5. Carregando dados na mem√≥ria...
   ‚úì Carregado: 0.2 MB

6. Salvando em ./teste_pace_chl.nc...

‚úó ERRO: NetCDF: HDF error


  print(f"   Dims: {dict(ds.dims)}")
  print(f"   Subset dims: {dict(ds_sub.dims)}")
Traceback (most recent call last):
  File "/home/desenvolvedor/projetos/hackweek/2026-proj-Trawling4PACE/.venv/lib/python3.12/site-packages/xarray/backends/writers.py", line 441, in to_netcdf
    dump_to_store(
  File "/home/desenvolvedor/projetos/hackweek/2026-proj-Trawling4PACE/.venv/lib/python3.12/site-packages/xarray/backends/writers.py", line 491, in dump_to_store
    store.store(variables, attrs, check_encoding, writer, unlimited_dims=unlimited_dims)
  File "/home/desenvolvedor/projetos/hackweek/2026-proj-Trawling4PACE/.venv/lib/python3.12/site-packages/xarray/backends/common.py", line 533, in store
    self.set_variables(
  File "/home/desenvolvedor/projetos/hackweek/2026-proj-Trawling4PACE/.venv/lib/python3.12/site-packages/xarray/backends/common.py", line 575, in set_variables
    writer.add(source, target)
  File "/home/desenvolvedor/projetos/hackweek/2026-proj-Trawling4PACE/.venv/lib/python3

---

## üìã Resumo do Diagn√≥stico

Se voc√™ chegou at√© aqui sem erros, o download est√° funcionando!

### Problemas comuns:

| Erro | Solu√ß√£o |
|------|--------|
| `'NoneType' object has no attribute 'open'` | Autentica√ß√£o falhou. Execute `earthaccess.login(strategy='interactive')` |
| `HTTP 401 Unauthorized` | Credenciais incorretas ou expiradas |
| `0 granules found` | Data sem dados. PACE come√ßou em mar√ßo 2024 |
| `Connection timeout` | Problema de rede |

### Datas v√°lidas:
- PACE OCI: A partir de **mar√ßo 2024**
- Dados di√°rios (DAY) dispon√≠veis para a maioria das datas

In [22]:
# C√©lula de teste
import xarray as xr
import earthaccess

# Buscar e abrir
results = earthaccess.search_data(
    short_name="PACE_OCI_L3M_CHL",
    temporal=("2024-06-15", "2024-06-15"),
    granule_name="*.DAY.*.0p1deg.*"
)
fileset = earthaccess.open(results)
ds = xr.open_dataset(fileset[0])

# Subset
ds_sub = ds.sel(lat=slice(50, 30), lon=slice(-80, -60))
ds_sub.load()

# LIMPAR ENCODING
for var in list(ds_sub.data_vars) + list(ds_sub.coords):
    if var in ds_sub:
        ds_sub[var].encoding.clear()

# Salvar
ds_sub.to_netcdf("teste_pace_chl.nc")
print("‚úì Salvo!")

ds.close()

QUEUEING TASKS | :   0%|          | 0/1 [00:00<?, ?it/s]

PROCESSING TASKS | :   0%|          | 0/1 [00:00<?, ?it/s]

COLLECTING RESULTS | :   0%|          | 0/1 [00:00<?, ?it/s]

RuntimeError: NetCDF: HDF error

In [23]:
# Depois do load(), antes do to_netcdf():
ds_sub.load()

# Limpar encoding problem√°tico
for var in ds_sub.data_vars:
    ds_sub[var].encoding.clear()
for coord in ds_sub.coords:
    ds_sub[coord].encoding.clear()

# Agora salvar
ds_sub.to_netcdf(output_file)

PermissionError: [Errno 13] Permission denied: '/home/desenvolvedor/projetos/hackweek/2026-proj-Trawling4PACE/contributor_folders/leandro/teste_pace_chl.nc'

In [24]:
# Depois do load(), antes do to_netcdf():
ds_sub.load()

# Limpar encoding problem√°tico
for var in ds_sub.data_vars:
    ds_sub[var].encoding.clear()
for coord in ds_sub.coords:
    ds_sub[coord].encoding.clear()

# Agora salvar
ds_sub.to_netcdf(output_file)

RuntimeError: NetCDF: HDF error

In [26]:
import xarray as xr
import earthaccess
import numpy as np

# Buscar e abrir
results = earthaccess.search_data(
    short_name="PACE_OCI_L3M_CHL",
    temporal=("2024-06-15", "2024-06-15"),
    granule_name="*.DAY.*.0p1deg.*"
)
fileset = earthaccess.open(results)
ds = xr.open_dataset(fileset[0])

# Subset
ds_sub = ds.sel(lat=slice(50, 30), lon=slice(-80, -60))

# Extrair apenas chlor_a (ignorar palette que √© s√≥ para visualiza√ß√£o)
chlor_a = ds_sub['chlor_a'].values  # numpy array
lat = ds_sub['lat'].values
lon = ds_sub['lon'].values

# Fechar conex√£o remota
ds.close()

# Criar dataset NOVO do zero
ds_new = xr.Dataset(
    data_vars={
        'chlor_a': (['lat', 'lon'], chlor_a)
    },
    coords={
        'lat': lat,
        'lon': lon
    },
    attrs={'source': 'NASA PACE OCI L3M', 'date': '2024-06-15'}
)

# Salvar
ds_new.to_netcdf("teste_pace_chl.nc")
print("‚úì Salvo!")

# Verificar
import os
print(f"Tamanho: {os.path.getsize('teste_pace_chl.nc') / 1e6:.2f} MB")

QUEUEING TASKS | :   0%|          | 0/1 [00:00<?, ?it/s]

PROCESSING TASKS | :   0%|          | 0/1 [00:00<?, ?it/s]

COLLECTING RESULTS | :   0%|          | 0/1 [00:00<?, ?it/s]

RuntimeError: NetCDF: HDF error

In [27]:
import earthaccess
import xarray as xr
import os

# 1. Buscar
results = earthaccess.search_data(
    short_name="PACE_OCI_L3M_CHL",
    temporal=("2024-06-15", "2024-06-15"),
    granule_name="*.DAY.*.0p1deg.*"
)

# 2. DOWNLOAD do arquivo completo (m√©todo correto!)
downloaded_files = earthaccess.download(results, local_path="./pace_data")
print(f"Baixado: {downloaded_files}")

# 3. Abrir arquivo LOCAL e fazer subset
ds = xr.open_dataset(downloaded_files[0])
ds_sub = ds.sel(lat=slice(50, 30), lon=slice(-80, -60))

# 4. Salvar subset (agora funciona porque abrimos arquivo local)
ds_sub.to_netcdf("./pace_data/pace_chl_subset_20240615.nc")
print("‚úì Subset salvo!")

ds.close()

QUEUEING TASKS | :   0%|          | 0/1 [00:00<?, ?it/s]

PROCESSING TASKS | :   0%|          | 0/1 [00:00<?, ?it/s]

COLLECTING RESULTS | :   0%|          | 0/1 [00:00<?, ?it/s]

Baixado: [PosixPath('pace_data/PACE_OCI.20240615.L3m.DAY.CHL.V3_1.chlor_a.0p1deg.nc')]


OSError: [Errno -101] NetCDF: HDF error: '/home/desenvolvedor/projetos/hackweek/2026-proj-Trawling4PACE/contributor_folders/leandro/pace_data/PACE_OCI.20240615.L3m.DAY.CHL.V3_1.chlor_a.0p1deg.nc'

In [28]:
import xarray as xr

# Usar h5netcdf em vez de netCDF4
ds = xr.open_dataset(
    "./pace_data/PACE_OCI.20240615.L3m.DAY.CHL.V3_1.chlor_a.0p1deg.nc",
    engine="h5netcdf"
)
print(f"‚úì Aberto! Dims: {dict(ds.sizes)}")

# Subset
ds_sub = ds.sel(lat=slice(50, 30), lon=slice(-80, -60))

# Salvar (tamb√©m com h5netcdf)
ds_sub.to_netcdf("./pace_data/pace_chl_subset_20240615.nc", engine="h5netcdf")
print("‚úì Subset salvo!")

ds.close()

‚úì Aberto! Dims: {'lat': 1800, 'lon': 3600, 'rgb': 3, 'eightbitcolor': 256}
‚úì Subset salvo!
