In [2]:
from netCDF4 import Dataset, MFDataset
from pathlib import Path
import numpy as np
import matplotlib.pyplot as plt
import xarray as xr
import pandas as pd

In [3]:
data = Dataset(Path.cwd()/'data/raw/npp/h35v10.ncml.nc4')

In [4]:
data.variables

{'Latitude': <class 'netCDF4._netCDF4.Variable'>
 float64 Latitude(YDim, XDim)
     long_name: Latitude
     units: degrees_north
 unlimited dimensions: 
 current shape = (2400, 2400)
 filling off,
 'Longitude': <class 'netCDF4._netCDF4.Variable'>
 float64 Longitude(YDim, XDim)
     long_name: Longitude
     units: degrees_east
 unlimited dimensions: 
 current shape = (2400, 2400)
 filling off,
 'Npp_500m': <class 'netCDF4._netCDF4.Variable'>
 float32 Npp_500m(time, YDim, XDim)
     coordinates: Latitude Longitude
     scale_factor_err: 0.0
     add_offset_err: 0.0
     calibrated_nt: 22
     long_name: MOD17A3H -- MODIS Gridded 500M Net Primary Productivity (NPP)
     units: kg_C/m^2/yr
     PsnNet_FILLVALUE_DOC: FILL VALUE LEGEND
 32767 : _Fillvalue: not-computed or outside projection...
 32766 : water (ocean or inland)
 32765 : barren, very sparsely vegetated
 32764 : perennial snow,ice on pixel
 32763 : permanant wetlands,marshes
 32762 : urban,built-up 
 32761 : unclassified
 
   

In [5]:
for d in data.variables.items():
  print(d)

('Latitude', <class 'netCDF4._netCDF4.Variable'>
float64 Latitude(YDim, XDim)
    long_name: Latitude
    units: degrees_north
unlimited dimensions: 
current shape = (2400, 2400)
filling off)
('Longitude', <class 'netCDF4._netCDF4.Variable'>
float64 Longitude(YDim, XDim)
    long_name: Longitude
    units: degrees_east
unlimited dimensions: 
current shape = (2400, 2400)
filling off)
('Npp_500m', <class 'netCDF4._netCDF4.Variable'>
float32 Npp_500m(time, YDim, XDim)
    coordinates: Latitude Longitude
    scale_factor_err: 0.0
    add_offset_err: 0.0
    calibrated_nt: 22
    long_name: MOD17A3H -- MODIS Gridded 500M Net Primary Productivity (NPP)
    units: kg_C/m^2/yr
    PsnNet_FILLVALUE_DOC: FILL VALUE LEGEND
32767 : _Fillvalue: not-computed or outside projection...
32766 : water (ocean or inland)
32765 : barren, very sparsely vegetated
32764 : perennial snow,ice on pixel
32763 : permanant wetlands,marshes
32762 : urban,built-up 
32761 : unclassified

    orig_scale_factor: 0.0001
 

In [6]:
print(data['Npp_500m'])

<class 'netCDF4._netCDF4.Variable'>
float32 Npp_500m(time, YDim, XDim)
    coordinates: Latitude Longitude
    scale_factor_err: 0.0
    add_offset_err: 0.0
    calibrated_nt: 22
    long_name: MOD17A3H -- MODIS Gridded 500M Net Primary Productivity (NPP)
    units: kg_C/m^2/yr
    PsnNet_FILLVALUE_DOC: FILL VALUE LEGEND
32767 : _Fillvalue: not-computed or outside projection...
32766 : water (ocean or inland)
32765 : barren, very sparsely vegetated
32764 : perennial snow,ice on pixel
32763 : permanant wetlands,marshes
32762 : urban,built-up 
32761 : unclassified

    orig_scale_factor: 0.0001
    orig_add_offset: 0.0
    _FillValue: 32767.0
    valid_min: -3.0
    valid_max: 3.27
    grid_mapping: MOD_Grid_MOD17A3H_eos_cf_projection
unlimited dimensions: 
current shape = (22, 2400, 2400)
filling off


In [7]:
lon = data['Longitude'][:,:]
lon.shape

(2400, 2400)

In [8]:
npp = data['Npp_500m'][:,:,:]
npp.shape

(22, 2400, 2400)

In [9]:
npp

masked_array(
  data=[[[--, --, --, ..., --, --, --],
         [--, --, --, ..., --, --, --],
         [--, --, --, ..., --, --, --],
         ...,
         [--, --, --, ..., --, --, --],
         [--, --, --, ..., --, --, --],
         [--, --, --, ..., --, --, --]],

        [[--, --, --, ..., --, --, --],
         [--, --, --, ..., --, --, --],
         [--, --, --, ..., --, --, --],
         ...,
         [--, --, --, ..., --, --, --],
         [--, --, --, ..., --, --, --],
         [--, --, --, ..., --, --, --]],

        [[--, --, --, ..., --, --, --],
         [--, --, --, ..., --, --, --],
         [--, --, --, ..., --, --, --],
         ...,
         [--, --, --, ..., --, --, --],
         [--, --, --, ..., --, --, --],
         [--, --, --, ..., --, --, --]],

        ...,

        [[--, --, --, ..., --, --, --],
         [--, --, --, ..., --, --, --],
         [--, --, --, ..., --, --, --],
         ...,
         [--, --, --, ..., --, --, --],
         [--, --, --, ..., --,

In [10]:
data = xr.open_dataset(Path.cwd()/'data/raw/npp/h35v10.ncml.nc4')
data

In [11]:
df = data.to_dataframe().reset_index().drop(columns=['YDim', 'XDim'])
df

Unnamed: 0,time,Latitude,Longitude,Npp_500m
0,0,-10.002083,172.625746,32766.0
1,1,-10.002083,172.625746,32766.0
2,2,-10.002083,172.625746,32766.0
3,3,-10.002083,172.625746,32766.0
4,4,-10.002083,172.625746,32766.0
...,...,...,...,...
126719995,17,-19.997917,-168.452753,
126719996,18,-19.997917,-168.452753,
126719997,19,-19.997917,-168.452753,
126719998,20,-19.997917,-168.452753,


In [21]:
(df['Latitude'] >= lat_bounds[0]).value_counts()

False    126720000
Name: Latitude, dtype: int64

In [23]:
np.sort(df['Latitude'])

array([-19.99791666, -19.99791666, -19.99791666, ..., -10.00208333,
       -10.00208333, -10.00208333])

In [16]:
lon_bounds, lat_bounds = [-25, 65], [35, 72]
df[(df['Longitude'] >= lon_bounds[0]) & (df['Longitude'] <= lon_bounds[1]) & (df['Latitude'] >= lat_bounds[0]) & (df['Latitude'] <= lat_bounds[1])]

Unnamed: 0,time,Latitude,Longitude,Npp_500m


In [14]:
npp.XDim

AttributeError: 'MaskedArray' object has no attribute 'XDim'