In [16]:
import os
import requests
import time 

from tqdm import tqdm

In [65]:
# setting download parameters
sba = 'NW' # Other subareas (Table 3)
var = 'CHL' # variable name 
comp = 'month' # monthly composite | here can be 'day', 'month' or 'year' 
init = 'GS' # Initial character of the sensor name, MODIS-Aqua (A) and SGLI-GCOMC (GS) 
ys = 2017 # start year
ms = 1 # start month
ds = 1 # start day of month
ye = 2022 # end year + 1, if end is 1997 then use yend = 1997 + 1 
me = 13 # end month + 1, if end is 12 (Dec) then use 13, if 1 then use 2
de = 30 # end day
file_ext = ('nc', 'png') # file extension (type) to download, ('nc', 'png') or ('nc',) or ('png',) 
url = 'https://ocean.nowpap3.go.jp/image_search/{filetype}/{subarea}/{year}/{filename}'

In [66]:
# Day month fetching file generator
def daymonth_filegen(filetype:tuple=file_ext):
    # Define the netCDF (PNG) file name
    for month in range(ms, me):
        if comp == 'day':
            for day in range(ds, de):
                files = [f'{init}{year}{month:02}{day:02}_{var}_{sba}_{comp}.{ext}' 
                         for ext in filetype]
                
                yield from [url.format(filetype='netcdf', subarea=sba, year=year, filename=f) 
                            if f.endswith('.nc') else 
                            url.format(filetype='images', subarea=sba, year=year, filename=f)
                            for f in files]
                            
        if comp == 'month':
            files = [f'{init}{year}{month:02}_{var}_{sba}_{comp}.{ext}'
                     for ext in filetype]
            
            yield from [url.format(filetype='netcdf', subarea=sba, year=year, filename=f) 
                        if f.endswith('.nc') else 
                        url.format(filetype='images', subarea=sba, year=year, filename=f)
                        for f in files]

In [67]:
# Function to download the data
def get_file(query_url:str):
    getfile =  "results/"+os.path.basename(query_url)
    with requests.get(query) as r:
        if r.status_code != 200:
            print(f'{os.path.basename(query_url)}: FileNotFound')
            return
        total = int(r.headers.get('content-length'))                
        print('File: {} '.format(getfile), end='')
        with tqdm(total=total) as bar, open(getfile, "wb") as handle:
            for chunk in r.iter_content(chunk_size=max(int(total / 1000), 1024 * 1024)):
                # download progress check tqdm
                if chunk: 
                    handle.write(chunk)
                    time.sleep(0.1)
                    bar.update(len(chunk))

In [None]:
# Now retrieve the data from NMEW
for year in range(ys, ye):
    print(f'{year}...')
    if comp in ('day', 'month'):
        for query in daymonth_filegen():
            # ----------------------
            get_file(query_url=query)
            # ----------------------
            
    if comp == 'year':
        ncfile = f'{init}{year}_{var}_{sba}_{comp}.nc'
        query = url.format(filetype='netcdf', subarea=sba, year=year, filename=ncfile)
        # ----------------------
        get_file(query_url=query)
        # ----------------------

        pngfile = f'{init}{year}_{var}_{sba}_{comp}.png'
        query = url.format(filetype='images', subarea=sba, year=year, filename=pngfile)
        # ----------------------
        get_file(query_url=query)
        # ----------------------

print('done!')

2017...
GS201701_CHL_NW_month.nc: FileNotFound
GS201701_CHL_NW_month.png: FileNotFound
GS201702_CHL_NW_month.nc: FileNotFound
GS201702_CHL_NW_month.png: FileNotFound
GS201703_CHL_NW_month.nc: FileNotFound
GS201703_CHL_NW_month.png: FileNotFound
GS201704_CHL_NW_month.nc: FileNotFound
GS201704_CHL_NW_month.png: FileNotFound
GS201705_CHL_NW_month.nc: FileNotFound
GS201705_CHL_NW_month.png: FileNotFound
GS201706_CHL_NW_month.nc: FileNotFound
GS201706_CHL_NW_month.png: FileNotFound
GS201707_CHL_NW_month.nc: FileNotFound
GS201707_CHL_NW_month.png: FileNotFound
GS201708_CHL_NW_month.nc: FileNotFound
GS201708_CHL_NW_month.png: FileNotFound
GS201709_CHL_NW_month.nc: FileNotFound
GS201709_CHL_NW_month.png: FileNotFound
GS201710_CHL_NW_month.nc: FileNotFound
GS201710_CHL_NW_month.png: FileNotFound
GS201711_CHL_NW_month.nc: FileNotFound
GS201711_CHL_NW_month.png: FileNotFound
GS201712_CHL_NW_month.nc: FileNotFound
GS201712_CHL_NW_month.png: FileNotFound
2018...
File: results/GS201801_CHL_NW_month.

100%|█████████████████████████████████████| 114211522/114211522 [00:11<00:00, 10129281.79it/s]


File: results/GS201801_CHL_NW_month.png 

100%|██████████████████████████████████████████| 8992797/8992797 [00:00<00:00, 9797670.81it/s]


File: results/GS201802_CHL_NW_month.nc 

100%|█████████████████████████████████████| 119987578/119987578 [00:11<00:00, 10093989.22it/s]


File: results/GS201802_CHL_NW_month.png 

100%|██████████████████████████████████████████| 8389817/8389817 [00:00<00:00, 8898960.18it/s]


File: results/GS201803_CHL_NW_month.nc 

100%|█████████████████████████████████████| 126412334/126412334 [00:12<00:00, 10196103.89it/s]


File: results/GS201803_CHL_NW_month.png 

100%|██████████████████████████████████████████| 7471895/7471895 [00:00<00:00, 8933210.31it/s]


File: results/GS201804_CHL_NW_month.nc 

100%|█████████████████████████████████████| 127033195/127033195 [00:12<00:00, 10119078.10it/s]


File: results/GS201804_CHL_NW_month.png 

100%|██████████████████████████████████████████| 7665805/7665805 [00:00<00:00, 9345434.94it/s]


File: results/GS201805_CHL_NW_month.nc 

100%|█████████████████████████████████████| 116223718/116223718 [00:11<00:00, 10191397.92it/s]


File: results/GS201805_CHL_NW_month.png 

100%|██████████████████████████████████████████| 6551689/6551689 [00:00<00:00, 8959670.52it/s]


File: results/GS201806_CHL_NW_month.nc 

100%|█████████████████████████████████████| 114697704/114697704 [00:11<00:00, 10032813.49it/s]


File: results/GS201806_CHL_NW_month.png 

100%|██████████████████████████████████████████| 8240002/8240002 [00:00<00:00, 9740213.62it/s]


File: results/GS201807_CHL_NW_month.nc 

100%|█████████████████████████████████████| 125504202/125504202 [00:12<00:00, 10198203.81it/s]


File: results/GS201807_CHL_NW_month.png 

100%|█████████████████████████████████████████| 8331923/8331923 [00:00<00:00, 10119502.17it/s]


File: results/GS201808_CHL_NW_month.nc 

100%|█████████████████████████████████████| 125066666/125066666 [00:12<00:00, 10083351.71it/s]


File: results/GS201808_CHL_NW_month.png 

100%|██████████████████████████████████████████| 6924430/6924430 [00:00<00:00, 9511076.04it/s]


File: results/GS201809_CHL_NW_month.nc 

100%|█████████████████████████████████████| 126578835/126578835 [00:12<00:00, 10155152.90it/s]


File: results/GS201809_CHL_NW_month.png 

100%|██████████████████████████████████████████| 7026368/7026368 [00:00<00:00, 9866130.38it/s]


File: results/GS201810_CHL_NW_month.nc 

100%|█████████████████████████████████████| 129462088/129462088 [00:12<00:00, 10146982.21it/s]


File: results/GS201810_CHL_NW_month.png 

100%|██████████████████████████████████████████| 6744465/6744465 [00:00<00:00, 9419874.92it/s]


File: results/GS201811_CHL_NW_month.nc 

100%|█████████████████████████████████████| 130475159/130475159 [00:12<00:00, 10153133.07it/s]


File: results/GS201811_CHL_NW_month.png 

100%|██████████████████████████████████████████| 8513614/8513614 [00:00<00:00, 9158017.46it/s]


File: results/GS201812_CHL_NW_month.nc 

100%|█████████████████████████████████████| 109443643/109443643 [00:10<00:00, 10159344.42it/s]


File: results/GS201812_CHL_NW_month.png 

100%|██████████████████████████████████████████| 9468614/9468614 [00:01<00:00, 9254369.04it/s]


2019...
File: results/GS201901_CHL_NW_month.nc 

100%|█████████████████████████████████████| 122748152/122748152 [00:12<00:00, 10195906.53it/s]


File: results/GS201901_CHL_NW_month.png 

100%|██████████████████████████████████████████| 9655654/9655654 [00:01<00:00, 9467810.37it/s]


File: results/GS201902_CHL_NW_month.nc 

100%|█████████████████████████████████████| 119921701/119921701 [00:11<00:00, 10060987.23it/s]


File: results/GS201902_CHL_NW_month.png 

100%|██████████████████████████████████████████| 7859694/7859694 [00:00<00:00, 9519525.65it/s]


File: results/GS201903_CHL_NW_month.nc 

100%|█████████████████████████████████████| 127869083/127869083 [00:12<00:00, 10167512.51it/s]


File: results/GS201903_CHL_NW_month.png 

100%|█████████████████████████████████████████| 7339330/7339330 [00:00<00:00, 10118979.01it/s]


File: results/GS201904_CHL_NW_month.nc 

100%|█████████████████████████████████████| 128764660/128764660 [00:12<00:00, 10164858.21it/s]


File: results/GS201904_CHL_NW_month.png 

100%|██████████████████████████████████████████| 7814800/7814800 [00:00<00:00, 9408757.75it/s]


File: results/GS201905_CHL_NW_month.nc 

100%|█████████████████████████████████████| 128561837/128561837 [00:12<00:00, 10153459.84it/s]


File: results/GS201905_CHL_NW_month.png 

100%|█████████████████████████████████████████| 7272640/7272640 [00:00<00:00, 10185301.15it/s]


File: results/GS201906_CHL_NW_month.nc 

100%|█████████████████████████████████████| 114242233/114242233 [00:11<00:00, 10189554.31it/s]


File: results/GS201906_CHL_NW_month.png 

100%|███████████████████████████████████████████████████| 8129329/8129329 [00:00<00:00, 9973509.90it/s]


File: results/GS201907_CHL_NW_month.nc 

100%|██████████████████████████████████████████████| 105708215/105708215 [00:10<00:00, 10237969.78it/s]


File: results/GS201907_CHL_NW_month.png 

100%|███████████████████████████████████████████████████| 6814212/6814212 [00:00<00:00, 9598457.79it/s]


File: results/GS201908_CHL_NW_month.nc 

100%|██████████████████████████████████████████████| 124303634/124303634 [00:12<00:00, 10294407.55it/s]


File: results/GS201908_CHL_NW_month.png 

100%|███████████████████████████████████████████████████| 7464434/7464434 [00:00<00:00, 9139598.34it/s]


File: results/GS201909_CHL_NW_month.nc 

100%|██████████████████████████████████████████████| 128017277/128017277 [00:12<00:00, 10085279.69it/s]


File: results/GS201909_CHL_NW_month.png 

100%|███████████████████████████████████████████████████| 7815650/7815650 [00:00<00:00, 9495503.29it/s]


File: results/GS201910_CHL_NW_month.nc 

100%|██████████████████████████████████████████████| 131344253/131344253 [00:12<00:00, 10127694.14it/s]


File: results/GS201910_CHL_NW_month.png 

100%|███████████████████████████████████████████████████| 8942190/8942190 [00:00<00:00, 9675614.89it/s]


File: results/GS201911_CHL_NW_month.nc 

100%|██████████████████████████████████████████████| 132854531/132854531 [00:13<00:00, 10186335.35it/s]


File: results/GS201911_CHL_NW_month.png 

100%|█████████████████████████████████████████████████| 10499433/10499433 [00:01<00:00, 9249958.69it/s]


File: results/GS201912_CHL_NW_month.nc 

100%|██████████████████████████████████████████████| 126199566/126199566 [00:12<00:00, 10113320.74it/s]


File: results/GS201912_CHL_NW_month.png 

100%|████████████████████████████████████████████████| 11445542/11445542 [00:01<00:00, 10171127.15it/s]


2020...
File: results/GS202001_CHL_NW_month.nc 

100%|██████████████████████████████████████████████| 116317030/116317030 [00:11<00:00, 10106473.03it/s]


File: results/GS202001_CHL_NW_month.png 

100%|█████████████████████████████████████████████████| 11239327/11239327 [00:01<00:00, 9888440.85it/s]


File: results/GS202002_CHL_NW_month.nc 

100%|██████████████████████████████████████████████| 125979641/125979641 [00:12<00:00, 10144291.14it/s]


File: results/GS202002_CHL_NW_month.png 

100%|█████████████████████████████████████████████████| 10592197/10592197 [00:01<00:00, 9326460.75it/s]


File: results/GS202003_CHL_NW_month.nc 

100%|██████████████████████████████████████████████| 127605484/127605484 [00:12<00:00, 10094707.29it/s]


File: results/GS202003_CHL_NW_month.png 

100%|███████████████████████████████████████████████████| 6793737/6793737 [00:00<00:00, 9505940.68it/s]


File: results/GS202004_CHL_NW_month.nc 

100%|██████████████████████████████████████████████| 126391807/126391807 [00:12<00:00, 10094506.01it/s]


File: results/GS202004_CHL_NW_month.png 

100%|███████████████████████████████████████████████████| 9981909/9981909 [00:01<00:00, 9795605.14it/s]


File: results/GS202005_CHL_NW_month.nc 

100%|██████████████████████████████████████████████| 115630884/115630884 [00:11<00:00, 10265162.69it/s]


File: results/GS202005_CHL_NW_month.png 

100%|██████████████████████████████████████████████████| 8143710/8143710 [00:00<00:00, 10027706.29it/s]


File: results/GS202006_CHL_NW_month.nc 

100%|████████████████████████████████████████████████| 97283780/97283780 [00:09<00:00, 10302754.22it/s]


File: results/GS202006_CHL_NW_month.png 

100%|███████████████████████████████████████████████████| 6629896/6629896 [00:00<00:00, 9322722.93it/s]


File: results/GS202007_CHL_NW_month.nc 

100%|██████████████████████████████████████████████| 117769853/117769853 [00:11<00:00, 10233095.16it/s]


File: results/GS202007_CHL_NW_month.png 

100%|███████████████████████████████████████████████████| 7529729/7529729 [00:00<00:00, 9272866.10it/s]


File: results/GS202008_CHL_NW_month.nc 

100%|██████████████████████████████████████████████| 130363763/130363763 [00:12<00:00, 10268688.62it/s]


File: results/GS202008_CHL_NW_month.png 

100%|██████████████████████████████████████████████████| 7193275/7193275 [00:00<00:00, 10125704.53it/s]


File: results/GS202009_CHL_NW_month.nc 

100%|██████████████████████████████████████████████| 132056309/132056309 [00:12<00:00, 10325787.07it/s]


File: results/GS202009_CHL_NW_month.png 

100%|███████████████████████████████████████████████████| 7868434/7868434 [00:00<00:00, 9695746.28it/s]


File: results/GS202010_CHL_NW_month.nc 

100%|██████████████████████████████████████████████| 132075633/132075633 [00:13<00:00, 10138696.45it/s]


File: results/GS202010_CHL_NW_month.png 

100%|██████████████████████████████████████████████████| 7332770/7332770 [00:00<00:00, 10175136.62it/s]


File: results/GS202011_CHL_NW_month.nc 

100%|██████████████████████████████████████████████| 131595824/131595824 [00:13<00:00, 10110154.05it/s]


File: results/GS202011_CHL_NW_month.png 

100%|███████████████████████████████████████████████████| 7911011/7911011 [00:00<00:00, 9672785.57it/s]


File: results/GS202012_CHL_NW_month.nc 

100%|██████████████████████████████████████████████| 122922758/122922758 [00:12<00:00, 10140743.86it/s]


File: results/GS202012_CHL_NW_month.png 

100%|███████████████████████████████████████████████████| 9111075/9111075 [00:00<00:00, 9789362.86it/s]


2021...
File: results/GS202101_CHL_NW_month.nc 

100%|██████████████████████████████████████████████| 121880224/121880224 [00:12<00:00, 10100009.14it/s]


File: results/GS202101_CHL_NW_month.png 

100%|██████████████████████████████████████████████████| 8341244/8341244 [00:00<00:00, 10069474.09it/s]


File: results/GS202102_CHL_NW_month.nc 

100%|██████████████████████████████████████████████| 125077720/125077720 [00:12<00:00, 10131868.40it/s]


File: results/GS202102_CHL_NW_month.png 

100%|███████████████████████████████████████████████████| 7844871/7844871 [00:00<00:00, 9514601.02it/s]


File: results/GS202103_CHL_NW_month.nc 

 96%|███████████████████████████████████████████▉  | 120586240/126140168 [00:11<00:00, 10202640.11it/s]