# PREAMBULE

### This notebook follows the sames steps than `data_uploader`, however the present one can treat several dataset at a time
Before you can upload your dataset:
- choose a dataset name (should not contain any special character, including '-'⁾ ;
- create the folder `/home/datawork-osmose/dataset/{dataset_name}` (or `home/datawork-osmose/dataset/{campaign_name}/{dataset_name}` in case of a recording campaign);
- place in this folder your audio data, they can be individual files or contain within multiple sub-folders ;
- if you have any csv files (either a `timestamp.csv` or `*gps*.csv` file) should also be placed in this folder ;

**Important notes:**
- about timestamps : all timestamps from your original data (from your audio filenames or from your csv files) MUST follow the same timestamp template which should be given in `date_template` ;
- about `*gps*.csv` file : this file provides the GPS track (ie latitude and longitude coordinates) of a moving hydrophone. This file must contain the term _gps_ in its filename ;
- about auxiliary csv files : they must contain headers with the following standardized names : timestamp , depth , lat , lon

#### <span style="color:blue">*JUST RUN CELL*</span>

In [None]:
import os
import sys
from pathlib import Path
from OSmOSE import Dataset
from OSmOSE.utils import *

path_osmose_dataset = "/home/datawork-osmose/dataset/"
path_osmose_home = "/home/datawork-osmose/"

display_folder_storage_infos(path_osmose_home)

#### <span style="color:blue">*JUST RUN CELL*</span>

In [None]:
list_dataset(path_osmose_dataset, "APOCADO")

#### <span style="color:red">*FILL & RUN CELL*</span>

If your dataset is part of a recording campaign, please provide its name with `campaign_name` ; in that case your dataset should be present in `home/datawork-osmose/dataset/{campaign_name}/{dataset_name}`. Otherwise let the default value `campaign_name = ""`.

In [None]:
list_dataset_name = [
    "APOCADO_C1D2_ST336363566",
    "APOCADO_C1D3_ST335556632",
    "APOCADO_C8D1_ST7181",
    "APOCADO_C8D1_ST7191",
    "APOCADO_C8D2_ST7181",
    "APOCADO_C8D2_ST7191",
    "APOCADO_C8D3_ST7181",
    "APOCADO_C8D3_ST7191",
    "APOCADO_C8D4_ST7181",
    "APOCADO_C8D4_ST7191",
    "APOCADO_C8D5_ST7181",
    "APOCADO_C8D5_ST7191",
    "APOCADO_C8D6_ST7181",
    "APOCADO_C8D6_ST7191",
    "APOCADO_C8D7_ST7181",
    "APOCADO_C8D7_ST7191",
    "APOCADO_C8D8_ST7181",
    "APOCADO_C8D8_ST7191",
    "APOCADO_C8D9_ST7181",
    "APOCADO_C8D9_ST7191",
    "APOCADO_C8D10_ST7181",
    "APOCADO_C8D10_ST7191",
    "APOCADO_C8D11_ST7181",
    "APOCADO_C8D11_ST7191",
    "APOCADO_C8D12_ST7181",
    "APOCADO_C8D12_ST7191",
    "APOCADO_C8D13_ST7189",
    "APOCADO_C8D13_ST7190",
    "APOCADO_C8D14_ST7189",
    "APOCADO_C8D14_ST7190",
    "APOCADO_C8D15_ST7189",
    "APOCADO_C8D15_ST7190",
    "APOCADO_C9D1_ST7181",
    "APOCADO_C9D2_ST7181",
    "APOCADO_C9D3_ST7181",
    "APOCADO_C9D4_ST7181",
    "APOCADO_C9D5_ST7191",
    "APOCADO_C9D6_ST7191",
    "APOCADO_C9D7_ST7191",
    "APOCADO_C9D8_ST7191",
    "APOCADO_C10D1_ST7179",
    "APOCADO_C10D2_ST7193",
    "APOCADO_C10D3_ST7179",
    "APOCADO_C10D4_ST7193",
    "APOCADO_C10D5_ST7179",
    "APOCADO_C10D6_ST7193",
    "APOCADO_C10D7_ST7179",
    "APOCADO_C10D9_ST7193",
]

list_campaign_name = ["APOCADO"] * len(list_dataset_name)

In case of fixed GPS coordinates, write in the variable `gps` below in decimal degree (latitude , longitude) of your dataset (eg, `gps= (49 , -2)` ). If you have a mobile hydrophone, enter the name of the csv file containing the GPS coordinates, this filename should contain the term _gps_.

In [None]:
list_gps = [
    (47.8683333333333, -4.7521),
    (47.9349333333333, -4.56256666666667),
    (48.2465166666667, -4.60826666666667),
    (48.2486333333333, -4.60665),
    (48.2497833333333, -4.61031666666667),
    (48.2506833333333, -4.60676666666667),
    (48.2507, -4.60721666666667),
    (48.2524666666667, -4.61021666666667),
    (48.2356833333333, -4.5875),
    (48.2370333333333, -4.59118333333333),
    (48.23505, -4.5887),
    (48.2368333333333, -4.59196666666667),
    (48.2382333333333, -4.58333333333333),
    (48.2401666666667, -4.58583333333333),
    (48.2321666666667, -4.57926666666667),
    (48.23495, -4.57983333333333),
    (48.2337833333333, -4.57628333333333),
    (48.2423333333333, -4.57),
    (48.23505, -4.57976666666667),
    (48.2373166666667, -4.57898333333333),
    (48.2321666666667, -4.57926666666667),
    (48.23495, -4.57983333333333),
    (48.186, -4.572),
    (48.1883333333333, -4.57106666666667),
    (48.2492833333333, -4.6103),
    (48.251, -4.61366666666667),
    (48.136, -4.62183333333333),
    (48.136, -4.62183333333333),
    (48.1615, -4.61966666666667),
    (48.1615, -4.61966666666667),
    (48.1566666666667, -4.61733333333333),
    (48.1566666666667, -4.61733333333333),
    (48, -4),
    (48, -4),
    (48, -4),
    (48, -4),
    (48, -4),
    (48, -4),
    (48, -4),
    (48, -4),
    (47.8528333333333, -4.63366666666667),
    (47.8345, -4.64966666666667),
    (47.8683333333333, -4.50716666666667),
    (47.9298333333333, -4.98166666666667),
    (47.8983333333333, -4.7575),
    (47.8613333333333, -4.781),
    (47.8978333333333, -4.4965),
    (47.9215, -4.81116666666667),
]

In [None]:
list_depth = [
    30,
    30,
    22,
    22,
    20,
    20,
    15,
    15,
    25,
    25,
    25,
    25,
    20,
    20,
    18,
    18,
    18,
    18,
    20,
    20,
    22,
    22,
    25,
    25,
    18,
    18,
    40,
    40,
    35,
    35,
    38,
    38,
    0,
    0,
    0,
    0,
    0,
    0,
    0,
    0,
    40,
    40,
    40,
    40,
    40,
    40,
    40,
    40,
    40,
]

Concerning the `timezone` of your data, by default we will consider they are from UTC+00:00. If that is not the case, please use this parameter to inform it, its format MUST follow `"+02:00"` for UTC+02:00 for example.

In [None]:
list_timezone = [
    "+02:00",
    "+02:00",
    "+02:00",
    "+02:00",
    "+02:00",
    "+02:00",
    "+02:00",
    "+02:00",
    "+02:00",
    "+02:00",
    "+02:00",
    "+02:00",
    "+02:00",
    "+02:00",
    "+02:00",
    "+02:00",
    "+02:00",
    "+02:00",
    "+02:00",
    "+02:00",
    "+02:00",
    "+02:00",
    "+02:00",
    "+02:00",
    "+02:00",
    "+02:00",
    "+02:00",
    "+02:00",
    "+02:00",
    "+02:00",
    "+02:00",
    "+02:00",
    "+01:00",
    "+01:00",
    "+01:00",
    "+01:00",
    "+01:00",
    "+01:00",
    "+01:00",
    "+01:00",
    "+01:00",
    "+01:00",
    "+01:00",
    "+01:00",
    "+01:00",
    "+01:00",
    "+01:00",
    "+01:00",
    "+01:00",
]

The variable `force_upload` allows you to upload your dataset on the platform despite detected anomalies.

In [None]:
force_upload = True
date_template = "%y%m%d%H%M%S"

In [None]:
for dataset_name, campaign_name, gps, depth, timezone in zip(
    list_dataset_name, list_campaign_name, list_gps, list_depth, list_timezone
):
    print(dataset_name)

    dataset = Dataset(
        Path(path_osmose_dataset, campaign_name, dataset_name),
        gps_coordinates=gps,
        depth=depth,
        owner_group="gosmose",
        local=False,
        timezone=timezone,
    )

    dataset.build(force_upload=force_upload, date_template=date_template)