# Workshop deel 2: Dataopslag 
---
## Uitwerkingen notebook
---

## Inhoud van de notebook

- Importeren van benodigde modules
- Importeren van de datasets

- Creeren van data modellen
- Creeren van de functies voor het importeren van de data

- Connectie aan de MongoDB databases
- Gebruiken van de gecreerde functies


## Opdrachten in notebook
1. Opdracht 1: Vul het tracker document aan met de benodigde fieldtypes
2. Opdracht 2: Vul het transmission document aan met de benodigde fieldtypes
3. Opdracht 3: Vul het signal document aan met de benodigde fieldtypes
4. Opdracht 4: Definieer de code voor het creeren van een Trail document 
5. Opdracht 5: Definieer de code voor het creeren van een Signal document 
    
    

---
### Importeren van de benodigde modules
---

In [46]:
import pandas as pd
from mongoengine import * 
from datetime import datetime

### Importeren van de Kraanvogel datasets
---

In [47]:
Agnetha = pd.read_json('../../Datasets/JSON/Kraanvogel-Agnetha.json')
Frida = pd.read_json('../../Datasets/JSON/Kraanvogel-Frida.json')
Cajsa = pd.read_json('../../Datasets/JSON/Kraanvogel-Cajsa.json')

### Importeren van de GPS route datasets
---

In [48]:
Biesbosch = pd.read_json('../../Datasets/JSON/Route-Biesbosch.json')
Zeeland_Camper_1 = pd.read_json('../../Datasets/JSON/Route-Zeeland_Camper_1.json')
Zeeland_Camper_2 = pd.read_json('../../Datasets/JSON/Route-Zeeland_Camper_2.json')

---

# Creëren van het datamodel voor de Kraanvogel datasets

In de tabel hieronder vind je de data en datatype dat behoort tot het tracker document:

|Column|Type|
|--|--|
|name|string|
|study-name|string|
|individual-taxon-canonical-name|string|
|individual-local-identifier|int|

#### Opdracht 1: Vul het tracker document aan met de benodigde fieldtypes

---

In [49]:
class Tracker(Document):
    
    name = StringField()

    study_name = StringField() #TODO
    
    individual_taxon_canonical_name = StringField()
     
    individual_local_identifier =  IntField() #TODO

In de tabel hieronder vind je de data en datatype dat behoort tot het transmission document:

|Column|Type|Desc.|
|--|--|--|
|event-id |int|
|timestamp |datetime|
|coord|point[]| Dit is een array van de latitude en longitude coordinaten |
|alt|int|
|speed|float|
|heading| float|

#### Opdracht 2: Vul het transmission document aan met de benodigde fieldtypes
---

In [50]:
class Transmission(Document):
    
    event_id = IntField()
    
    timestamp = DateTimeField() #TODO
    
    coord = PointField()
    
    alt = FloatField()
    
    speed = FloatField() #TODO
    
    heading = IntField() #TODO

    tracker = ReferenceField(Tracker)

---

# Creëren van het datamodel voor de GPS route datasets
---

In [51]:
class Trail(Document):

    name = StringField()


#### Opdracht 3: Vul het signal document aan met de benodigde fieldtypes

In de tabel hieronder vind je de data dat behoort tot het signal document:

|Column|Type|
|--|--|
|timestamp |datetime|
|coord|point[]| Dit is een array van de latitude en longitude coordinaten |
|alt|float|


Daarnaast moet je in dit geval ook een referentie meegeven naar de Trail document. Dit heb je geleerd in de slides net. <br>
Indien je er niet uitkomt kan je altijd kijken naar hoe het is gedaan in de Transmission document 



In [52]:
class Signal(Document):
    
    timestamp = DateTimeField() #TODO
    
    coord = PointField()
    
    alt = FloatField()
    
    trail = ReferenceField(Trail) #TODO

---

---

## Einde opdracht 1, 2 en 3, verdere instructies volgen

---

---

## Creëren van functie voor importeren van de Kraanvogel data
---

In [55]:
def load_crane_data(df,name):
    
    tracker = Tracker(study_name = df.at[0,'study-name'],
                      individual_taxon_canonical_name = df.at[0,'individual-taxon-canonical-name'],
                      individual_local_identifier = df.at[0,'individual-local-identifier'],
                      name = name,).save()

    transmissions = []

    for index,row in df[:100].iterrows():
        transmissions.append(Transmission(event_id = row['event-id'],
                                          timestamp = row['timestamp'],
                                          coord = [row['location-long'],row['location-lat']],
                                          alt = row['height-above-ellipsoid'],
                                          speed = row['ground-speed'],
                                          tracker = tracker))
        
    Transmission.objects.insert(transmissions,load_bulk=True)
    
    print("Klaar met het importeren van: " + name)

---

## Creëren van functie voor importeren van de GPS route data
---

In [56]:
def load_route_data(df,name):
    
    
    # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # 
    #                                                                                   #
    #      OPDRACHT 4: Definieer de code voor het creeren van een Trail document        #
    #                                                                                   #
    # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # #
    # 
    # Om een document aan te maken moet je eerst aangeven welk document je wilt creeren.
    # Daarna geef je aan welke kolommen, uit het dataframe, moeten worden toegewezen aan
    # de bijbehorende fields van het document.
    #
    # Hiervoor moet je eerst weten welke fields er benodigd zijn voor de creatie van het
    # document. Hiervoor kan je terug kijken naar de code voor de declaratie van het Trail
    # document. 
    #
    # TIP: De waarde van de field komt staat niet in de dataset. Deze waarde geven wij
    # zelf mee bij het aanroepen van deze functie 
    #
    # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # #
    
    trail = Trail(name=name) #TODO

    trail.save() 
    
    for index,row in df[:100].iterrows():
        
        # Hier word de data voor de timestamp field aangewezen aan variable; "time"
        time = datetime.fromtimestamp(row['time']/1000)
        

        # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # #
        #                                                                                       #
        #      OPDRACHT 5: Definieer de code voor het creeren van de Signal document            #
        #                                                                                       #
        # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # 
        #                                                                                       
        # Hier moeten we weer aangeven wat voor type document we willen creeren.                            
        # Daarna geef je weer aan welke kolomen uit het dataframe moeten worden toegewezen 
        # aan de fields van het document.
        #                                                                                       
        # Om er achter te komen welke fields er benodigd zijn in een Signal document, kan je
        # weer terug kijken naar de creatie van het Signal document in opdracht 3.
        # 
        # TIP: De data voor de field; "timestamp" is al gedefinieerd. Je hoeft deze alleen nog
        # toe te wijzen aan de bijbehorende field in de Signal document
        # 
        # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # # 
        signal = Signal(timestamp = time,
                        coord=[row['lon'],row['lat']],
                        alt = row['alt'],
                        trail = trail) #TODO
    
        signal.save()
        
    print("Klaar met het importeren van: " + name)


---

---
### Connecten aan de Kraanvogel database
---

In [57]:
disconnect('default')
connect('Crane_Database_')

MongoClient(host=['localhost:27017'], document_class=dict, tz_aware=False, connect=True, read_preference=Primary())

---
### Inladen van de Kraanvogel data
---

In [58]:
load_crane_data(Agnetha,"Agnetha")
load_crane_data(Frida,"Frida")
load_crane_data(Cajsa,"Cajsa")

Klaar met het importeren van: Agnetha
Klaar met het importeren van: Frida
Klaar met het importeren van: Cajsa


---
### Connecten aan de GPS route database
---

In [59]:
disconnect('default')
connect('Trail_Database_')

MongoClient(host=['localhost:27017'], document_class=dict, tz_aware=False, connect=True, read_preference=Primary())

---
### Inladen van de GPS route data
---

In [60]:
load_route_data(Biesbosch,"Biesbosch")
load_route_data(Zeeland_Camper_1,"Zeeland Camper 1")
load_route_data(Zeeland_Camper_2,"Zeeland Camper 2")

Klaar met het importeren van: Biesbosch
Klaar met het importeren van: Zeeland Camper 1
Klaar met het importeren van: Zeeland Camper 2
