# Soil-pydov tutorial

[![Binder](https://mybinder.org/badge_logo.svg)](https://mybinder.org/v2/gh/dov-vlaanderen/pygada/master?filepath=docs%2Fnotebooks%2Fnotebooks%2Fdata_input%2Fsoil_pydov.ipynb)

In this tutorial, some examples are given how to get soil data from [DOV](https://www.dov.vlaanderen.be/) with the use of [pydov](https://github.com/DOV-Vlaanderen/pydov) through pygada.
If you want to have a more personalised dataset you can check out the [pydov documentation](https://pydov.readthedocs.io/en/stable/) and build up your own query.

If it is the first time you use pygada, you need to download and install the package.

In [1]:
pip install pygada

You have to import the function to download the soil data.

In [2]:
import pydov
from pygada.data_input.soil_pydov import soil_request

Hereafter you can define which soil data you want to download. 
You have to define to inputs.
1. The parameter(s). \
    Check out the [possible soil parameters](https://pygada.readthedocs.io/en/latest/data_input.html).
2. The area of interest. \
    Check out the [possible area definitions](https://pygada.readthedocs.io/en/latest/general.html#bounding-box).

To clean up the output, two features are not shown.
1. The warnings, those are not important when using the notebooks and are being handeled in development.
2. The progress of XML downloads from pydov. For bigger regions this will lead to more process output and less overview of the notebook.

In [3]:
import warnings
warnings.filterwarnings('ignore')
pydov.hooks.clear()

## Case 1 : Download soil data of one parameter from Flanders.

In [4]:
soil = soil_request(['Mineralen - glauconiet'], 'flanders')
soil.head()

2023-04-25 10:50:21.106 | INFO     | pygada.data_input.soil_pydov:soil_request:38 - Downloading the soil observations data.


Unnamed: 0,pkey_bodemobservatie,pkey_bodemlocatie,pkey_parent,x,y,mv_mtaw,diepte_van_cm,diepte_tot_cm,observatiedatum,invoerdatum,...,parameter,detectie,waarde,eenheid,veld_labo,methode,betrouwbaarheid,fractiemeting_ondergrens,fractiemeting_bovengrens,fractiemeting_waarde
0,https://www.dov.vlaanderen.be/data/bodemobserv...,https://www.dov.vlaanderen.be/data/bodemlocati...,https://www.dov.vlaanderen.be/data/bodemmonste...,161668.0,229759.0,23.0,62.0,115.0,1954-04-16,,...,Mineralen - glauconiet,,0,%,veld,Mineralogisch onderzoek Fract. groter dan 50 µm,onbekend,,,
1,https://www.dov.vlaanderen.be/data/bodemobserv...,https://www.dov.vlaanderen.be/data/bodemlocati...,https://www.dov.vlaanderen.be/data/bodemmonste...,48784.0,185464.0,13.5,105.0,150.0,1952-09-19,,...,Mineralen - glauconiet,,4,%,veld,"Mineralogisch onderzoek Fract. Dens. 2,68",onbekend,,,
2,https://www.dov.vlaanderen.be/data/bodemobserv...,https://www.dov.vlaanderen.be/data/bodemlocati...,https://www.dov.vlaanderen.be/data/bodemmonste...,65513.0,220380.0,4.0,0.0,31.0,1950-11-23,,...,Mineralen - glauconiet,,2,%,veld,"Mineralogisch onderzoek Fract. Dens. 2,68",onbekend,,,
3,https://www.dov.vlaanderen.be/data/bodemobserv...,https://www.dov.vlaanderen.be/data/bodemlocati...,https://www.dov.vlaanderen.be/data/bodemmonste...,61751.0,206194.0,8.5,33.0,42.0,1951-12-28,,...,Mineralen - glauconiet,,3,%,veld,"Mineralogisch onderzoek Fract. Dens. 2,68",onbekend,,,
4,https://www.dov.vlaanderen.be/data/bodemobserv...,https://www.dov.vlaanderen.be/data/bodemlocati...,https://www.dov.vlaanderen.be/data/bodemmonste...,238956.0,207898.0,36.0,75.0,98.0,1963-11-15,,...,Mineralen - glauconiet,,0,%,veld,Mineralogisch onderzoek Fract. groter dan 50 µm,onbekend,,,


In [5]:
soil.info()

<class 'pandas.core.frame.DataFrame'>
RangeIndex: 7172 entries, 0 to 7171
Data columns (total 21 columns):
 #   Column                    Non-Null Count  Dtype  
---  ------                    --------------  -----  
 0   pkey_bodemobservatie      7172 non-null   object 
 1   pkey_bodemlocatie         7172 non-null   object 
 2   pkey_parent               7172 non-null   object 
 3   x                         7172 non-null   float64
 4   y                         7172 non-null   float64
 5   mv_mtaw                   7172 non-null   float64
 6   diepte_van_cm             7157 non-null   float64
 7   diepte_tot_cm             6983 non-null   float64
 8   observatiedatum           7172 non-null   object 
 9   invoerdatum               0 non-null      float64
 10  parametergroep            7172 non-null   object 
 11  parameter                 7172 non-null   object 
 12  detectie                  0 non-null      float64
 13  waarde                    7172 non-null   object 
 14  eenheid 

## Case 2 : Download soil data of multiple parameters from Flanders.

In [6]:
soil = soil_request(['Mineralen - glauconiet', 'Mineralen - kwarts'], 'flanders')
soil.head()

2023-04-25 11:07:47.735 | INFO     | pygada.data_input.soil_pydov:soil_request:38 - Downloading the soil observations data.


Unnamed: 0,pkey_bodemobservatie,pkey_bodemlocatie,pkey_parent,x,y,mv_mtaw,diepte_van_cm,diepte_tot_cm,observatiedatum,invoerdatum,...,parameter,detectie,waarde,eenheid,veld_labo,methode,betrouwbaarheid,fractiemeting_ondergrens,fractiemeting_bovengrens,fractiemeting_waarde
0,https://www.dov.vlaanderen.be/data/bodemobserv...,https://www.dov.vlaanderen.be/data/bodemlocati...,https://www.dov.vlaanderen.be/data/bodemmonste...,54818.0,174352.0,37.0,0.0,22.0,1955-12-10,,...,Mineralen - kwarts,,80,%,veld,Mineralogisch onderzoek Fract. groter dan 50 µm,onbekend,,,
1,https://www.dov.vlaanderen.be/data/bodemobserv...,https://www.dov.vlaanderen.be/data/bodemlocati...,https://www.dov.vlaanderen.be/data/bodemmonste...,161668.0,229759.0,23.0,27.0,32.0,1954-04-16,,...,Mineralen - kwarts,,90,%,veld,Mineralogisch onderzoek Fract. groter dan 50 µm,onbekend,,,
2,https://www.dov.vlaanderen.be/data/bodemobserv...,https://www.dov.vlaanderen.be/data/bodemlocati...,https://www.dov.vlaanderen.be/data/bodemmonste...,161668.0,229759.0,23.0,62.0,115.0,1954-04-16,,...,Mineralen - glauconiet,,0,%,veld,Mineralogisch onderzoek Fract. groter dan 50 µm,onbekend,,,
3,https://www.dov.vlaanderen.be/data/bodemobserv...,https://www.dov.vlaanderen.be/data/bodemlocati...,https://www.dov.vlaanderen.be/data/bodemmonste...,100704.0,204085.0,6.0,96.0,125.0,1962-11-06,,...,Mineralen - kwarts,,81,%,veld,Mineralogisch onderzoek Fract. groter dan 50 µm,onbekend,,,
4,https://www.dov.vlaanderen.be/data/bodemobserv...,https://www.dov.vlaanderen.be/data/bodemlocati...,https://www.dov.vlaanderen.be/data/bodemmonste...,48784.0,185464.0,13.5,105.0,150.0,1952-09-19,,...,Mineralen - glauconiet,,4,%,veld,"Mineralogisch onderzoek Fract. Dens. 2,68",onbekend,,,


In [7]:
soil.info()

<class 'pandas.core.frame.DataFrame'>
RangeIndex: 14441 entries, 0 to 14440
Data columns (total 21 columns):
 #   Column                    Non-Null Count  Dtype  
---  ------                    --------------  -----  
 0   pkey_bodemobservatie      14441 non-null  object 
 1   pkey_bodemlocatie         14441 non-null  object 
 2   pkey_parent               14441 non-null  object 
 3   x                         14441 non-null  float64
 4   y                         14441 non-null  float64
 5   mv_mtaw                   14441 non-null  float64
 6   diepte_van_cm             14425 non-null  float64
 7   diepte_tot_cm             14043 non-null  float64
 8   observatiedatum           14441 non-null  object 
 9   invoerdatum               0 non-null      float64
 10  parametergroep            14441 non-null  object 
 11  parameter                 14441 non-null  object 
 12  detectie                  0 non-null      float64
 13  waarde                    14441 non-null  object 
 14  eenhei

## Case 3 : Download soil data of one parameter from a specific area.

In [8]:
soil = soil_request(['Mineralen - glauconiet'], '99353-187938-113913-204528') # ~area of Ghent
soil.head()

2023-04-25 11:25:47.617 | INFO     | pygada.data_input.soil_pydov:soil_request:38 - Downloading the soil observations data.


Unnamed: 0,pkey_bodemobservatie,pkey_bodemlocatie,pkey_parent,x,y,mv_mtaw,diepte_van_cm,diepte_tot_cm,observatiedatum,invoerdatum,...,parameter,detectie,waarde,eenheid,veld_labo,methode,betrouwbaarheid,fractiemeting_ondergrens,fractiemeting_bovengrens,fractiemeting_waarde
0,https://www.dov.vlaanderen.be/data/bodemobserv...,https://www.dov.vlaanderen.be/data/bodemlocati...,https://www.dov.vlaanderen.be/data/bodemmonste...,109139.0,190715.0,5.0,22.0,60.0,1950-01-01,,...,Mineralen - glauconiet,,0,%,veld,"Mineralogisch onderzoek Fract. Dens. 2,68",onbekend,,,
1,https://www.dov.vlaanderen.be/data/bodemobserv...,https://www.dov.vlaanderen.be/data/bodemlocati...,https://www.dov.vlaanderen.be/data/bodemmonste...,112094.0,202910.0,6.0,92.0,115.0,1952-08-13,,...,Mineralen - glauconiet,,1,%,veld,"Mineralogisch onderzoek Fract. Dens. 2,68",onbekend,,,
2,https://www.dov.vlaanderen.be/data/bodemobserv...,https://www.dov.vlaanderen.be/data/bodemlocati...,https://www.dov.vlaanderen.be/data/bodemmonste...,112200.0,194585.0,6.0,60.0,93.0,1950-01-01,,...,Mineralen - glauconiet,,0,%,veld,"Mineralogisch onderzoek Fract. Dens. 2,68",onbekend,,,
3,https://www.dov.vlaanderen.be/data/bodemobserv...,https://www.dov.vlaanderen.be/data/bodemlocati...,https://www.dov.vlaanderen.be/data/bodemmonste...,112200.0,194585.0,6.0,0.0,21.0,1950-01-01,,...,Mineralen - glauconiet,,0,%,veld,"Mineralogisch onderzoek Fract. Dens. 2,68",onbekend,,,
4,https://www.dov.vlaanderen.be/data/bodemobserv...,https://www.dov.vlaanderen.be/data/bodemlocati...,https://www.dov.vlaanderen.be/data/bodemmonste...,100704.0,204085.0,6.0,43.0,64.0,1962-11-06,,...,Mineralen - glauconiet,,0,%,veld,Mineralogisch onderzoek Fract. groter dan 50 µm,onbekend,,,


In [9]:
soil.info()

<class 'pandas.core.frame.DataFrame'>
RangeIndex: 128 entries, 0 to 127
Data columns (total 21 columns):
 #   Column                    Non-Null Count  Dtype  
---  ------                    --------------  -----  
 0   pkey_bodemobservatie      128 non-null    object 
 1   pkey_bodemlocatie         128 non-null    object 
 2   pkey_parent               128 non-null    object 
 3   x                         128 non-null    float64
 4   y                         128 non-null    float64
 5   mv_mtaw                   128 non-null    float64
 6   diepte_van_cm             117 non-null    float64
 7   diepte_tot_cm             107 non-null    float64
 8   observatiedatum           128 non-null    object 
 9   invoerdatum               0 non-null      float64
 10  parametergroep            128 non-null    object 
 11  parameter                 128 non-null    object 
 12  detectie                  0 non-null      float64
 13  waarde                    128 non-null    object 
 14  eenheid   

## Case 4 : Download soil data of multiple parameters from a specific area.

In [10]:
soil = soil_request(['Mineralen - glauconiet', 'Mineralen - kwarts'], '99353-187938-113913-204528') # ~area of Ghent
soil.head()

2023-04-25 11:25:52.193 | INFO     | pygada.data_input.soil_pydov:soil_request:38 - Downloading the soil observations data.


Unnamed: 0,pkey_bodemobservatie,pkey_bodemlocatie,pkey_parent,x,y,mv_mtaw,diepte_van_cm,diepte_tot_cm,observatiedatum,invoerdatum,...,parameter,detectie,waarde,eenheid,veld_labo,methode,betrouwbaarheid,fractiemeting_ondergrens,fractiemeting_bovengrens,fractiemeting_waarde
0,https://www.dov.vlaanderen.be/data/bodemobserv...,https://www.dov.vlaanderen.be/data/bodemlocati...,https://www.dov.vlaanderen.be/data/bodemmonste...,100704.0,204085.0,6.0,96.0,125.0,1962-11-06,,...,Mineralen - kwarts,,81,%,veld,Mineralogisch onderzoek Fract. groter dan 50 µm,onbekend,,,
1,https://www.dov.vlaanderen.be/data/bodemobserv...,https://www.dov.vlaanderen.be/data/bodemlocati...,https://www.dov.vlaanderen.be/data/bodemmonste...,109139.0,190715.0,5.0,22.0,60.0,1950-01-01,,...,Mineralen - glauconiet,,0,%,veld,"Mineralogisch onderzoek Fract. Dens. 2,68",onbekend,,,
2,https://www.dov.vlaanderen.be/data/bodemobserv...,https://www.dov.vlaanderen.be/data/bodemlocati...,https://www.dov.vlaanderen.be/data/bodemmonste...,112094.0,202910.0,6.0,92.0,115.0,1952-08-13,,...,Mineralen - glauconiet,,1,%,veld,"Mineralogisch onderzoek Fract. Dens. 2,68",onbekend,,,
3,https://www.dov.vlaanderen.be/data/bodemobserv...,https://www.dov.vlaanderen.be/data/bodemlocati...,https://www.dov.vlaanderen.be/data/bodemmonste...,100704.0,204085.0,6.0,43.0,64.0,1962-11-06,,...,Mineralen - kwarts,,84,%,veld,Mineralogisch onderzoek Fract. groter dan 50 µm,onbekend,,,
4,https://www.dov.vlaanderen.be/data/bodemobserv...,https://www.dov.vlaanderen.be/data/bodemlocati...,https://www.dov.vlaanderen.be/data/bodemmonste...,100704.0,204085.0,6.0,22.0,43.0,1962-11-06,,...,Mineralen - kwarts,,81,%,veld,Mineralogisch onderzoek Fract. groter dan 50 µm,onbekend,,,


In [11]:
soil.info()

<class 'pandas.core.frame.DataFrame'>
RangeIndex: 147 entries, 0 to 146
Data columns (total 21 columns):
 #   Column                    Non-Null Count  Dtype  
---  ------                    --------------  -----  
 0   pkey_bodemobservatie      147 non-null    object 
 1   pkey_bodemlocatie         147 non-null    object 
 2   pkey_parent               147 non-null    object 
 3   x                         147 non-null    float64
 4   y                         147 non-null    float64
 5   mv_mtaw                   147 non-null    float64
 6   diepte_van_cm             136 non-null    float64
 7   diepte_tot_cm             126 non-null    float64
 8   observatiedatum           147 non-null    object 
 9   invoerdatum               0 non-null      float64
 10  parametergroep            147 non-null    object 
 11  parameter                 147 non-null    object 
 12  detectie                  0 non-null      float64
 13  waarde                    147 non-null    object 
 14  eenheid   