<a href="https://colab.research.google.com/github/mattijn/datasets/blob/master/WaterData_Scheldestromen.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

### Installatie + importeren Python packages in de Colab Notebook

Allereerst gaan we drie Python packages installeren welke niet standaard binnen de Colab omgeving zijn geïnstalleerd. Deze gaan we installeren via het package management system **`pip`**.  Dit roepen we aan binnen de Notebook als een *magic* functie, namelijk via

```python
!pip install <package_name>
```


---



De drie Python packages welke we gaan installeren zijn `hkvfewspy`, `hkvportal` en `geopandas`. 

In [1]:
!pip install hkvfewspy
!pip install hkvportal
!pip install geopandas

Collecting hkvfewspy
  Downloading https://files.pythonhosted.org/packages/0d/6f/5a61cf5d4a1aa897ef0eb3e273cbafac37adcaa159be84e77381cd0e56d4/hkvfewspy-0.7-py2.py3-none-any.whl
Collecting zeep>=3.0.0 (from hkvfewspy)
[?25l  Downloading https://files.pythonhosted.org/packages/5e/7e/31dc5db254f4bd788f03947bae4ee38117789f2d4872a4c11a05b57700db/zeep-3.4.0-py2.py3-none-any.whl (99kB)
[K     |████████████████████████████████| 102kB 7.2MB/s 
Collecting fire (from hkvfewspy)
  Downloading https://files.pythonhosted.org/packages/5a/b7/205702f348aab198baecd1d8344a90748cb68f53bdcd1cc30cbc08e47d3e/fire-0.1.3.tar.gz
Collecting appdirs>=1.4.0 (from zeep>=3.0.0->hkvfewspy)
  Downloading https://files.pythonhosted.org/packages/56/eb/810e700ed1349edde4cbdc1b2a21e28cdf115f9faf263f6bbf8447c1abf3/appdirs-1.4.3-py2.py3-none-any.whl
Collecting cached-property>=1.3.0 (from zeep>=3.0.0->hkvfewspy)
  Downloading https://files.pythonhosted.org/packages/3b/86/85c1be2e8db9e13ef9a350aecd6dea292bd612fa288c2f40d03

Vervolgens gaan we een aantal Python packages importeren binnen onze notebook. Elk van deze packages bevat een bibliotheek van functies welke we gaan gebruiken in deze workshop.


---



- `hkvfewspy` - voor het uitwisselen van gegevens met een FEWS database
- `pandas` - voor het werken met data welke maximaal 2-dimensies heeft (net zoals Microsoft Excel dat ook kan).
- `altair` - voor het maken van interactieve visualisaties
- `StringIO` - voor een in-memory text stream van HTML paginas
- `hkvportal` - voor het beschikbaar maken van de visualisatie in de browser (via https)

In [0]:
import hkvfewspy
import pandas
import altair
from io import StringIO
from hkvportal.io.services import dataportal as hkvportal

### Verbinding maken naar de FEWS Database + Dataportal 

Nu we de juiste Python packages hebben geinstalleerd en geimporteerd kunnen we beginnen met het opzetten van een verbinding naar de FEWS WebService welke beschikbaar is gesteld voor deze workshop. 

Dit doen we door middel van de FEWS WebService, wat een soort van API is waarmee we op een gestandardiseerde manier kunnen praten met de database van FEWS.

We doen dit door een `pi` object te initieren, waarbij we een `setClient` functie uitvoeren. In deze functie plaatsen we de URL van de FEWS PiService.

Daarnaast maken we ook een connectie naar de HKV dataportal welke we gebruiken voor het 'serveren' van de nog aan te maken visualisaties. 

In [3]:
# wordt gebruikt voor toegang FewsPi service Scheldestromen
pi = hkvfewspy.Pi() 
pi.setClient(wsdl='https://webviewer.hkvfewsscheldestromen.nl:8443/FewsPiService/fewspiservice?wsdl')

# wordt gebruikt voor opslag visualisaties voor Scheldestromen Sharepoint
dp = hkvportal()
dp.setDataservice(dataservice='https://dmws.hkvservices.nl/dataportal/')

dataservice is set. https://dmws.hkvservices.nl/dataportal/ will be used as portal


### Opvragen Locaties en Parameters

Met de opgezette verbinding gaan we de locaties opvragen zoals deze bekend zijn in de FEWS database. Dit doen we met de functie `getLocations()`. Deze locaties slaan we op in de variabele `locations`. We tonen deze `locations` vervolgens als een `pandas.DataFrame`.

In [4]:
# get available locations
locations = pi.getLocations()
locations

Unnamed: 0,VOV9345,VOV9346,VOV32379,KGM8,KGM44,KGM34,KGM54,KGM12,KGM39,KGM100,KGM46,KGM156,KGM157,KGM73,KGM55,KGM36,KGM35,KGM51,KGM19,KGM20,KGM159,KGM151,KGM131,KGM135,KGM142,KGM52,KGM10,KGM91,KGM27,KGM182,KGM17,KGM65,KGM97,KGM21,KGM49,KGM57,KGM90,KGM47,KGM9,KGM76,...,MPN4462,MPN4458,MPN4461,MPN4459,MPN4466,MPN4457,MPN4465,MPN4463,MPN4473,MPN4474,MPN4480,MPN4479,MPN4475,MPN4478,MPN4481,MPN4482,MPN4483,MPN4484,MPN4485,MPN4486,MPN4487,MPN4488,MPN4489,MPN4494,MPN4493,MPN4492,MPN4498,MPN4499,MPN4496,MPN4497,MPN4904,MPN4905,MPN4906,MPN4909,MPN4907,MPN4913,MPN4912,MPN4911,MPN4910,MPN4914
geoDatum,Rijks Driehoekstelsel,Rijks Driehoekstelsel,Rijks Driehoekstelsel,Rijks Driehoekstelsel,Rijks Driehoekstelsel,Rijks Driehoekstelsel,Rijks Driehoekstelsel,Rijks Driehoekstelsel,Rijks Driehoekstelsel,Rijks Driehoekstelsel,Rijks Driehoekstelsel,Rijks Driehoekstelsel,Rijks Driehoekstelsel,Rijks Driehoekstelsel,Rijks Driehoekstelsel,Rijks Driehoekstelsel,Rijks Driehoekstelsel,Rijks Driehoekstelsel,Rijks Driehoekstelsel,Rijks Driehoekstelsel,Rijks Driehoekstelsel,Rijks Driehoekstelsel,Rijks Driehoekstelsel,Rijks Driehoekstelsel,Rijks Driehoekstelsel,Rijks Driehoekstelsel,Rijks Driehoekstelsel,Rijks Driehoekstelsel,Rijks Driehoekstelsel,Rijks Driehoekstelsel,Rijks Driehoekstelsel,Rijks Driehoekstelsel,Rijks Driehoekstelsel,Rijks Driehoekstelsel,Rijks Driehoekstelsel,Rijks Driehoekstelsel,Rijks Driehoekstelsel,Rijks Driehoekstelsel,Rijks Driehoekstelsel,Rijks Driehoekstelsel,...,Rijks Driehoekstelsel,Rijks Driehoekstelsel,Rijks Driehoekstelsel,Rijks Driehoekstelsel,Rijks Driehoekstelsel,Rijks Driehoekstelsel,Rijks Driehoekstelsel,Rijks Driehoekstelsel,Rijks Driehoekstelsel,Rijks Driehoekstelsel,Rijks Driehoekstelsel,Rijks Driehoekstelsel,Rijks Driehoekstelsel,Rijks Driehoekstelsel,Rijks Driehoekstelsel,Rijks Driehoekstelsel,Rijks Driehoekstelsel,Rijks Driehoekstelsel,Rijks Driehoekstelsel,Rijks Driehoekstelsel,Rijks Driehoekstelsel,Rijks Driehoekstelsel,Rijks Driehoekstelsel,Rijks Driehoekstelsel,Rijks Driehoekstelsel,Rijks Driehoekstelsel,Rijks Driehoekstelsel,Rijks Driehoekstelsel,Rijks Driehoekstelsel,Rijks Driehoekstelsel,Rijks Driehoekstelsel,Rijks Driehoekstelsel,Rijks Driehoekstelsel,Rijks Driehoekstelsel,Rijks Driehoekstelsel,Rijks Driehoekstelsel,Rijks Driehoekstelsel,Rijks Driehoekstelsel,Rijks Driehoekstelsel,Rijks Driehoekstelsel
lat,51.4016519479478,51.48123119476028,51.27317529478825,51.65463775239045,51.563714349508196,51.507909256439255,51.38599635618589,51.64885045386372,51.545244272349386,51.572925598764755,51.55620270269095,51.33878080346948,51.30605173757065,51.60505885439964,51.406660036967075,51.45864422742382,51.49180954345002,51.412049562563794,51.59100966484886,51.59059882163103,51.33577866963928,51.29832669945125,51.3769428510576,51.36442677768085,51.29319882882253,51.38727719968617,51.7305472875512,51.50985984073714,51.52587544998866,51.404660714541336,51.613908249533615,51.480795124070845,51.5534462646436,51.55345650109916,51.518557399723036,51.47500391106764,51.420621177963035,51.601469444527865,51.74072824485289,51.57157406003172,...,51.28188177817269,51.277086446137695,51.30598166372969,51.248498025292825,51.29925893558335,51.31657031172857,51.30522379258914,51.36051886008018,51.58752477809138,51.64427029590638,51.707514214323076,51.70616609672372,51.71108649816933,51.67317260931914,51.73421938588256,51.73421381296282,51.305789411502296,51.39751341342654,51.485452770448305,51.44111887356126,51.45190469796753,51.482012658977446,51.483148787912754,51.44442421528728,51.44441715380222,51.483080472644275,51.44412293030843,51.39057776831087,51.417529899110754,51.4175177407747,51.46058131867781,51.46058979422694,51.49240556082831,51.47775839475506,51.4777314717713,51.53571173699996,51.50091659992924,51.51109798969467,51.51919839664145,51.52437906490621
locationId,VOV9345,VOV9346,VOV32379,KGM8,KGM44,KGM34,KGM54,KGM12,KGM39,KGM100,KGM46,KGM156,KGM157,KGM73,KGM55,KGM36,KGM35,KGM51,KGM19,KGM20,KGM159,KGM151,KGM131,KGM135,KGM142,KGM52,KGM10,KGM91,KGM27,KGM182,KGM17,KGM65,KGM97,KGM21,KGM49,KGM57,KGM90,KGM47,KGM9,KGM76,...,MPN4462,MPN4458,MPN4461,MPN4459,MPN4466,MPN4457,MPN4465,MPN4463,MPN4473,MPN4474,MPN4480,MPN4479,MPN4475,MPN4478,MPN4481,MPN4482,MPN4483,MPN4484,MPN4485,MPN4486,MPN4487,MPN4488,MPN4489,MPN4494,MPN4493,MPN4492,MPN4498,MPN4499,MPN4496,MPN4497,MPN4904,MPN4905,MPN4906,MPN4909,MPN4907,MPN4913,MPN4912,MPN4911,MPN4910,MPN4914
lon,4.24145342494035,3.600930263564612,3.828357777461734,3.8926374553143304,3.695183428677083,3.6320496407365863,3.81340231220656,3.9340894526840593,3.6738729000015087,4.12112841482906,3.8251054221634133,3.6467296796748156,3.7075799683541173,4.0773936290976875,3.8741213601666766,3.5428482431494004,3.6080777563527606,3.736729771645179,4.083456566921708,4.083446727336873,3.7693231471434174,3.719221741813741,3.3821838689794674,3.9585475226007545,3.9479719104931252,3.814629007498232,3.9217500931299973,3.9470188465850455,4.216403828964928,3.5049372198519175,4.143582750373793,4.007246418649206,4.045516593149638,4.045515569684366,3.7529323639840877,3.8973345378364033,4.19935730171248,3.8422065833746943,3.8891709141788717,4.040317955554453,...,3.38180987448024,3.449372643176188,3.467389574521667,3.4258336099354376,3.689811959635564,3.647263309621159,3.7078651065897796,3.6447130404989934,4.175288276421542,3.8964414334255233,3.7538805436504137,3.7560756966572013,3.766720355326258,3.9024059861528473,3.7685399497638334,3.768546520103299,3.379760069520167,3.548250560149217,3.6374213841010086,3.754165024061626,3.7809377713752506,3.796288471112781,3.8107747889888417,3.8440371032856144,3.8440197912931637,3.811081685789717,3.61662821764996,4.016198362681959,3.8184591191115222,3.8184307818576917,3.582622035361844,3.582588741303828,3.8044723070492132,3.7795308606650715,3.7795473605725003,3.754159303178653,3.7761213048479436,3.7515599325678415,3.7521935613269313,3.768046217784559
shortName,"VOV9345 - Krooshekreiniger Paviljoenpolder, Bath","VOV9346 - Krooshekreiniger Stromenwijk, Middel...","VOV32379 - Krooshekreiniger Westkade, Sluiskil",KGM8 - Gemaal Boerenweg,KGM44 - Gemaal Jacoba,KGM34 - Gemaal Veerse Watergang,KGM54 - Gemaal 't Fort,KGM12 - Gemaal 't Sas,KGM39 - Gemaal Aalvanger,KGM100 - Gemaal Abr. Groenewegeweg,KGM46 - Gemaal Adriaan,KGM156 - Gemaal Ameliapolder,KGM157 - Gemaal Angelinapolder,KGM73 - Gemaal Anna Vosdijk,KGM55 - Gemaal Baarland,KGM36 - Gemaal Bachlaan,KGM35 - Gemaal Boreel,KGM51 - Gemaal Borssele,"KGM19 - Gemaal Bosweg, noord","KGM20 - Gemaal Bosweg, zuid",KGM159 - Gemaal Braakman,KGM151 - Gemaal Braakmanpolder,KGM131 - Gemaal Cadzand,KGM135 - Gemaal Campen,KGM142 - Gemaal Catharinapolder,KGM52 - Gemaal Coudorpe,KGM10 - Gemaal De Bulke,KGM91 - Gemaal De Dee,KGM27 - Gemaal De Eendracht,KGM182 - Gemaal Nieuwe Sluis,KGM17 - Gemaal De Luyster,KGM65 - Gemaal De Moer,"KGM97 - Gemaal De Noord, Sint-Maartensdijk","KGM21 - Gemaal De Noord, Stavenisse",KGM49 - Gemaal De Piet,KGM57 - Gemaal De Poel,KGM90 - Gemaal De Poort,KGM47 - Gemaal De Valle,KGM9 - Gemaal Den Osse,KGM76 - Gemaal Derde Dijk,...,"MPN4462 - Stuw Grenssloot Ferket, bovenstrooms","MPN4458 - Stuw Noordstraat, Aardenburg, bovens...","MPN4461 - Stuw Sophiaweg, Oostburg, oost, bove...","MPN4459 - Stuw Verlorendorpweg, Eede, bovenstr...","MPN4466 - Stuw Hondegatweg, Biervliet, bovenst...","MPN4457 - Stuw Nolle, bovenstrooms","MPN4465 - Stuw Spanjaardsweg, Braakmanpolder, ...","MPN4463 - Stuw Wilhelminadijk, Hoofdplaat, bov...","MPN4473 - Stuw Vrijberghsedijk, Oud Vossemeer","MPN4474 - Duiker, Weldamseweg, Zierikzee, oost","MPN4480 - Stuw Duinzoom, Burgh Haamstede, noord","MPN4479 - Stuw Duinzoom, Burgh Haamstede, zuid","MPN4475 - Stuw Oostweg, Burgh Haamstede","MPN4478 - Stuw Zandweg, Zierikzee, nr 2","MPN4481 - Stuw Jan van Renesseweg, Renesse, bo...","MPN4482 - Stuw Jan van Renesseweg, Renesse, be...","MPN4483 - KBR1254, Jaagpad, Sluis","MPN4484 - Peilschaal vijver, KBR1523, Breskens","MPN4485 - Stuw Louis Armstrongweg, Middelburg,...",MPN4486 - Peilschaal Jurjaneweg,"MPN4487 - Duiker Werrilaan, 's-Heerenhoek, ins...","MPN4488 - Stuw Stelleplas, Stelleweg, Heinkens...","MPN4489 - Stuw Stelledijk, Rw A58, Heinkenszan...","MPN4494 - Stuw Koedijk/Zwaakweg, Nisse, benede...","MPN4493 - Stuw Koedijk/Zwaakweg, Nisse, bovens...","MPN4492 - Stuw Stelledijk, Rw A58, Heinkenszan...","MPN4498 - Stuw Westhoekweg, bovenstrooms","MPN4499 - Stuw Kalverdijk, Walsoorden, bovenst...","MPN4496 - Stuw Schoondijksedijk, bovenstrooms","MPN4497 - Stuw Schoondijksedijk, benedenstrooms","MPN4904 - Stuw Sloeweg, instroomzijde","MPN4905 - Stuw Sloeweg, uitstroomzijde","MPN4906 - Stuw Nieuwe Rijksweg, ÔÇÿs-Heer Aren...","MPN4909 - Stuw Sloeweg, Oude Kraayertsedijk, '...","MPN4907 - Stuw Sloeweg, Oude Kraayertsedijk, '...","MPN4913 - Stuw Egbert Petruspolderweg, Wolphaa...","MPN4912 - Stuw Kromme Weide, 's-Heer Arendskerke","MPN4911 - Stuw Pietweg, Calandpolder, Wolphaar...","MPN4910 - Stuw Pietweg, Wolphaartsdijk","MPN4914 - Stuw Westerlandpolder, Wolphaartsdij..."
x,75273.34,30924.61,46225.36,51580.44,37683.75,33157.37,45452.64,54435.68,36158.04,67232.1,46672.99,33727.17,37882.76,64264.79,49726.38,26827.2,31449.74,40181.91,64656.78,64655.28,42260.85,38674.78,15413.79,55507.82,54615.08,45541.09,53764.81,55024.64,73752.34,24037.93,68866.45,59143.97,61950.95,61950.9,41574.61,51496.68,72378.64,47965.61,51537.74,61627.73,...,15097.06,19795.53,21136.96,18067.99,36626.4,33705.42,37900.52,33644.44,71013.4,51820.02,42111.94,42260.28,43008.12,52298.39,43191.11,43191.55,15027.25,27031.04,33470.24,41467.12,43354.66,44494.62,45503.47,47722.38,47721.16,45524.62,31914.57,59577.01,45880.06,45878.06,29596.21,29593.92,45088.12,43320.32,43321.4,41702.53,43140.45,41460.74,41524.94,42637.85
y,379793.38,389540.88,366035.6,408373.84,398559.33,392455.74,378607.38,407672.0,396539.43,398984.3,397522.55,373619.28,369879.43,402612.41,380816.44,387129.1,390705.35,381623.29,401042.04,400996.35,373088.72,369001.55,378336.95,376000.09,368091.49,378748.01,416776.89,392193.29,393639.86,381192.11,403516.44,388879.29,396911.27,396912.41,393444.98,388385.42,381950.4,402532.5,417955.23,398934.44,...,367764.83,367104.13,370284.74,363968.33,369152.54,371147.95,369786.88,376040.53,400544.47,407215.2,414461.78,414308.42,414839.3,410421.77,417409.68,417409.05,370427.8,380320.24,389948.95,384829.41,385987.79,389313.39,389417.9,385060.96,385060.2,389409.84,385386.77,378832.0,382107.37,382106.06,387275.37,387276.37,390457.05,388865.72,388862.7,395351.19,391446.9,392617.39,393517.43,394069.12


Wat we zien is een dik gedrukte eerste rij (*VOV9345, VOV9346, VOV32379, ..*). Dit zijn de `columns` van de `DataFrame`. Daarnaast zien we een dik gedrukte eerste kolom (*geoDatum, lat, locationId, lon, shortName, x, y*), dit is de `index` van de `DataFrame`.

---



Met behulp van de `columns` en `index`waarden kunnen we een bepaalde rij/kolom of cel selecteren, bijvoorbeeld de **`x`** waarde welke hoort bij locatie **`KST457`**.

In [5]:
# slice by column and row
locations.KST457.x

'41666.77'

In [0]:
# wat is de shortName voor ID KGM157? (answer: locations.KGM157.shortName)

Hetzelfde gaan we doen voor de mogelijke parameters. Dit doen we door de functie `getParameters` uit te voeren, waarbij we de resultaten schrijven naar de variabele `parameters`. Net als `locations` is het resultaat hiervan een `pandas.DataFrame`.

In [7]:
# get available parameters
parameters = pi.getParameters()
parameters

Unnamed: 0,WNSHDB1,WNSHDB3,WNSHDB5,WNSHDB6,WNSHDB7,WNSHDB8,WNSHDB27,WNSHDB38,WNSHDB96
displayUnit,mNAP,mNAP,-,-,-,-,mS/cm,mNAP,-
id,WNSHDB1,WNSHDB3,WNSHDB5,WNSHDB6,WNSHDB7,WNSHDB8,WNSHDB27,WNSHDB38,WNSHDB96
name,waterstand instroom,waterstand uitstroom,bedrijf pomp1,bedrijf pomp2,bedrijf pomp3,bedrijf pomp4,geleidendheid,waterstand peilschaal,bedrijf pomp5
parameterType,instantaneous,instantaneous,instantaneous,instantaneous,instantaneous,instantaneous,instantaneous,instantaneous,instantaneous
unit,mNAP,mNAP,-,-,-,-,mS/cm,mNAP,-
usesDatum,false,false,false,false,false,false,false,false,false


Zoals we zien zijn de beschikbare parameters bekend onder de namen *WNSHDB1*,	*WNSHDB3*,	*..* en	*WNSHDB96*. Daarnaast is er ook wat meer informatie beschikbaar over deze parameters. De zogenoemde metadata.

Wanneer we bijvoorbeeld de metadata willen weten van parameter `WNSHDB1` doen we het volgende:

In [8]:
# slice by column
parameters.WNSHDB1

displayUnit                     mNAP
id                           WNSHDB1
name             waterstand instroom
parameterType          instantaneous
unit                            mNAP
usesDatum                      false
Name: WNSHDB1, dtype: object

In [0]:
# wat is de unit van parameter WNSHDB27? (answer: parameters.WNSHDB27.unit)

### Opvragen Tijdsreeks vanuit de FEWS database

Vervolgens willen we met behulp van deze bekende locaties en parameters een tijdreeks uitlezen uit de FEWS database. Hiervoor gaan we een `query` object aan maken met de functie `setQueryParameters`. 

Dit is een hulp object waarbij we specifiek onze opties opgeven zodat de FEWS database in staat is om de juiste tijdreeks terug te geven.

In [0]:
# initiate query object
query = pi.setQueryParameters()

Binnen de `query` zijn we geinteresseerd in:
- de `parameterIds` welke horen bij de instromende waterstand (`WNSHDB1`) en de uitstromende waterstand (`WNSHDB3`)
- de `locationIds` van de stuwen `KST457`, `KST291` en `KST521`.
- voor de periode tussen 3 dagen geleden (`startTime`) en nu (`endTime`).

In [0]:
eind = pandas.datetime.now()
start = eind - pandas.Timedelta(3, 'days')

In [12]:
start

datetime.datetime(2019, 6, 9, 13, 20, 4, 718376)

In [0]:
# define query parameters
query.parameterIds(['WNSHDB1', 'WNSHDB3'])
query.locationIds(['KST457', 'KST291', 'KST521'])
query.startTime(start)
query.endTime(eind)

In [14]:
query.query

{'clientTimeZone': 'Etc/GMT',
 'convertDatum': False,
 'endTime': datetime.datetime(2019, 6, 12, 13, 20, 4, 718376),
 'forecastSearchCount': 0,
 'importFromExternalDataSource': False,
 'locationIds': ['KST457', 'KST291', 'KST521'],
 'omitMissing': False,
 'onlyHeaders': False,
 'onlyManualEdits': False,
 'parameterIds': ['WNSHDB1', 'WNSHDB3'],
 'showEnsembleMemberIds': False,
 'showLocationAttributes': False,
 'showStatistics': False,
 'showThresholds': False,
 'startTime': datetime.datetime(2019, 6, 9, 13, 20, 4, 718376),
 'useDisplayUnits': True,
 'version': '1.25'}

Met het aangemaakte `query` object vragen we de tijdreeks op met behulp van de `getTimeSeries` functie, waar we ons `query` object meegeven waarbij we het resultaat plaatsen in de variabele `timeseries`.

Het resultaat is weer een pandas.DataFrame. Sinds we voor 3 locaties 2 parameters opvragen voor een periode van 3 dagen met kwartier waarden willen we niet alles tonen, maar alleen de bovenste 5 regels. Dit doen we met de regel:

```python
timeseries.head()
```

*Note: Het opvragen van deze tijdreeks combinatie kan een poosje duren. *

In [15]:
# request timeseries from FEWS given the query parameters
timeseries = pi.getTimeSeries(query)
timeseries.head()



Unnamed: 0_level_0,moduleInstanceId,qualifierId,parameterId,units,locationId,stationName,flag,value
date,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1,Unnamed: 5_level_1,Unnamed: 6_level_1,Unnamed: 7_level_1,Unnamed: 8_level_1
2019-06-09 13:15:00+00:00,,,WNSHDB1,mNAP,KST291,KST291 - Stuw Steursweg,0,-1.886
2019-06-09 13:15:00+00:00,,,WNSHDB1,mNAP,KST457,"KST457 - Stuw Meeldijk, nr 2",0,-1.112
2019-06-09 13:15:00+00:00,,,WNSHDB1,mNAP,KST521,KST521 - Stuw Ridderweg,0,-2.587
2019-06-09 13:15:00+00:00,,,WNSHDB3,mNAP,KST291,KST291 - Stuw Steursweg,0,-2.605
2019-06-09 13:15:00+00:00,,,WNSHDB3,mNAP,KST457,"KST457 - Stuw Meeldijk, nr 2",0,-1.858


In [16]:
timeseries.tail()

Unnamed: 0_level_0,moduleInstanceId,qualifierId,parameterId,units,locationId,stationName,flag,value
date,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1,Unnamed: 5_level_1,Unnamed: 6_level_1,Unnamed: 7_level_1,Unnamed: 8_level_1
2019-06-12 13:30:00+00:00,,,WNSHDB1,mNAP,KST457,"KST457 - Stuw Meeldijk, nr 2",8,-999
2019-06-12 13:30:00+00:00,,,WNSHDB1,mNAP,KST521,KST521 - Stuw Ridderweg,8,-999
2019-06-12 13:30:00+00:00,,,WNSHDB3,mNAP,KST291,KST291 - Stuw Steursweg,8,-999
2019-06-12 13:30:00+00:00,,,WNSHDB3,mNAP,KST457,"KST457 - Stuw Meeldijk, nr 2",8,-999
2019-06-12 13:30:00+00:00,,,WNSHDB3,mNAP,KST521,KST521 - Stuw Ridderweg,8,-999


In [0]:
# hoeveel waarden hebben we nu opgevraagd? (gebruik eg. timeseries.shape)

Wanneer we de DataFrame analyseren vallen er een aantal dingen op. Namelijk een `index` met de tijden en een aantal `columns` met FEWS eigenschappen van de tijdreeks. Met vervolgens de kolom `values` waarin de daadwerkelijke getallen staan die gemeten en/of afgeleid zijn.

In de `flag` kolom zien we de waarden 8 en 0 terug komen. Deze waarden geven een bepaalde betekenis over de waarde in de kolom `value`.

Deze flags hebben de volgende betekenis volgens de FEWS documentatie¹:

---



| Enumeration | Description                                                                                                                                        |
|-------------|----------------------------------------------------------------------------------------------------------------------------------------------------|
| 0           | Original/Reliable   The data value is the original value retrieved from an external source and it successfully passes all validation criteria set. |
| 8           | Completed/Unreliable   Original value was missing. Value has been filled in as above, but resulting value is unreliable and is removed.            |


---


Zoals te zien zijn de waarden met een `flag` 8 missing values. Deze willen we dan ook maskeren in de DataFrame

*¹ Bron: https://publicwiki.deltares.nl/display/FEWSDOC/D+Time+Series+Flags*


In [18]:
# mask nodata values using the flag value
timeseries.value.mask(timeseries.flag == 8, inplace=True)
timeseries.tail()

Unnamed: 0_level_0,moduleInstanceId,qualifierId,parameterId,units,locationId,stationName,flag,value
date,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1,Unnamed: 5_level_1,Unnamed: 6_level_1,Unnamed: 7_level_1,Unnamed: 8_level_1
2019-06-12 13:30:00+00:00,,,WNSHDB1,mNAP,KST457,"KST457 - Stuw Meeldijk, nr 2",8,
2019-06-12 13:30:00+00:00,,,WNSHDB1,mNAP,KST521,KST521 - Stuw Ridderweg,8,
2019-06-12 13:30:00+00:00,,,WNSHDB3,mNAP,KST291,KST291 - Stuw Steursweg,8,
2019-06-12 13:30:00+00:00,,,WNSHDB3,mNAP,KST457,"KST457 - Stuw Meeldijk, nr 2",8,
2019-06-12 13:30:00+00:00,,,WNSHDB3,mNAP,KST521,KST521 - Stuw Ridderweg,8,


### Interactieve visualisatie Tijdreeks van de waterstanden

Met de DataFrame waarbij de missing values gemaskeerd zijn (als `NaN`) willen we een interactieve visualisatie maken waarbij:
- de `x`-as de tijd toont
- de `y`-as de gemeten waarden
- de 3 locaties zichtbaar zijn als gekleurde lijnen (`color`)
- de 3 locaties naast elkaar worden geplaatst in een eigen grafiek (`column`-facet)
- de 2 parameters (*WNSHDB1* en *WNSHDB3*) onder elkaar worden geplaatst in een eigen grafiek (`row`-facet).

Als interactie willen we:
- kunnen inzoomen + pannen op de `x`-as 
- de *value*, *stationName* en *date*  zien oplichten als we over de punten gaan (`tooltip`)


In [19]:
# setup an interactive line chart
line_chart = altair.Chart(timeseries.reset_index()).mark_line(point=True).encode(
    x='date',
    y=altair.Y('value', title='waterstand (mNAP)',scale=altair.Scale(zero=False)),
    color='stationName',
    tooltip=['value', 'stationName', altair.Tooltip('date', format='%Y-%m-%d %H:%M')],
    column='stationName',
    row='parameterId'       
).properties(
    width=240,
    height=150
).resolve_scale(
    y='independent'
).interactive(bind_y=False)

# diplay the chart
line_chart

### Export naar URL (secured)

Dit is een figuur welke we willen tonen in de Documenten Atelier oftewel SharePoint online. 

We doen dit door de visualisatie om te zetten naar een HTML pagina. Deze HTML pagina kunnen we vervolgens insluiten binnen een door ons opgemaakte SharePoint pagina.

Om het figuur om te zetten naar een HTML pagina, kunnen we deze naar een `html` formaat opslaan. Normaal gesproken schrijf je dit naar een bestand op je harde schijf. Maar nu willen we deze figuur wegschrijven naar een secured (https) internet-pagina. Hiervoor gebruiken we in deze training de package `hkvportal`.

We gaan het figuur dus eerst omzetten naar een HTML-pagina representatie als tekst.


In [0]:
# export visualizatie als een 'in-memory text stream'
export_html = StringIO()
line_chart.save(export_html, format='html')

In [21]:
# inspecteer de output van de in-memory text stream. Wat herken je?
export_html.getvalue()

'<!DOCTYPE html>\n<html>\n<head>\n  <style>\n    .vega-actions a {\n        margin-right: 12px;\n        color: #757575;\n        font-weight: normal;\n        font-size: 13px;\n    }\n    .error {\n        color: red;\n    }\n  </style>\n  <script type="text/javascript" src="https://cdn.jsdelivr.net/npm//vega@5"></script>\n  <script type="text/javascript" src="https://cdn.jsdelivr.net/npm//vega-lite@3.3.0"></script>\n  <script type="text/javascript" src="https://cdn.jsdelivr.net/npm//vega-embed@4"></script>\n</head>\n<body>\n  <div id="vis"></div>\n  <script>\n      var spec = {"config": {"view": {"width": 400, "height": 300}, "mark": {"tooltip": null}}, "data": {"name": "data-a71a2a358f8cb38af6bfe019ce2da796"}, "mark": {"type": "line", "point": true}, "encoding": {"color": {"type": "nominal", "field": "stationName"}, "column": {"type": "nominal", "field": "stationName"}, "row": {"type": "nominal", "field": "parameterId"}, "tooltip": [{"type": "quantitative", "field": "value"}, {"type

Nu we de HTML-pagina als in-memory text stream hebben hebben we de mogelijkheid om deze weg te schrijven naar de `hkvportal`. Dit doen we door de `database` aan te geven waarin we de HTML pagina willen opslaan en de `key` onder welke naam dit gedaan moet worden.

Gebruik voor `key` een eigen bedachte naam anders overschrijf je de figuren van elkaar (vervelend als ze anders zijn). 

Het resultaat is een URL waaronder het figuur beschikbaar komt. 

In [22]:
dp.setEntryDatabase(database='WaterDataScheldestromen', key='stuwen_series', 
                    data=export_html.getvalue(), 
                    description='waterstand tijdreeks van 3 stuwen')

available at https://dmws.hkvservices.nl/dataportal/data.asmx/read2?database=WaterDataScheldestromen&key=stuwen_series&contentType=SET_BY_USER


{'date': '2019-06-12 13:20:56',
 'id': '943901bd-5b76-4ca1-b8de-21a017d11452',
 'key': 'stuwen_series'}

Klik op de URL en inspecteer het resultaat.

Wat gebeurd er als je `contentType=SET_BY_USER` wijzigt in `contentType=text/plain`?
En wat als je `contentType=text/html` doet?

Huh? Hoe kan dit?!

In [0]:
# dp.setEntryDatabase(database='WaterDataScheldestromen', key='stuwen_data_json_series', 
#                     data=timeseries.to_json(orient='records'), 
#                     description='waterstand tijdreeks van 3 stuwen')

### Welke informatie uit FEWS wil je ophalen? En op welke manier zou je deze willen visualiseren? 

Probeer het maar eens!

### Visualisatie Geavanceerd.

Stel dat we bijvoorbeeld een visualisatie willen laten zien waarbij we alle sluizen van ons watersysteem willen tonen op een kaart door middel van stippen. En elke stip willen we varieren in grote op basis van de gemiddelde waterstand van de sluis locatie over de periode waarover we de data opvragen.

Daarnaast willen we ook nog dat je kan klikken op elke punt in de kaart en dat er vervolgens een tijdreeks van desbetreffend locatie wordt getoond.
En als we dan toch bezig zijn willen we ook nog meerdere sluizen kan selecteren zodat ik de waterstanden met elkaar kan vergelijken.

En om een beetje duiding te geven gebruiken we de gebieden zoals gedefinieerd in de Plan WaterOpgave (`pwo_gebieden`). 
Uiteaard alles inzichtelijk met tooltips.



Dat betekent dat we eerst alle sluizen moeten filteren. Dit zijn locaties waarbij de `locationId` beginnen allen met `KSL`.

In [25]:
selected_locations = locations.T[locations.T.locationId.str.contains('KSL')]
selected_locations

Unnamed: 0,geoDatum,lat,locationId,lon,shortName,x,y
KSL4,Rijks Driehoekstelsel,51.440325603382384,KSL4,3.5757695823502744,KSL4 - Keersluis Koopmanshaven,29064.09,385034.19
KSL2,Rijks Driehoekstelsel,51.64228297649024,KSL2,3.910717194727634,KSL2 - Keersluis Zierikzee,52803.51,406974.0
KSL1,Rijks Driehoekstelsel,51.39934064427288,KSL1,4.218835820498346,KSL1 - Uitwateringssluis Bath,73695.47,379561.24
KSL5,Rijks Driehoekstelsel,51.38617630660279,KSL5,3.817212380185712,KSL5 - Uitwateringssluis Hellewoud,45718.25,378621.68
KSL12,Rijks Driehoekstelsel,51.365630009138464,KSL12,3.691328279197892,KSL12 - Uitwateringssluis Nol Zeven,36903.77,376532.52
KSL14,Rijks Driehoekstelsel,51.382396631419375,KSL14,4.032760577860117,KSL14 - Uitwateringssluis Walsoorden,60712.76,377900.41
KSL8,Rijks Driehoekstelsel,51.44211720534853,KSL8,3.6227898273054473,KSL8 - Uitwateringssluis Zuidwatering,32337.45,385153.29


 Voor de Pi-Query moeten we de sluiz locaties als lijst hebben met enkel de Ids:

In [26]:
sel_locids = selected_locations.locationId.tolist()
sel_locids

['KSL4', 'KSL2', 'KSL1', 'KSL5', 'KSL12', 'KSL14', 'KSL8']

In [0]:
start = pandas.datetime.now()
eind = start + pandas.Timedelta(3, 'days')

In [28]:
# initiate query object
query = pi.setQueryParameters()

# define query parameters
query.parameterIds(['WNSHDB1'])
query.locationIds(sel_locids)
query.startTime(start)
query.endTime(eind)

# request timeseries from FEWS given the query parameters
timeseries_2 = pi.getTimeSeries(query)
timeseries_2.head()



Unnamed: 0_level_0,moduleInstanceId,qualifierId,parameterId,units,locationId,stationName,flag,value
date,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1,Unnamed: 5_level_1,Unnamed: 6_level_1,Unnamed: 7_level_1,Unnamed: 8_level_1
2019-06-12 13:15:00+00:00,,,WNSHDB1,mNAP,KSL1,KSL1 - Uitwateringssluis Bath,8,-999
2019-06-12 13:15:00+00:00,,,WNSHDB1,mNAP,KSL12,KSL12 - Uitwateringssluis Nol Zeven,8,-999
2019-06-12 13:15:00+00:00,,,WNSHDB1,mNAP,KSL14,KSL14 - Uitwateringssluis Walsoorden,8,-999
2019-06-12 13:15:00+00:00,,,WNSHDB1,mNAP,KSL2,KSL2 - Keersluis Zierikzee,8,-999
2019-06-12 13:15:00+00:00,,,WNSHDB1,mNAP,KSL4,KSL4 - Keersluis Koopmanshaven,8,-999


Moeten we nog `flag 8` waarden filteren? Controleer de tijd, gebruik de `tail()` functie. Klopt dit wel? Aaargh, we doen iets verkeerds! Maar wat?

In [30]:
eind = pandas.datetime.now()
start = eind - pandas.Timedelta(3, 'days')

# initiate query object
query = pi.setQueryParameters()

# define query parameters
query.parameterIds(['WNSHDB1'])
query.locationIds(sel_locids)
query.startTime(start)
query.endTime(eind)

# request timeseries from FEWS given the query parameters
timeseries_2 = pi.getTimeSeries(query)

# mask nodata values using the flag value
timeseries_2.value.mask(timeseries_2.flag == 8, inplace=True)

timeseries_2.head()



Unnamed: 0_level_0,moduleInstanceId,qualifierId,parameterId,units,locationId,stationName,flag,value
date,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1,Unnamed: 5_level_1,Unnamed: 6_level_1,Unnamed: 7_level_1,Unnamed: 8_level_1
2019-06-09 13:15:00+00:00,,,WNSHDB1,mNAP,KSL1,KSL1 - Uitwateringssluis Bath,0,-1.947
2019-06-09 13:15:00+00:00,,,WNSHDB1,mNAP,KSL12,KSL12 - Uitwateringssluis Nol Zeven,0,0.01
2019-06-09 13:15:00+00:00,,,WNSHDB1,mNAP,KSL14,KSL14 - Uitwateringssluis Walsoorden,0,-0.813
2019-06-09 13:15:00+00:00,,,WNSHDB1,mNAP,KSL2,KSL2 - Keersluis Zierikzee,0,-1.264
2019-06-09 13:15:00+00:00,,,WNSHDB1,mNAP,KSL4,KSL4 - Keersluis Koopmanshaven,0,-1.164


Pffiew! Gelukkig heb je het kunnen oplossen. Laten we de tijdreeks koppelen aan de latitude en longitude welke we via de `getLocations()` functie hebben binnen gehaald.

Dit doen we door middel van een inner merge. Ook wel bekend onder de Excelse naamgeving VLOOKUP .

In [31]:
ts_latlon = timeseries_2.reset_index().merge(selected_locations, on='locationId')
ts_latlon.head()

Unnamed: 0,date,moduleInstanceId,qualifierId,parameterId,units,locationId,stationName,flag,value,geoDatum,lat,lon,shortName,x,y
0,2019-06-09 13:15:00+00:00,,,WNSHDB1,mNAP,KSL1,KSL1 - Uitwateringssluis Bath,0,-1.947,Rijks Driehoekstelsel,51.39934064427288,4.218835820498346,KSL1 - Uitwateringssluis Bath,73695.47,379561.24
1,2019-06-09 13:30:00+00:00,,,WNSHDB1,mNAP,KSL1,KSL1 - Uitwateringssluis Bath,0,-1.946,Rijks Driehoekstelsel,51.39934064427288,4.218835820498346,KSL1 - Uitwateringssluis Bath,73695.47,379561.24
2,2019-06-09 13:45:00+00:00,,,WNSHDB1,mNAP,KSL1,KSL1 - Uitwateringssluis Bath,0,-1.946,Rijks Driehoekstelsel,51.39934064427288,4.218835820498346,KSL1 - Uitwateringssluis Bath,73695.47,379561.24
3,2019-06-09 14:00:00+00:00,,,WNSHDB1,mNAP,KSL1,KSL1 - Uitwateringssluis Bath,0,-1.946,Rijks Driehoekstelsel,51.39934064427288,4.218835820498346,KSL1 - Uitwateringssluis Bath,73695.47,379561.24
4,2019-06-09 14:15:00+00:00,,,WNSHDB1,mNAP,KSL1,KSL1 - Uitwateringssluis Bath,0,-1.945,Rijks Driehoekstelsel,51.39934064427288,4.218835820498346,KSL1 - Uitwateringssluis Bath,73695.47,379561.24


Zoals je ziet hebben we nu voor elke waarde ook een locatie gekoppeld. Laten we deze gebruiken ter visualizatie. We gebruiken hier de `longitude` voor `lon`, `latitude` voor `lat`. En we wilden een bolletje hebben waarbij de grote van het bolletje afhangt van de gemiddelde waterstand welke over deze periode per sluis bekend is.

Daarnaast willen we een tooltip hebben welke aangeeft welke sluis het is.

In [32]:
# allereerst een ruimtelijk beeld waarbij de grote van het bolletje overeenkomt met de gemiddelde waterstand
altair.Chart(ts_latlon).mark_circle().encode(
    longitude='lon:Q',
    latitude='lat:Q',
    size='mean(value)',
    tooltip=['stationName']
)

En nu gaan we alles combineren. 
Eerst definieren we een basemap met behulp van een TopoJSON van de `pwo_gebieden`.

Vervolgens maken we een `selection_multi()` object welke reageert op de `stationName`

Daarna maken we het figuur voor de locations en los daarvan het figuur van de series (werken ze ook op zichzelf staand? Probeer maar eens)

En daarna combineren we ze gezamenlijk
De `basemap` + `locations` en deze weer naast elkaar met de `series`

In [33]:
url_topojson = 'https://dmws.hkvservices.nl/dataportal/data.asmx/read2?database=WaterDataScheldestromen&key=pwo_gebieden&contentType=application/json'
data_topojson_remote = altair.topo_feature(url=url_topojson, feature='pwo_gebieden')

basemap = altair.Chart(data_topojson_remote).mark_geoshape(
    fill='lightgray',
    stroke='white'
).encode(tooltip='properties.GEB_NAAM:N')

selector = altair.selection_multi(empty='none', fields=['stationName'], resolve='global')

base = altair.Chart(ts_latlon)

locations = base.mark_circle().encode(
    longitude='lon:Q',
    latitude='lat:Q',
    size=altair.Size('mean(value)', title='gemiddelde waterstand (mNAP)'),
    color='stationName',
    tooltip=['stationName', altair.Tooltip('mean(value)', title='gem. waterstand (mNAP)', format='.2f')]
).add_selection(selector
).properties(
    width=250,
    height=250,
    title='overzicht kaart stuwen'
)

series = base.mark_line().encode(
    x='date',
    y=altair.Y('value', title='waterstand binnenstrooms (mNAP)',scale=altair.Scale(zero=False)),
    color='stationName',
    tooltip=['value', 'stationName', altair.Tooltip('date', format='%Y-%m-%d %H:%M')]
).add_selection(selector).transform_filter(
    selector
).properties(
    height=250,
    title='klik in kaart op stuw voor tijdreeks (gebruik shift voor multi)'
)

comb_chart_dynamic = altair.hconcat(
    altair.layer(basemap, locations), 
    series
).configure(
    concat=altair.CompositionConfig(spacing=40),
    legend=altair.LegendConfig(labelLimit=0)
)

comb_chart_dynamic

Speel met het figuur. Lukt het je om meerdere tijdreeksen in het rechter figuur te krijgen?

Over welke elementen hebben we allemaal een tooltip gedefinieerd?


Laten we ook dit figuur opslaan als HTML pagina binnen de `hkvportal`.

In [0]:
# export visualizatie als een 'in-memory text stream'
export_html = StringIO()
comb_chart_dynamic.save(export_html, format='html')

In [35]:
dp.setEntryDatabase(database='WaterDataScheldestromen', key='kaart_sluizen_series', 
                    data=export_html.getvalue(), 
                    description='kaart sluizen waterstand tijdreeks van 3 stuwen')

available at https://dmws.hkvservices.nl/dataportal/data.asmx/read2?database=WaterDataScheldestromen&key=kaart_sluizen_series&contentType=SET_BY_USER


{'date': '2019-06-12 13:23:49',
 'id': 'b7fb7a77-9b27-4f2a-8e28-0e3f8e61b613',
 'key': 'kaart_sluizen_series'}

Inspectuur het resultaat vanuit de URL in je browser en voeg het toe aan je pagina in SharePoint