Skip to content

Concept 🦧

Jonah Meijers edited this page Nov 12, 2020 · 19 revisions

Concept

Data-onderzoek

Met de support group zijn we gaan kijken naar wat er allemaal in de data zit. De datasets bevatten namelijk veel data, waar je veel verschillende invalshoeken uit kan halen. Mijn doel is om met dit onderzoek te gaan kijken naar wat echt interessant is om verder door te spitten en hopelijk een interessant verhaal uit te halen.

Waar ik me gelijk op stortte waren de tariefdelen. Tariefdelen zijn letterlijk delen van het tarief van een parkeergarage. Denk aan de prijsveranderingen wanneer je langer parkeert op de parkeerplaats. Met deze dataset kan je bijvoorbeeld heel goed inzien wat de prijsverschillen zijn in de verschillende gebieden in Nederland.

Deze dataset kan goed gekoppeld worden met andere datasets als: betaalmethodes, tijdvakken (dat zijn tijdvakken waarin bepaalde tarieven van toepassing zijn), specificaties parkeergebied (hoeveelheid plekken en oplaadpunten), locatie parkeergebied en gebiedsbeheerder. Deze datasets haken allemaal direct of indirect in op de tariefdelen. De betaalmethodes kunnen vertellen over bij welke prijs welke betaalmethodes gebruikt worden. De tijdvakken bieden heel veel context in wanneer bepaalde prijzen gehanteerd worden, de specificaties laten zien of de prijs een correlatie heeft met de hoeveelheid parkeerplekken, op bepaalde plaatsen kunnen hogere prijzen worden opgelegd en sommige gebiedsbeheerders kunnen hogere tarieven stellen dan anderen.

Ik denk dat het erg interessant is om op die tarieven in te gaan, maar er is ook interessante data over openingstijden te vinden. Misschien dat ik daar ook wat over kan vinden.

Mogelijke invalshoeken

  • Populariteit parkeerplekken m.b.t. tariefprijs en capaciteit.
  • Rol oplaadpunten in tariefprijs.
  • Waar zijn parkeerplaatsen het duurst?
  • Hoeveel geld ben je kwijt voor parkeren in het centrumgebied, vergeleken met parkeren in de buurt van de ring?
  • Hoe erg ondersteunen de parkeergarages de 24-uurs economie?

Hoofdvraag

Hoe erg ondersteunen parkeergarages de 24-uurs economie in Amsterdam?

Ik denk dat deze hoofdvraag niet goed uit de verf komt als ik geen data vergaar over de faciliteiten om de parkeergarages heen. Deze data kost erg veel moeite om te vergaren, dus laat ik dat even voor wat het is nu. Naar feedback van Chelsea herformuleer ik de hoofdvraag naar iets wat meer ingaat over de parkeergarages zelf, in plaats van wat er om de parkeergarages heen plaatsvindt.

Welke relatie is er tussen de afstand en de beschikbaarheid van parkeergarages tot hot-spots in de stad?

Onderzoeksvragen

  • Waar bevinden de parkeergarages zich?
  • Bij hoeveel parkeergarages kan je 24 uur per dag inrijden?
  • Wat is de gemiddelde sluitingstijd van de parkeergarages?
  • Veranderen gebiedsbeheerders hun prijzen voor 24-uurs garages?
  • Bij hoeveel parkeergarages kan je 24 uur per dag uitrijden?
    • Sinds wanneer kan je dit?
  • Wat is de capaciteit van de parkeergarages?

Gebruikte datasets

Wat ik eigenlijk nog wilde onderzoeken is waar de meeste faciliteiten in de stad liggen die profiteren van parkeergarages met 24 uur toegang en/of uitrijd-mogelijkheid. Dit kon ik niet zo een-twee in een formaat vinden die ik kan combineren met mijn huidige dataset.

Feedback 28 oktober

Op 28 oktober heb ik feedback gekregen van een van mijn klasgenoten. Deze feedback een extra dataset die ik eventueel mee zou kunnen nemen. Ik ga deze dataset doorzoeken, en als het me bevalt zet ik hem onderaan de lijst hierboven.

De docenten hebben daarnaast ook een hele hoop algemene feedback gegeven. De punten de ze geven zijn niet allemaal toepasbaar voor mij, maar dit zijn de feedback punten die ik zeker meeneem in mijn proces:

  • Duidelijk maken wat de variabelen zijn die ik ga gebruiken per deelvraag.
  • Data dat nog ontbreekt ook duidelijk aangeven.
  • Maak aannames op basis van de onderzoeksvragen.
  • Leg de data uit die ik gebruik.
  • Zet nog meer links in de README naar de wiki.
  • Stakeholders in de debriefing!!!
  • JSON structuur laten zien -> Ga ik doen met diagrammen.
  • Proces dataverwerking goed laten zien.
  • Brainstorm nog verder uitwerken??? (Dit ga ik terugkoppelen met docent en vul ik later aan of haal ik weg).

Ik zal de voortgang van deze feedback-punten bijhouden in Dit issue.

Aannames onderzoeksvragen

  • Naarmate je dichter bij de belangrijke locatie komt, zullen het aantal parkeerplekken steeds verder toenemen.
  • Er zijn veel parkeergarages waar je 24 uur per dag uit kan rijden, iets minder veel waar je 24 uur per dag in kan rijden.
  • Ik denk dat de gemiddelde sluitingstijd van een parkeergarage zo'n 12 uur 's nachts zal zijn.
  • Ik denk dat parkeergarages 's nachts niet hun tarieven veranderen.
  • Ik denk dat je bij alle parkeergarages binnen de ring 24 uur per dag uit kan rijden.
  • De capaciteit van de parkeerplaatsen neemt toe naarmate je dichterbij de belangrijke locaties komt.

Gebruikte variabelen

Waar bevinden de parkeergarages zich?

Van Geometrie gebied:

  • AreaId. Zodat ik de data kan koppelen aan andere datasets die informatie bevatten van dezelfde parkeergarage.
  • GeoDataAsText. Deze data bevat kaart-omlijningen of kaartpunten. Deze moeten omgezet worden naar datapunten.

Voor alle data die AreaId bevat

Van Gebied:

  • AreaId. De identifier van een parkeergebied. Wordt gebruikt in veel andere datasets om te vertellen over welk parkeergebied het gaat.
  • AreaDesc. De naam/beschrijving van het parkeergebied.
  • UsageId. De identifier voor het type parkeergebied. Hiermee kan ik opzoeken wat voor soort parkeergebied het is.
  • AreaManagerId. De identifier die verteld wie de beheerder is van het parkeergebied.

Van Gebiedsbeheerder:

  • AreaManagerId. De identifier voor de gebiedsbeheerder.
  • AreaManagerDesc. De beschrijving oftewel naam van de gebiedsbeheerder.

Van Gebruiksdoel:

  • UsageId. De identifier die wordt gebruikt om het gebruiksdoel te identificeren.
  • UsageIdDesc. De naam/beschrijving van het gebruiksdoel.

Bij hoeveel parkeergarages kan je 24 uur inrijden

Van Parking toegang:

  • AreaId. Zodat ik de data kan koppelen aan andere datasets die informatie bevatten van dezelfde parkeergarage.
  • Days: Weekdag in hoofdletters.
  • EnterFrom. Tijd die laat zien vanaf welke tijd je kan inrijden voor een bepaalde dag.
  • EnterUntil. Tijd die laat zien tot wanneer je mag inrijden.
  • StartOfPeriod en EndOfPeriod. Deze data (als string) laten zien wanneer de inrijd-tijden in dezelfde rij van kracht zijn geweest. Hiermee kan ik veranderingen over de tijd heen laten zien.

Wat is de gemiddelde sluitingstijd van de parkeergarages

Van Parking toegang:

  • AreaId. Zodat ik de data kan koppelen aan andere datasets die informatie bevatten van dezelfde parkeergarage.
  • EnterUntil. Tijd die laat zien tot wanneer je mag inrijden.
  • StartOfPeriod en EndOfPeriod. Deze data (als string) laten zien wanneer de inrijd-tijden in dezelfde rij van kracht zijn geweest. Hiermee kan ik veranderingen over de tijd heen laten zien.

Veranderen gebiedsbeheerders hun prijzen voor 24-uurs garages

Van Tariefdeel:

  • StartDurationFarePart. De minimumtijd voor dit tariefdeel om van kracht te gaan.
  • EndDurationFarePart. De maximumtijd voor dit tariefdeel om van kracht te zijn. Na deze tijd gaat de prijs over naar een volgend tarief.
  • AreaManagerId. De beheerder die de tarieven hanteert. Kan gecombineerd worden met andere datasets om te achterhalen wie de exploitant is.
  • FareCalculationCode. De code die ik kan gebruiken om de beschrijving op te halen van het tariefdeel.
  • AmountFarePart. De hoeveelheid die men betaald in euro's per stapgrootte.
  • StepSizeFarePart. Nummer in aantal minuten die aangeeft hoeveel tijd verstrijkt totdat het bedrag in AmountFarePart meer wordt betaald.

Van Tariefberekening:

  • FareCalculationCode. Hiermee koppel ik de data van Tariefdeel met deze dataset.
  • FareCalculationDesc. De beschrijving/naam van het tariefdeel.

Van Gebiedsbeheerder:

  • AreaManagerId. De identifier voor de gebiedsbeheerder.
  • AreaManagerDesc. De beschrijving oftewel naam van de gebiedsbeheerder.

Bij hoeveel parkeergarages kan je 24 uur per dag uitrijden (en sinds wanneer kan je dit)

Van Parking open:

  • AreaId. Zodat ik de data kan koppelen aan andere datasets die informatie bevatten van dezelfde parkeergarage.
  • ExitPossibleAllDay. Getal van 0 of 1 die aangeeft of je 24 uur uit kan rijden bij een parkeergarage.
  • StartOfPeriod en EndOfPeriod. Deze data (in getalvorm) laten zien wanneer een situatie (24 uur uitrijden of niet) van kracht is geweest. Hiermee kan ik eventueel jaarlijkse trend aangeven.

Wat is de capaciteit van de parkeergarages?

Van Specificatie gebied:

  • AreaId. Zodat ik de data kan koppelen aan andere datasets die informatie bevatten van dezelfde parkeergarage.
  • Capacity. Aantal beschikbare parkeerplekken.

Doel visualisatie

Wat ik uiteindelijk wil laten zien is een visualisatie die vertelt hoe makkelijk het is om een 24 uur per dag in de stad te leven en hoe bereikbaar Amsterdam is met de auto in die context. Ik ben persoonlijk erg benieuwd in hoeverre dit te zien is in de data.

Doel verwerken in schetsen

De eerste schets die ik heb gemaakt is een visualisatie waarin je kan zien tot hoe laat parkeergarages open zijn in relatie tot hoe ver ze van de Dam af liggen. Dit doe ik door middel van een klok die van 12AM t/m 5AM en van 6PM t/m 11PM loopt. De wijzers tonen de afstand tot de Dam in kilometers. De parkeergarages worden uitgezet op hoe laat ze sluiten en hoe dicht ze bij de Dam liggen.

Ik zit er zelf aan te denken om ook andere belangrijke stadsdelen en monumenten mee te pakken, zoals het gebied rondom Amsterdam Zuid, de Rai en het station Sloterdijk. Ik zou graag willen weten of dit ook een goede stap is om te zetten.

Schets datavisualisatie

Als feedback op het concept tot nu toe kreeg ik de goede tip om de aannames te verwerken in mijn schetsen. Dit heb ik verwerkt in de schets hieronder.

Schets datavisualisatie met aannames verwerkt

Feedback de Volkskrant

Op 5 november heeft Joris Tieleman van de Volkskrant vanuit journalistisch oogpunt feedback gegeven op het concept wat ik hier tot nu heb staan. Ik heb hem wat vragen gesteld over mijn concept, in de hoop dat ik verder mijn concept uit kan werken wat ook interessant is voor de Volkskrant:

  • Heb je ideeën over welke interactie je wilt om de data te kunnen onderzoeken?
  • Welke hot-spots zouden interessant zijn om te onderzoeken?
  • Welke invalshoeken zijn belangrijk om mee te nemen in de interactiviteit?
  • Zouden relaties met gebeurtenissen omtrent auto’s in Amsterdam gelegd kunnen worden?

Het eerste antwoord die ik kreeg was eigenlijk al voldoende om me verder op het juiste pad te houden. Joris gaf namelijk het briljante idee om te gaan kijken naar representatie. Welke hot-spots zijn goed voorzien van parkeerplaatsen, en welke minder? Deze invalshoek ga ik zeker meenemen in de visualisatie, en wellicht wel mijn hoofdvraag op afstemmen.

Nieuwe hoofdvraag

De hoofdvraag heb ik een beetje aangepast naar de feedback die is gegeven. De onderzoeksvragen zullen hetzelfde blijven. De manier waarop ik naar de data ga kijken is alleen veranderd.

Hoe goed worden verschillende bevolkingsgroepen gerepresenteerd als het gaat om parkeermogelijkheden voor aantrekkelijke locaties (hot-spots)?

Catastrofe

Tijdens het maken van de data-visualisatie kwam ik erachter dat de data die ik nodig had voor de data-visualisatie helemaal niet had, of deels niet kon vergaren. Openingstijden waren vooral verwerkt in de beschrijvingen van parkeergebieden, tarieven waren gekoppeld aan beheerders i.p.v. gebieden (je wist niet welk tarief voor welk gebied werd gehanteerd) en de 24-uur-open variabele was ook niet ingevuld in de regio Amsterdam. Hierdoor moet ik mijn concept voor een heel groot deel omgooien, om dezelfde datavisualisatie aan te kunnen houden. Ik heb daarom ook een groot deel van de variabelen die ik gebruikte weg kunnen gooien, waardoor ik nu met het volgende overblijf.

Nieuwe onderzoeksvragen

De hoofdvraag blijft hetzelfde, maar ik moet mijn onderzoeksvragen wel aanpassen omdat ze niet meer passen bij de data die ik gebruik. De onderzoeksvragen zijn:

  • Hoe ver bevinden de parkeergarages zich van de hot-spot?
  • Wat is de gemiddelde opengings- en sluitingstijd van de parkeergarages?
  • Wat is de capaciteit van de parkeergarages?

Een heel stuk minder vragen, maar dat komt dus omdat er echt nauwelijks data beschikbaar is. De dataset die is aangeleverdd is grotendeels incompleet, waardoor er dus dit soort concessies gemaakt moeten worden.

Nieuwe aannames

  • De parkeerplaatsen zullen het meest binnen 5km liggen van de hotspots. Amsterdam is nou eenmaal niet zo groot.
  • De gemiddelde openingstijd is 9 uur en de gemiddelde sluitingstijd is 6 uur.
  • De capactiteit zal wel rond de 200 per parkeerplaats liggen.

Nieuwe datasets

Nieuwe variabelen

Uit Gebied:

  • AreaId: De unieke identifier. Dit variabel is voor elk parkeergebeid uniek
  • AreaDesc: De beschrijving, ofwel de naam van het parkeergebied voor de beheerder.

Uit Parking toegang:

  • EnterFrom: De openingstijd van de ingang van een parkeergebied.
  • EnterUntil: De sluitingstijd van de ingang van een parkeegebied.

Uit Specificaties gebied:

  • Capacity: De hoeveelheid beschikbare plekken op een parkeergebied.

Uit Geometrie gebied:

  • GeometryAsTest: De locatie in een geo point (punt op het coördinatenstelsel) of polygon (de omlijning van de locatie in coördinaten geschreven).

Ik hoop zo mijn visualisatie af te kunnen ronden en het nog een soort van werkende te houden.