# Webscrapen en Analyseren de Toegankelijkheid van Geestelijke Gezondheidszorg in Verschillende Regio's in Nederland.

Beschrijving van het Onderzoek:
Ons project richtte zich op het ontwikkelen van een webscraper die data verzamelde over de toegankelijkheid van geestelijke gezondheidszorg van https://www.zorgkaartnederland.nl. De scraper heeft gegevens opgehaald van praktijken van psychologen, psychiaters en psychotherapeuten, inclusief informatie over zorgaanbieders, hun locaties, beoordelingen en aangeboden diensten. Nadat we de gegevens hadden verzameld, hebben we deze opgeslagen in een MySQL-database. Vervolgens hebben we de data visualiseren in Power BI.

Doelstelling:
Het doel van ons onderzoek was om de geografische verspreiding van geestelijke gezondheidszorg in Nederland te analyseren door locaties van zorgaanbieders te identificeren en de dichtheid en dekking te beoordelen. 

Gebruikte Technieken:
Jupyter Notebook en Python, voor het schrijven van de script en documenteren van alle stappen. 
BeautifulSoup voor Webscrapen.
MySQL, opzetten van de database waar de data wordt opgeslagen.
Power BI voor het visualisatie van de data.


## Mapping van Stad of Dorp naar Provincie

Op de website van zorgkaartnederland.nl stond bij de prakitijkinformatie alleen de naam van de stad of het dorp, maar geen provincie. Wij vonden de provincie belangrijk en nodig om onze conclusie te trekken over de beschikbaarheid van geestelijke gezondheidszorgspecialisten in heel Nederland.
We wilden ook een kaartvisual gebruiken in ons dashboard en dat zou nodig zijn voor die visualisatie en voor andere visuals.
Daarom was het creëren van dit dictionary van stad of dorp naar provincie een belangrijke stap.

In [236]:
# Stad/Dorp naar Provnicie mapping
stad_dorp_provincie_land_mapping = {
"Aalten": "Gelderland", "Abcoude": "Utrecht", "Achterveld": "Utrecht", "Achtmaal": "Noord-Brabant", "Aerdenhout": "Noord-Holland", "Albergen": "Overijssel", "Alkmaar": "Noord-Holland", "Almelo": "Overijssel", "Almere": "Flevoland", "Almkerk": "Noord-Brabant", "Alphen": "Noord-Brabant", "Alphen aan den Rijn": "Zuid-Holland", "Amerongen": "Utrecht", "Amersfoort": "Utrecht", "Amstelhoek": "Utrecht", "Amstelveen": "Noord-Holland", "Amsterdam": "Noord-Holland", "Annen": "Drenthe", "Ansen": "Drenthe", "Apeldoorn": "Gelderland", "Appelscha": "Friesland", "Appingedam": "Groningen", "Arnhem": "Gelderland", "Assen": "Drenthe", "Asten": "Noord-Brabant",
"Axel": "Zeeland", "Baarle-Nassau": "Noord-Brabant", "Baarn": "Utrecht", "Badhoevedorp": "Noord-Holland", "Baflo": "Groningen", "Balkbrug": "Overijssel", "Barendrecht": "Zuid-Holland", "Barneveld": "Gelderland", "Bavel": "Noord-Brabant", "Beegden": "Limburg", "Beek": "Limburg", "Beekbergen": "Gelderland", "Beek-Ubbergen": "Gelderland", "Beesd": "Gelderland", "Beetsterzwaag": "Friesland", "Beilen": "Drenthe", "Bemmel": "Gelderland", "Beneden-Leeuwen": "Gelderland", "Bennebroek": "Noord-Holland", "Bennekom": "Gelderland", "Bergeijk": "Noord-Brabant", "Bergen": "Noord-Holland", "Bergen op Zoom": "Noord-Brabant",
"Bergharen": "Gelderland", "Berghem": "Noord-Brabant", "Bergschenhoek": "Zuid-Holland", "Beringe": "Limburg", "Berkel en Rodenrijs": "Zuid-Holland", "Berkel-Enschot": "Noord-Brabant", "Berlicum": "Noord-Brabant", "Best": "Noord-Brabant", "Beugen": "Noord-Brabant", "Beuningen": "Gelderland", "Beverwijk": "Noord-Holland", "Bilthoven": "Utrecht", "Blaricum": "Noord-Holland", "Bleiswijk": "Zuid-Holland", "Blesdijke": "Friesland", "Blije": "Friesland", "Blijham": "Groningen", "Bloemendaal": "Noord-Holland", "Boekel": "Noord-Brabant", "Borne": "Overijssel", "Bosch en Duin": "Utrecht", "Boschoord": "Drenthe",
"Bovenkarspel": "Noord-Holland", "Boxmeer": "Noord-Brabant", "Boxtel": "Noord-Brabant", "Breda": "Noord-Brabant", "Breukelen": "Utrecht", "Brielle": "Zuid-Holland", "Broek in Waterland": "Noord-Holland", "Broek op Langedijk": "Noord-Holland", "Broekland": "Overijssel", "Bruchterveld": "Overijssel", "Brummen": "Gelderland", "Buchten": "Limburg", "Budel": "Noord-Brabant", "Buitenpost": "Friesland", "Bunde": "Limburg", "Bunnik": "Utrecht", "Bunschoten-Spakenburg": "Utrecht", "Bussum": "Noord-Holland", "Cadier en Keer": "Limburg", "Capelle aan den IJssel": "Zuid-Holland", "Castricum": "Noord-Holland", "Coevorden": "Drenthe",
"Cromvoirt": "Noord-Brabant", "Cuijk": "Noord-Brabant", "Culemborg": "Gelderland", "Dalerveen": "Drenthe", "Dalfsen": "Overijssel", "De Bilt": "Utrecht", "De Krim": "Overijssel", "De Kwakel": "Noord-Holland", "De Meern": "Utrecht", "De Mortel": "Noord-Brabant", "De Waal": "Noord-Holland", "de Wijk": "Drenthe", "Dedemsvaart": "Overijssel", "Delfgauw": "Zuid-Holland", "Delft": "Zuid-Holland", "Den Burg (Texel)": "Noord-Holland", "Den Dolder": "Utrecht","Den Dungen": "Noord-Brabant", "Den Haag": "Zuid-Holland", "Den Helder": "Noord-Holland", "Deurne": "Noord-Brabant", "Deventer": "Overijssel",
"Didam": "Gelderland", "Diemen": "Noord-Holland", "Diepenveen": "Overijssel", "Dieren": "Gelderland", "Diessen": "Noord-Brabant", "Dodewaard": "Gelderland", "Doesburg": "Gelderland", "Doetinchem": "Gelderland", "Dokkum": "Friesland", "Donderen": "Drenthe", "Dongen": "Noord-Brabant", "Doorn": "Utrecht", "Doorwerth": "Gelderland", "Dordrecht": "Zuid-Holland", "Drachten": "Friesland", "Dreischor": "Zeeland", "Drempt": "Gelderland", "Dreumel": "Gelderland", "Driebergen-Rijsenburg": "Utrecht", "Driehuis": "Noord-Holland", "Driel": "Gelderland", "Dronten": "Flevoland", "Druten": "Gelderland", "Duiven": "Gelderland",
"Duivendrecht": "Noord-Holland", "Echt": "Limburg", "Eckelrade": "Limburg", "Ede": "Gelderland", "Eefde": "Gelderland", "Eelde": "Drenthe", "Eemnes": "Utrecht", "Eersel": "Noord-Brabant", "Eibergen": "Gelderland", "Eindhoven": "Noord-Brabant", "Elsloo": "Limburg", "Elst": "Gelderland", "Emmeloord": "Flevoland", "Emmen": "Drenthe", "Emst": "Gelderland", "Enkhuizen": "Noord-Holland", "Enschede": "Overijssel", "Enter": "Overijssel", "Epe": "Gelderland", "Epen": "Limburg", "Erichem": "Gelderland", "Ermelo": "Gelderland", "Etten-Leur": "Noord-Brabant", "Ewijk": "Gelderland", "Exmorra": "Friesland",
"Franeker": "Friesland", "Geel (BE)": "Antwerp", "Geesteren": "Gelderland", "Geldermalsen": "Gelderland", "Geldrop": "Noord-Brabant", "Geleen": "Limburg", "Gemert": "Noord-Brabant", "Gemonde": "Noord-Brabant", "Geulle": "Limburg", "Giessenburg": "Zuid-Holland", "Gieten": "Drenthe", "Glane": "Overijssel", "Goedereede": "Zuid-Holland", "Goes": "Zeeland", "Goirle": "Noord-Brabant", "Gorinchem": "Zuid-Holland", "Gorssel": "Gelderland", "Gouda": "Zuid-Holland", "Grijpskerk": "Groningen", "Groenekan": "Utrecht", "Groenlo": "Gelderland", "Groningen": "Groningen", "Grubbenvorst": "Limburg", "Gulpen": "Limburg",
"Haarlem": "Noord-Holland", "Hallum": "Friesland", "Halsteren": "Noord-Brabant", "Hapert": "Noord-Brabant", "Haps": "Noord-Brabant", "Hardenberg": "Overijssel", "Harderwijk": "Gelderland", "Hardinxveld-Giessendam": "Zuid-Holland", "Haren": "Groningen", "Harfsen": "Gelderland", "Harmelen": "Utrecht", "Hattem": "Gelderland", "Havelte": "Drenthe", "Heel": "Limburg", "Heemskerk": "Noord-Holland", "Heemstede": "Noord-Holland", "Heenvliet": "Zuid-Holland", "Heerde": "Gelderland", "Heerenveen": "Friesland", "Heerhugowaard": "Noord-Holland", "Heerle": "Noord-Brabant", "Heerlen": "Limburg", "Heesch": "Noord-Brabant", "Heeze": "Noord-Brabant",
"Heiloo": "Noord-Holland", "Heinenoord": "Zuid-Holland", "Heino": "Overijssel", "Hellendoorn": "Overijssel", "Hellevoetsluis": "Zuid-Holland", "Helmond": "Noord-Brabant", "Helvoirt": "Noord-Brabant", "Hengelo": "Overijssel", "Hernen": "Gelderland", "Herten": "Limburg", "Heusden (gem. Heusden)": "Noord-Brabant", "Heythuysen": "Limburg", "Hillegom": "Zuid-Holland", "Hilvarenbeek": "Noord-Brabant", "Hilversum": "Noord-Holland", "Hoef en Haag": "Utrecht", "Hoenderloo": "Gelderland", "Hoensbroek": "Limburg", "Hoeven": "Noord-Brabant", "Hollandsche Rading": "Utrecht", "Honselersdijk": "Zuid-Holland", "Hoofddorp": "Noord-Holland",
"Hoogerheide": "Noord-Brabant", "Hoogeveen": "Drenthe", "Hoogezand": "Groningen", "Hoorn": "Noord-Holland", "Horssen": "Gelderland", "Horst": "Limburg", "Houten": "Utrecht", "Huis ter Heide": "Utrecht", "Huizen": "Noord-Holland", "Hulst": "Zeeland", "Hurdegaryp": "Friesland", "IJmuiden": "Noord-Holland", "IJsselmuiden": "Overijssel", "IJsselstein": "Utrecht", "IJzendijke": "Zeeland", "Joure": "Friesland", "Kaatsheuvel": "Noord-Brabant", "Kampen": "Overijssel", "Katwijk": "Zuid-Holland", "Kerkenveld": "Drenthe", "Kerkrade": "Limburg", "Klarenbeek (gem. Apeldoorn)": "Gelderland", "Klimmen": "Limburg",
"Kloetinge": "Zeeland", "Kloosterzande": "Zeeland", "Knegsel": "Noord-Brabant", "Kollum": "Friesland", "Koog aan de Zaan": "Noord-Holland", "Kootwijkerbroek": "Gelderland", "Koudekerk aan den Rijn": "Zuid-Holland", "Koudum": "Friesland", "Krommenie": "Noord-Holland", "Lage Zwaluwe": "Noord-Brabant", "Landgraaf": "Limburg", "Landsmeer": "Noord-Holland", "Langenboom": "Noord-Brabant", "Laren": "Noord-Holland", "Leek": "Groningen", "Leerdam": "Zuid-Holland", "Leersum": "Utrecht", "Leeuwarden": "Friesland", "Leiden": "Zuid-Holland", "Leiderdorp": "Zuid-Holland", "Leidschendam": "Zuid-Holland", "Lekkerkerk": "Zuid-Holland",
"Lelystad": "Flevoland", "Lent": "Gelderland", "Leusden": "Utrecht", "Lichtenvoorde": "Gelderland", "Lienden": "Gelderland", "Limmen": "Noord-Holland", "Linschoten": "Utrecht", "Lisse": "Zuid-Holland", "Lochem": "Gelderland", "Loenersloot": "Utrecht", "Loosdrecht": "Noord-Holland", "Loozen": "Overijssel", "Losser": "Overijssel", "Lunteren": "Gelderland", "Luttenberg": "Overijssel", "Maarheeze": "Noord-Brabant", "Maarn": "Utrecht", "Maarsbergen": "Utrecht", "Maarssen": "Utrecht", "Maasbommel": "Gelderland", "Maastricht": "Limburg", "Made": "Noord-Brabant", "Malden": "Gelderland", "Margraten": "Limburg",
"Maria Hoop": "Limburg", "Marle": "Overijssel", "Medemblik": "Noord-Holland", "Meerssen": "Limburg", "Meppel": "Drenthe", "Merkelbeek": "Limburg", "Meterik": "Limburg", "Mheer": "Limburg", "Middelburg": "Zeeland", "Middelharnis": "Zuid-Holland", "Middelstum": "Groningen", "Mierlo": "Noord-Brabant", "Mijdrecht": "Utrecht", "Millingen aan de Rijn": "Gelderland", "Moergestel": "Noord-Brabant", "Monnickendam": "Noord-Holland", "Mook": "Limburg", "Muntendam": "Groningen", "Naaldwijk": "Zuid-Holland", "Naarden": "Noord-Holland", "Neede": "Gelderland", "Nieuw-Annerveen": "Drenthe",
"Nieuwe Niedorp": "Noord-Holland", "Nieuwegein": "Utrecht", "Nieuwerkerk aan den IJssel": "Zuid-Holland", "Nieuwkuijk": "Noord-Brabant", "Nieuw-Vennep": "Noord-Holland", "Nieuw-Weerdinge": "Drenthe", "Nijensleek": "Drenthe", "Nijkerk": "Gelderland", "Nijmegen": "Gelderland", "Nijverdal": "Overijssel", "Nispen": "Noord-Brabant", "Nisse": "Zeeland", "Noorden": "Zuid-Holland", "Noord-Scharwoude": "Noord-Holland", "Noordwijk": "Zuid-Holland", "Noordwijkerhout": "Zuid-Holland", "Norg": "Drenthe", "Nunspeet": "Gelderland", "Nuth": "Limburg", "Oegstgeest": "Zuid-Holland",
"Oirsbeek": "Limburg", "Oisterwijk": "Noord-Brabant", "Olburgen": "Gelderland", "Oldeberkoop": "Friesland", "Oldenzaal": "Overijssel", "Olst": "Overijssel", "Ommel": "Noord-Brabant", "Ommen": "Overijssel", "Oostburg": "Zeeland", "Oosterbeek": "Gelderland", "Oosterhesselen": "Drenthe", "Oosterhout": "Noord-Brabant", "Oosterstreek": "Friesland", "Oosterwijtwerd": "Groningen", "Oostrum": "Limburg", "Ootmarsum": "Overijssel", "Ophemert": "Gelderland", "Oss": "Noord-Brabant", "Oud Gastel": "Noord-Brabant", "Oud-Beijerland": "Zuid-Holland", "Oudehaske": "Friesland", "Oudenbosch": "Noord-Brabant", "Oudeschoot": "Friesland",
"Oudewater": "Utrecht", "Oudheusden": "Noord-Brabant", "Oud-Vossemeer": "Zeeland", "Overveen": "Noord-Holland", "Panningen": "Limburg", "Papenvoort": "Drenthe", "Paterswolde": "Drenthe", "Peize": "Drenthe", "Pijnacker": "Zuid-Holland", "Poortugaal": "Zuid-Holland", "Prinsenbeek": "Noord-Brabant", "Purmerend": "Noord-Holland", "Puth": "Limburg", "Putten": "Gelderland", "Ravenstein": "Noord-Brabant", "Reek": "Noord-Brabant", "Reuver": "Limburg", "Rhoon": "Zuid-Holland", "Ridderkerk": "Zuid-Holland", "Riel": "Noord-Brabant", "Rijen": "Noord-Brabant", "Rijssen": "Overijssel", "Rijswijk": "Zuid-Holland",
"Roden": "Drenthe", "Roermond": "Limburg", "Roggel": "Limburg", "Roosendaal": "Noord-Brabant", "Rosmalen": "Noord-Brabant", "Rotterdam": "Zuid-Holland", "Ruurlo": "Gelderland", "'s-Hertogenbosch": "Noord-Brabant", "'s-Gravenhage": "Zuid-Holland", "'s-Gravenzande": "Zuid-Holland", "Santpoort-Noord": "Noord-Holland", "Santpoort-Zuid": "Noord-Holland", "Sassenheim": "Zuid-Holland", "Schagen": "Noord-Holland", "Schalkhaar": "Overijssel", "Scheemda": "Groningen", "Scherpenzeel": "Gelderland", "Schiedam": "Zuid-Holland", "Schijndel": "Noord-Brabant", "Schoonhoven": "Zuid-Holland", "Schoorl": "Noord-Holland", "Sebaldeburen": "Groningen",
"Simpelveld": "Limburg", "Sint-Michielsgestel": "Noord-Brabant", "Sint-Oedenrode": "Noord-Brabant", "Sittard": "Limburg", "Slochteren": "Groningen", "Smilde": "Drenthe", "Sneek": "Friesland", "Soest": "Utrecht", "Soesterberg": "Utrecht", "Sommelsdijk": "Zuid-Holland", "Son en Breugel": "Noord-Brabant", "Spaarndam": "Noord-Holland", "Spaubeek": "Limburg", "Spijkenisse": "Zuid-Holland", "Stadskanaal": "Groningen", "Staphorst": "Overijssel", "Steenbergen": "Noord-Brabant", "Steenwijk": "Overijssel", "Steenwijkerwold": "Overijssel", "Sterksel": "Noord-Brabant", "Steyl": "Limburg", "s-Gravenzande": "Zuid-Holland", "s-Hertogenbosch": "Noord-Brabant",
"Tegelen": "Limburg", "Ten Boer": "Groningen", "Ter Aar": "Zuid-Holland", "Ter Apel": "Groningen", "Terheijden": "Noord-Brabant", "Terneuzen": "Zeeland", "Teteringen": "Noord-Brabant", "Tholen": "Zeeland", "Tiel": "Gelderland", "Tienhoven": "Utrecht", "Tilburg": "Noord-Brabant", "Tolbert": "Groningen", "Tuitjenhorn": "Noord-Holland", "Twijzel": "Friesland", "Ubbergen": "Gelderland", "Uden": "Noord-Brabant", "Udenhout": "Noord-Brabant", "Ugchelen": "Gelderland", "Uitgeest": "Noord-Holland", "Uithoorn": "Noord-Holland", "Uithuizen": "Groningen", "Ulft": "Gelderland", "Ulvenhout": "Noord-Brabant",
"Urk": "Flevoland", "Urmond": "Limburg", "Utrecht": "Utrecht", "Valkenburg": "Limburg", "Valkenburg (Zuid-Holland)": "Zuid-Holland", "Valkenswaard": "Noord-Brabant", "Valthermond": "Drenthe", "Veenendaal": "Utrecht", "Veghel": "Noord-Brabant", "Velden": "Limburg", "Veldhoven": "Noord-Brabant", "Velp (Rheden)": "Gelderland", "Velsen": "Noord-Holland", "Venlo": "Limburg", "Venray": "Limburg", "Vianen": "Utrecht", "Vierhouten": "Gelderland", "Vierlingsbeek": "Noord-Brabant", "Vlaardingen": "Zuid-Holland", "Vleuten": "Utrecht", "Vlijmen": "Noord-Brabant", "Vlissingen": "Zeeland",
"Volendam": "Noord-Holland", "Vollenhove": "Overijssel", "Voorburg": "Zuid-Holland", "Voorschoten": "Zuid-Holland", "Voorthuizen": "Gelderland", "Vorden": "Gelderland", "Vriezenveen": "Overijssel", "Vroomshoop": "Overijssel", "Vrouwenpolder": "Zeeland", "Vught": "Noord-Brabant", "Vaassen": "Gelderland", "Velserbroek": "Noord-Holland", "Velp": "Gelderland", "Velsen-Noord": "Noord-Holland", "Veendam": "Groningen", "Velsen-Noord": "Noord-Holland", "Velserbroek": "Noord-Holland", "Velp": "Gelderland", "Vorchten": "Gelderland", "Voerendaal": "Limburg",
"Vogelenzang": "Noord-Holland", "Vreeland": "Utrecht", "Vries": "Drenthe", "Voorhout": "Zuid-Holland", "Vinkeveen": "Utrecht", "Vijfhuizen": "Noord-Holland",  "Westeremden": "Groningen", "Winssen": "Gelderland", "Wilnis": "Utrecht", "Wolfheze": "Gelderland", "Wognum": "Noord-Holland", "Wolfheze": "Gelderland", "Waardenburg": "Gelderland", "Waalre": "Noord-Brabant", "Waalwijk": "Noord-Brabant", "Waddinxveen": "Zuid-Holland", "Wagenborgen": "Groningen", "Westbeemster": "Noord-Holland", "Wageningen": "Gelderland", "Wamel": "Gelderland", "Wanneperveen": "Overijssel", "Wanssum": "Limburg", "Wapenveld": "Gelderland", "Wapse": "Drenthe", "Wemeldinge": "Zeeland",
"Wapserveen": "Drenthe", "Warga": "Friesland", "Warmenhuizen": "Noord-Holland", "Warmond": "Zuid-Holland", "Warnsveld": "Gelderland", "Waspik": "Noord-Brabant", "Wassenaar": "Zuid-Holland", "Wateringen": "Zuid-Holland", "Weert": "Limburg", "Weesp": "Noord-Holland", "Wehl": "Gelderland", "Wekerom": "Gelderland", "Welberg": "Noord-Brabant", "Wenum-Wiesel": "Gelderland", "Werkendam": "Noord-Brabant", "Wernhout": "Noord-Brabant", "Wervershoof": "Noord-Holland", "West-Terschelling": "Friesland", "Westdorpe": "Zeeland", "Westervoort": "Gelderland", "Westerwijtwerd": "Groningen", "Westkapelle": "Zeeland",
"Westwoud": "Noord-Holland", "Weurt": "Gelderland", "Wezep": "Gelderland", "Wierden": "Overijssel", "Wieringerwerf": "Noord-Holland", "Wijchen": "Gelderland", "Wijhe": "Overijssel", "Wijk bij Duurstede": "Utrecht", "Wilhelminadorp": "Zeeland", "Willemstad": "Noord-Brabant", "Winkel": "Noord-Holland", "Winschoten": "Groningen", "Winsum": "Groningen", "Winterswijk": "Gelderland", "Wittem": "Limburg", "Woerden": "Utrecht", "Wolphaartsdijk": "Zeeland", "Wolvega": "Friesland", "Wommels": "Friesland", "Woold": "Gelderland", "Workum": "Friesland", "Wormer": "Noord-Holland",
"Wormerveer": "Noord-Holland", "Woubrugge": "Zuid-Holland", "Woudenberg": "Utrecht", "Woudrichem": "Noord-Brabant", "Wouw": "Noord-Brabant", "Wouwse Plantage": "Noord-Brabant", "Yerseke": "Zeeland", "Ysselsteyn": "Limburg", "Zaandam": "Noord-Holland", "Zaandijk": "Noord-Holland", "Zaltbommel": "Gelderland", "Zandvoort": "Noord-Holland", "Zeddam": "Gelderland", "Zegge": "Noord-Brabant", "Zegveld": "Utrecht", "Zeist": "Utrecht", "Zelhem": "Gelderland", "Zetten": "Gelderland", "Zevenaar": "Gelderland", "Zevenbergen": "Noord-Brabant", "Zevenbergschen Hoek": "Noord-Brabant", "Zierikzee": "Zeeland",
"Zieuwent": "Gelderland", "Zoetermeer": "Zuid-Holland", "Zoeterwoude": "Zuid-Holland", "Zuid-Beijerland": "Zuid-Holland", "Zuidhorn": "Groningen", "Zuidland": "Zuid-Holland", "Zuidoostbeemster": "Noord-Holland", "Zuidwolde": "Drenthe", "Zundert": "Noord-Brabant", "Zutphen": "Gelderland", "Zwaag": "Noord-Holland", "Zwammerdam": "Zuid-Holland", "Zwanenburg": "Noord-Holland", "Zwartebroek": "Gelderland", "Zwartemeer": "Drenthe", "Zwartsluis": "Overijssel", "Zweins": "Friesland", "Zwiggelte": "Drenthe", "Zwijndrecht": "Zuid-Holland", "Zwolle": "Overijssel", "Zaamslag": "Zeeland", "Zeewolde": "Flevoland", "Zuidlaren": "Drenthe", "Zuidbroek": "Groningen",
}

### Data Scraping en Opslag van Geestelijke Zorgverleners van zorgkaartnederland.nl

Het scrapproces duurde ongeveer 30 minuten om alle gegevens van in totaal 263 pagina's te verzamelen. Er zijn 150 Psychologen, 36 Psychotherapeuten en 77 Psychiaters pagina's geschraapt.

We hebben de gegevens van de geestelijke zorgverleners van zorgkaartnederland.nl verzameld en opgeslagen in CSV-bestanden.  Het script gebruikt drie verschillende URL-patronen om gegevens op te halen voor psychologen, psychotherapeuten en psychiaters. Voor elk van deze categorieën wordt een functie fetch_data gebruikt, die HTTP-verzoeken uitvoert met behulp van headers om de HTML-inhoud van de webpagina's op te halen en deze te analyseren met BeautifulSoup. De relevante informatie, zoals naam, geslacht, specialisme, praktijkgegevens, locatie-informatie (stad of dorp, provincie, land, latitude, longitude), beoordelingsscore en aantal waarderingen, wordt uit de HTML geparsed en opgeslagen in een pandas DataFrame.

Na het verzamelen van de gegevens voor elke categorie, worden de resulterende DataFrames opgeslagen als afzonderlijke CSV-bestanden in de huidige werkdirectory


In [237]:
# Importeer vereiste modules
import re
import requests
import mysql.connector
from bs4 import BeautifulSoup
from urllib.parse import urljoin
import pandas as pd
import os

# URls en paginastartpunten instellen
psychologen_basis_url = 'https://www.zorgkaartnederland.nl/psycholoog/pagina{}'
psychotherapeuten_basis_url = 'https://www.zorgkaartnederland.nl/psychotherapeut/pagina{}'
psychiaters_basis_url = 'https://www.zorgkaartnederland.nl/psychiater/pagina{}'

# Directory om CSV-bestanden op te slaan
huidige_werk_dir = os.getcwd()

# Funtie voor het ophalen van de data
def haal_data(basis_url, aantal_paginas, tabel_naam):
    # Headers instellen voor de HTTP-verzoeken
    headers = {'User-Agent': 'Mozilla/5.0 (Macintosh; Intel Mac OS X 10_15_7) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/124.0.0.0 Safari/537.36'}
    data_lijst = []

    # Loop door het opgegeven aantal pagina's
    for pagina in range(1, aantal_paginas + 1):
        # URL instellen voor de huidige pagina
        url = basis_url.format(pagina)
        response = requests.get(url, headers=headers)

        # Controleer op de pagina succesvol is opgehaald
        if response.status_code == 200:
            html_content = response.text
        else:
            print(f'Kon HTML-inhoud niet ophalen van {url}')
            continue

        # Parse HTML met BeautifulSoup
        soup = BeautifulSoup(html_content, 'html.parser')
        resultaten = soup.findAll('div', {'class': 'filter-result'})

        # Loop door de resultaten op de pagina
        for resultaat in resultaten:
            naam = resultaat.find('a', {'class': 'filter-result__name'}).text.strip()
            praktijk_info_element = resultaat.find('div', {'class': 'filter-result__places location'})

            # Standaard Values instellen
            latitude = 'Onbekend'
            longitude = 'Onbekend'

            # Als praktijk_info_element bestaat
            if praktijk_info_element:
                praktijk_info = praktijk_info_element.text.strip()
                data_locatie = praktijk_info_element.get('data-location')
                if data_locatie:
                    latitude, longitude = data_locatie.split(',')

            score = resultaat.find('div', {'class': 'filter-result__score'}).text.strip()
            filter_result_body_right = resultaat.find('div', {'class': 'filter-result__body__right'})
            aantal_waarderingen = int(re.search(r'\d+', filter_result_body_right.find('p').contents[0].strip()).group())

            # Standaard Values instellen
            praktijk_naam = 'Onbekend'
            stad_dorp = 'Onbekend'
            provincie = 'Onbekend'

            # Als praktijk_info bestaat
            if praktijk_info:
                praktijk_deel = praktijk_info.split(',')
                praktijk_naam = praktijk_deel[0].strip()
                stad_dorp = praktijk_deel[-1].strip() if len(praktijk_deel) > 1 else 'Onbekend'
                provincie = stad_dorp_provincie_land_mapping.get(stad_dorp, 'Onbekend')
                land = 'Nederland'

                # Exclusief Antwerpen
                if provincie == "Antwerp":
                    continue

            # Profiel URL instellen en de profielpagina ophalen
            profiel_url = urljoin(url, resultaat.find('a', {'class': 'filter-result__name'})['href'])
            profiel_response = requests.get(profiel_url, headers=headers)
            if profiel_response.status_code == 200:
                profiel_html_content = profiel_response.text
            else:
                print(f'Kon profielpagina niet ophalen van {profiel_url}')
                continue

            # Parse HTML met BeautifulSoup
            profiel_soup = BeautifulSoup(profiel_html_content, 'html.parser')
            rijen = profiel_soup.findAll('div', {'class': 'row'})

            geslacht = 'Onbekend'
            specialisme = 'Onbekend'

            # Loop door de rijen van de profielpagina
            for rij in rijen:
                label_div = rij.find('div', {'class': 'col-4 col-sm-3 col-md-4 col-lg-3 font-base-bold'})
                if label_div:
                    label = label_div.text.strip()
                    value_div = rij.find('div', {'class': 'col-8 col-sm-9 col-md-8 col-lg-9'})
                    if value_div:
                        value = value_div.text.strip()
                        if label == 'Geslacht':
                            geslacht = value
                        elif label == 'Specialisme':
                            specialisme = value

            # Converteer score naar een float
            try:
                score = float(score.replace(',', '.'))
            except ValueError:
                score = 0
 
            # Voeg de gegevens toe aan de data lijst
            data_lijst.append({
                'Naam': naam,
                'Geslacht': geslacht,
                'Specialisme': specialisme,
                'Praktijk': praktijk_naam,
                'Stad of Dorp': stad_dorp,
                'Provincie': provincie,
                'Land': land,
                'Score': score,
                'Aantal waarderingen': aantal_waarderingen,
                'Latitude': latitude,
                'Longitude': longitude
            })

    print(f"Data van Zorgkaartnederland {tabel_naam} 1 tot en met {aantal_paginas} succesvol opgehaald")
    return pd.DataFrame(data_lijst)

# Scrape data voor elke categorie
scraped_psychologen_data = haal_data(psychologen_basis_url, 150, 'psychologen')
scraped_psychotherapeuten_data = haal_data(psychotherapeuten_basis_url, 36, 'psychotherapeuten')
scraped_psychiaters_data = haal_data(psychiaters_basis_url, 77, 'psychiaters')

# Data opslaan in CSV-bestanden
scraped_psychologen_data.to_csv(os.path.join(huidige_werk_dir, 'scraped_psychologen.csv'), index=False)
scraped_psychotherapeuten_data.to_csv(os.path.join(huidige_werk_dir, 'scraped_psychotherapeuten.csv'), index=False)
scraped_psychiaters_data.to_csv(os.path.join(huidige_werk_dir, 'scraped_psychiaters.csv'), index=False)

print("Data zijn succesvol opgeslagen in CSV-bestanden")

Data van Zorgkaartnederland psychologen 1 tot en met 150 succesvol opgehaald
Data van Zorgkaartnederland psychotherapeuten 1 tot en met 36 succesvol opgehaald
Data van Zorgkaartnederland psychiaters 1 tot en met 77 succesvol opgehaald
Data zijn succesvol opgeslagen in CSV-bestanden


### Integratie en Samenvoeging van Handmatige Gegevens met Gescrapede DataFrames

Met onze eerste code werden de gegevens verzameld en vervolgens direct ingevoegd in de MySQL database. Tijdens het bouwen van ons Power BI-dashboard merkten we dat sommige gegevens niet aanwezig waren op zorgkaartnederland.nl, zoals bepaalde latitude en longitude coördinaten die problemen veroorzaakten bij het maken van de map visualisatie. We zagen ook dat er gegevens over geslacht en specialisme ontbraken. Met behulp van google en google maps hebben we alle ontbrekende longitude en latitude coördinaten verzameld naast 2 specialisten, aangezien de adressen van deze 2 niet beschikbaar waren. Met behulp van google en linkedin zijn we erin geslaagd om bijna alle ontbrekende gegevens voor het geslacht van de specialist te verzamelen, maar we zijn er niet in geslaagd om alle ontbrekende gegevens voor specialisme te verzamelen. Er was zoveel van de specialisme gegevens niet aanwezig op zorgnederland.nl, als we meer tijd hadden gehad voor deze opdracht hadden we dat graag gedaan maar dat was helaas niet mogelijk.

De ontbrekende gegevens zijn handmatig ingevult in google sheets en opgeslagen als CSV-bestanden. De CSV-bestanden woordt uit de huidige werkmap gelezen en integreert in bestaande dataframes. Het script maakt gebruik van twee dictionaries, `scraped_data_frames` en `handmatig_data_frames`, om respectievelijk gescrapede gegevens en handmatig ingevoerde gegevens op te slaan. Nadat de gegevens zijn ingelezen en de keys van de dictionaries zijn gesorteerd, worden de dataframes samengevoegd op basis van de kolom 'Naam'. Vervolgens worden de samengevoegde dataframes gecategoriseerd per type zorgverlener (psychologen, psychotherapeuten, psychiaters) en opgeslagen als aparte dataframes (`samengevoegd_psychologen_data`, `samengevoegd_psychotherapeuten_data`, `samengevoegd_psychiaters_data`).

In [238]:
# Stel de huidige werkdirectory in
huidige_werk_dir = os.getcwd()

# Krijg een lijst van alle CSV-bestanden in de huidige werkdirectory
csv_bestanden = [f for f in os.listdir(huidige_werk_dir) if f.endswith('.csv')]

# Dictionaries om dataframes van CSV-bestanden op te slaan
scraped_data_frames = {
    'scraped_psychologen.csv': scraped_psychologen_data,
    'scraped_psychotherapeuten.csv': scraped_psychotherapeuten_data,
    'scraped_psychiaters.csv': scraped_psychiaters_data
}
handmatig_data_frames = {}


# Lees CSV-bestanden in de respectieve dictionaries
for csv_bestand in csv_bestanden:
    if 'handmatig' in csv_bestand:
        df = pd.read_csv(os.path.join(huidige_werk_dir, csv_bestand))
        handmatig_data_frames[csv_bestand] = df

# Sorteer keys van de dictionaries
sorted_scraped_keys = sorted(scraped_data_frames.keys())
sorted_handmatig_keys = sorted(handmatig_data_frames.keys())

# Dictionary om samengevoeges dataframes op te slaan
samengevoegd_data_frames = {}

# Kolommen te update
kolommen_te_update = ['Geslacht', 'Specialisme', 'Latitude', 'Longitude']

# Voeg dataframes samen op basis van de 'naam' kolom
for scraped_key, handmatig_key in zip(sorted_scraped_keys, sorted_handmatig_keys):
    if scraped_key.replace('scraped_', '') == handmatig_key.replace('handmatig_', ''):
        scraped_df = scraped_data_frames[scraped_key]
        handmatig_df = handmatig_data_frames[handmatig_key]

        # Voeg scraped_df met handmatig_df op basis van 'Naam'
        samengevoegd_df = pd.merge(scraped_df, handmatig_df[['Naam'] + kolommen_te_update], on='Naam', how='left', suffixes=('', '_handmatig'))

        # Update scraped_df op basis van handmatig_df values
        for kolom in kolommen_te_update:
            samengevoegd_df[kolom] = samengevoegd_df[kolom + '_handmatig'].combine_first(samengevoegd_df[kolom])
            samengevoegd_df.drop(columns=[kolom + '_handmatig'], inplace=True)

        samengevoegd_data_frames[scraped_key] = samengevoegd_df

# Initialiseer lege dataframes voor elke categorie
samengevoegd_psychologen_data = pd.DataFrame()
samengevoegd_psychotherapeuten_data = pd.DataFrame()
samengevoegd_psychiaters_data = pd.DataFrame()

# # Categoriseer de samengevoegde data in de respectieve dataframes
for key, df in samengevoegd_data_frames.items():
    if 'psychologen' in key:
        samengevoegd_psychologen_data = pd.concat([samengevoegd_psychologen_data, df], ignore_index=True)
    elif 'psychotherapeuten' in key:
        samengevoegd_psychotherapeuten_data = pd.concat([samengevoegd_psychotherapeuten_data, df], ignore_index=True)
    elif 'psychiaters' in key:
        samengevoegd_psychiaters_data = pd.concat([samengevoegd_psychiaters_data, df], ignore_index=True)


### Database Aanmaken voor Geestelijke Zorgverleners van zorgkaartnederland.nl

Wij hebben een MySQL-database genaamd "Geestelijke zorgverleners zorgkaartnederland" opgezet en drie tabellen gedefinieerd: Psychologen, Psychotherapeuten en Psychiaters. Elke tabel bevat specifieke kolommen om gegevens van geestelijke zorgverleners van zorgkaartnederland.nl op te slaan, zoals naam, geslacht, specialisme, praktijkgegevens, locatie-informatie (stad of dorp, provincie, land, latitude, longitude), beoordelingsscore en aantal waarderingen. We hebben een functie gebruikt om elke tabel te creëren door de relevante SQL-query's uit te voeren met behulp van een MySQL-connector in Python.

In [239]:
# Query's voor het aanmaken van de database Geestelijke zorgverleners zorgkaartnederland
drop_db = 'DROP DATABASE IF EXISTS `Geestelijke zorgverleners zorgkaartnederland`'
creer_db = 'CREATE DATABASE IF NOT EXISTS `Geestelijke zorgverleners zorgkaartnederland`'
geb_db = 'USE `Geestelijke zorgverleners zorgkaartnederland`'

# Maak verbinding met het MySQL-server
Geestelijke_zorgverleners_zorgkaartnederland = mysql.connector.connect(
    host = 'localhost',
    user = 'bit_academy',
    password = 'bit_academy'
)

# Maak databasecursor
mycursor = Geestelijke_zorgverleners_zorgkaartnederland.cursor()

# Drop dababase als deze bestaat
mycursor.execute(drop_db)
# Maak databse als deze niet bestaat
mycursor.execute(creer_db)
# Selecteer de database
mycursor.execute(geb_db)

# Query's voor het aanmaken van de psychologen tabel
drop_tabel_psychologoen = 'DROP TABLE IF EXISTS Psychologen'
creer_tabel_psychgolgen = '''CREATE TABLE IF NOT EXISTS Psychologen (
                    Naam TEXT,
                    Geslacht TEXT,
                    Specialisme TEXT,
                    Praktijk TEXT,
                    `Stad of Dorp` TEXT,
                    Provincie TEXT,
                    Land TEXT,
                    Score FLOAT,
                    `Aantal waarderingen` INT,
                    Latitude FLOAT,
                    Longitude FLOAT
                    )'''

# Query's voor het aanmaken van de psychotherapeuten tabel
drop_tabel_psychotherapeuten = 'DROP TABLE IF EXISTS Psychotherapeuten'
creer_tabel_psychotherapeuten = '''CREATE TABLE IF NOT EXISTS Psychotherapeuten (
                                    Naam TEXT,
                                    Geslacht TEXT,
                                    Specialisme TEXT,
                                    Praktijk TEXT,
                                    `Stad of Dorp` TEXT,
                                    Provincie TEXT,
                                    Land TEXT,
                                    Score FLOAT,
                                    `Aantal waarderingen` INT,
                                    Latitude FLOAT,
                                    Longitude FLOAT
                                    )'''

# Query's voor het aanmaken van de psychiaters tabel
drop_tabel_psychiaters = 'DROP TABLE IF EXISTS Psychiaters'
creer_tabel_psychiaters = '''CREATE TABLE IF NOT EXISTS Psychiaters (
                                    Naam TEXT,
                                    Geslacht TEXT,
                                    Specialisme TEXT,
                                    Praktijk TEXT,
                                    `Stad of Dorp` TEXT,
                                    Provincie TEXT,
                                    Land TEXT,
                                    Score FLOAT,
                                    `Aantal waarderingen` INT,
                                    Latitude FLOAT,
                                    Longitude FLOAT
                                    )'''

# Funtie voor het aanmaken van een tabel
def creer_table(mycursor, drop_query, creer_query):
    mycursor.execute(drop_query)
    mycursor.execute(creer_query)

# Tabellen aanmaken
creer_table(mycursor, drop_tabel_psychologoen, creer_tabel_psychgolgen)
creer_table(mycursor, drop_tabel_psychotherapeuten, creer_tabel_psychotherapeuten)
creer_table(mycursor, drop_tabel_psychiaters, creer_tabel_psychiaters)

### Data-Invoer naar MySQL Database en Opslaan van Gecategoriseerde Gegevens als CSV-Bestanden

De samengevoegde dataframes worden vervolgens ingevoegd in de MySQL geestelijke zorgverleners zorgkaartnederland database, we gebruikten SQL queries om de samengevoegde data in drie aparte tabellen in te voeren: Psychologen, Psychotherapeuten en Psychiaters.

Na het invoegen van de gegevens worden de gecategoriseerde en compleet ingevoerde psychologen, psychotherapeuten en psychiaters datasets opgeslagen als aparte CSV-bestanden in de huidige werkdirectory. 

In [240]:
# SQL-invoegqueries
voeg_psychologen_data_in = 'INSERT INTO Psychologen (Naam, Geslacht, Specialisme, Praktijk, `Stad of Dorp`, Provincie, Land, Score, `Aantal waarderingen`, Latitude, Longitude) VALUES (%s, %s, %s, %s, %s, %s, %s, %s, %s, %s, %s)'
voeg_psychotherapeuten_data_in = 'INSERT INTO Psychotherapeuten (Naam, Geslacht, Specialisme, Praktijk, `Stad of Dorp`, Provincie, Land, Score, `Aantal waarderingen`, Latitude, Longitude) VALUES (%s, %s, %s, %s, %s, %s, %s, %s, %s, %s, %s)' 
voeg_psychiaters_data_in = 'INSERT INTO Psychiaters (Naam, Geslacht, Specialisme, Praktijk, `Stad of Dorp`, Provincie, Land, Score, `Aantal waarderingen`, Latitude, Longitude) VALUES (%s, %s, %s, %s, %s, %s, %s, %s, %s, %s, %s)'

# Doorloop de samengevoegd dataframes en voeg data in de respectieve tabbellen in
for key, samengevoegd_df in samengevoegd_data_frames.items():
    if 'psychologen' in key:
        for i, row in samengevoegd_df.iterrows():
            mycursor.execute(voeg_psychologen_data_in, tuple(row))
    elif 'psychotherapeuten' in key:
        for i, row in samengevoegd_df.iterrows():
            mycursor.execute(voeg_psychotherapeuten_data_in,tuple(row))
    elif 'psychiaters' in key:
        for i, row in samengevoegd_df.iterrows():
            mycursor.execute(voeg_psychiaters_data_in, tuple(row))

# Commit de transacties naar de database
Geestelijke_zorgverleners_zorgkaartnederland.commit()

# Sla de gecategoriseerde data op in CSV-bestanden
samengevoegd_psychologen_data.to_csv(os.path.join(huidige_werk_dir, 'compleet_psychologen.csv'), index=False)
samengevoegd_psychotherapeuten_data.to_csv(os.path.join(huidige_werk_dir, 'compleet_psychotherapeuten.csv'), index=False)
samengevoegd_psychiaters_data.to_csv(os.path.join(huidige_werk_dir, 'compleet_psychiaters.csv'), index=False)

print("Alle data succesvol toegevoegd aan de `Geestelijke zorgverleners zorgkaartnederland` database en opgeslagen in CSV-bestanden")

# Sluit de cursor en database verbinding
mycursor.close()
Geestelijke_zorgverleners_zorgkaartnederland.close()

Alle data succesvol toegevoegd aan de `Geestelijke zorgverleners zorgkaartnederland` database en opgeslagen in CSV-bestanden


## Onderzoeksrapport

Toegankelijkheid van Geestelijke Gezondheidszorg in Verschillende Regio's in Nederland.

Uit de data van zorgkaartnederland.nl blijkt dat er in totaal 5.233 specialisten in de geestelijke gezondheidszorg zijn in Nederland. Dit zijn 2.992 psychologen, 712 psychotherapeuten en 1.529 psychiaters verspreid over alle 12 provincies en 537 steden en dorpen. Noord-Holland heeft de meeste specialisten, met een totaal van 1.145 (585 psychologen, 203 psychotherapeuten en 357 psychiaters). Zeeland heeft de minste, met in totaal 45 specialisten (37 psychologen, 2 psychotherapeuten en 6 psychiaters). Amsterdam is de stad met de meeste specialisten, in totaal 520 (261 psychologen, 87 psychotherapeuten en 172 psychiaters). Veel steden hebben echter maar één specialist in geestelijke gezondheidszorg.

Uit de data blijkt dat er meer vrouwelijke specialisten zijn, in totaal 3.679, vergeleken met 1.539 mannelijke specialisten. Er zijn meer vrouwelijke psychologen en psychotherapeuten, maar meer mannelijke psychiaters in Nederland.

Volgens een onderzoek van trimbos.nl, uitgevoerd van 2007-2009 tot 2019-2022, heeft bijna de helft (48%) van de Nederlandse volwassenen ooit in hun leven een psychische aandoening gehad, en één op de vier (26%) had een psychische aandoening in de 12 maanden voor het interview. Uit een onderzoek dat cbs.nl in 2022 uitbracht, blijkt dat 18% van de jongeren in de leeftijd van 12-24 jaar in 2021 last had van psychische problemen, een stijging van respectievelijk 7,1% en 7,3% ten opzichte van 2020 en 2019.

Aangezien ongeveer 44% van de huidige 17,7 miljoen Nederlanders kampt met psychische problemen, komt dit neer op ongeveer 7,7 miljoen personen. Met 5.233 specialisten in de geestelijke gezondheidszorg zou elke specialist ongeveer 1.470 patiënten moeten behandelen. Niet alle specialisten in de geestelijke gezondheidszorg staan echter vermeld op zorgkaartnederland.nl, dus het werkelijke aantal patiënten per specialist ligt waarschijnlijk lager. Zelfs als het aantal specialisten zou worden verdubbeld tot 10.466, zou elke specialist nog steeds ongeveer 735 patiënten moeten behandelen.


Concluderend kan worden gesteld dat de toegankelijkheid en beschikbaarheid van specialisten in de geestelijke gezondheidszorg aanzienlijk is in alle 12 provincies en bijna heel Nederland bereikt. Omdat de zorgverzekering veel geestelijke gezondheidszorg dekt, verbetert dit de beschikbaarheid van en toegang tot behandeling. Echter, als bijna de helft van de Nederlandse bevolking lijdt aan psychische problemen (een aantal dat jaarlijks lijkt toe te nemen), zijn er duidelijk niet genoeg specialisten om alle patiënten effectief te behandelen. Wachtlijsten voor de eerste intake-afspraak kunnen variëren van 3 tot 8 weken of langer, afhankelijk van de ernst van de problemen en of de specialist gedekt wordt door de zorgverzekering, wat duidt op een tekort aan beschikbare specialisten.

[Bronnen: Trimbos Institute, CBS]
* https://cijfers.trimbos.nl/nemesis/kerncijfers-psychische-aandoeningen/voorkomen-psychische-aandoeningen/#12maands
* https://www.cbs.nl/en-gb/news/2022/22/mental-health-has-worsened-among-young-people
