# De Dualiteit van de Corona-tijd

#### Naomi Meijer, Tijn van Rooij, Sil Wijne en Hanneke Sjoers, Groep S2


### Inleiding

De COVID-19-pandemie, beter bekend als het coronavirus, heeft wereldwijd enorme gevolgen gehad voor de samenleving. In dit dataverhaal zullen we de verschillende perspectieven onderzoeken over de vraag of COVID-19 goed of slecht is geweest voor Nederland. Het is belangrijk op te merken dat deze perspectieven kunnen variëren en zelfs tegenstrijdig kunnen zijn.   

Aan de ene kant zijn er positieve aspecten. Tijdens de lockdownmaatregelen was er een opvallende verbetering van het milieu en de luchtkwaliteit in Nederland. Met minder auto's op de weg nam de uitstoot van schadelijke stoffen aanzienlijk af, wat een gunstig effect had op de volksgezondheid. Daarnaast heeft de pandemie geleid tot reductie van andere ziektes zoals kinkhoest.   

Aan de andere kant kunnen we de negatieve gevolgen van COVID-19 niet negeren. De toeristische industrie in Nederland heeft een zware klap gekregen door de reisbeperkingen en veiligheidsmaatregelen. Hotels, restaurants en andere toeristische bedrijven hebben aanzienlijke verliezen geleden, met een daling van het aantal banen in de sector. Daarnaast heeft de pandemie ook geleid tot een toename van mentale gezondheidsproblemen. De onzekerheid, angst en sociaal isolement die gepaard gaan met de pandemie hebben bijgedragen aan een grotere vraag naar geestelijke gezondheidszorg en ondersteuning.  

Het meest tragische negatieve effect van COVID-19 is de oversterfte die het heeft veroorzaakt. Het virus heeft een aanzienlijk aantal levens geëist in Nederland, met een immense impact op families en gemeenschappen. De gezondheidszorg en medische professionals hebben onvermoeibaar gewerkt om levens te redden en te verzorgen, maar de druk op het systeem was enorm.  

In dit dataverhaal zullen we dieper ingaan op elk van deze perspectieven, waarbij we gebruik maken van relevante datasets en visuele representaties om een uitgebalanceerd beeld te schetsen van de impact van COVID-19 op Nederland. Als we verder gaan met ons onderzoek, is het essentieel om te onthouden dat COVID-19 een voortdurende situatie is die zich blijft ontwikkelen. Onze bevindingen zijn gebaseerd op beschikbare gegevens en kennis tot op heden. 

### Milieuvervuiling

De staafgrafiek, die het totaal aantal passagiers op Schiphol weergeeft, laat een sterke daling zien in 2020 als gevolg van reisbeperkingen en veiligheidsmaatregelen. Veel internationale en binnenlandse vluchten werden geannuleerd of sterk verminderd, waardoor het aantal passagiers dat door de luchthaven reisde aanzienlijk afnam (Luchtkwaliteit door eerste lockdown beter dan verwacht | RIVM, z.d.). De tweede grafiek, de lijn grafiek die de koolstofemissie van CO2 weergeeft, laat zien dat de uitstoot in 2020 aanzienlijk is verminderd in vergelijking met 2019. Namelijk van 256,8 miljard kilo gram tot 140,9 miljard kilo gram, wat dus een afname is van 9,63%.  Dit is grotendeels toe te schrijven aan de verminderde activiteit in de luchtvaartsector als gevolg van de pandemie. Met minder vliegtuigen in de lucht en minder passagiersvluchten leidde dit tot een daling van de CO2-uitstoot, waardoor de luchtvaartindustrie een positieve bijdrage heeft geleverd aan de milieubelasting.  

De twee grafieken vertonen een duidelijk verband tussen de afname van reisactiviteit en de positieve milieu-impact. De verminderde passagiersaantallen op Schiphol en de daling van CO2-uitstoot tonen aan dat er positieve resultaten zijn behaald op milieugebied als gevolg van de afname in reisactiviteiten. Bovendien kunnen we opmerken dat beide dalingen samenvallen met de blauwe stippellijn in de grafiek, wat het jaar van de corona-uitbraak aangeeft. Hieruit kunnen we concluderen dat deze twee dalingen ook in verband staan met de uitbraak van COVID-19. 

In [7]:
import plotly.graph_objs as go
import plotly.express as px
import pandas as pd
from plotly.subplots import make_subplots

df = pd.read_csv('Amsterdam_Airport_Schiphol__passagiersvervoer__partnerluchthaven_20062023_192658.csv')
db = pd.read_csv('Emissies_broeikasgassen__IPCC___klimaatsector__kwartaal_21062023_104240.csv')

fig = make_subplots(specs=[[{"secondary_y": True}]])

fig.add_trace(
    go.Scatter(x = db['Perioden'], y = db['miljard kg CO2-equivalent'], name="Emissie CO2", mode="lines"), secondary_y = True
)


fig.add_trace(
    go.Bar(x = df['Perioden'], y= df['Totaal passagiers'], name="Passagiers vanaf Schiphol"),
    secondary_y=False
)

fig.data[0].line.color = 'rgb(242,183,1)'
fig.update_traces(marker_color='rgb(17,165,121)')


fig.update_yaxes(title_text="Aantal passagiers vanaf Schiphol", secondary_y=False)
fig.update_yaxes(title_text="Emissie CO2 in miljard kg", secondary_y=True)

fig.add_vline(x=2020, line_width=3, line_dash="dash", line_color="rgb(57,105,172)")

fig.update_layout(
    height = 600,
    title = 'Vluchten vanuit Schiphol naar omliggende Europese steden')

fig.show()

### Toerisme

Doordat er wereldwijd zoveel reisbeperkingen werden opgelegd als gevolg van COVID-19, zoals het sluiten van grenzen om de verspreiding van het virus tegen te gaan, werd de toeristische sector helaas zwaar getroffen. Hotels, restaurants en reisorganisaties kregen te maken met annuleringen en een gebrek aan boekingen. De onzekerheid en angst rondom het virus zorgden ervoor dat mensen terughoudend waren om te reizen. Vliegtuigen bleven aan de grond, cruiseschepen bleven in de havens en toeristische attracties sloten hun deuren. Zelfs binnenlandse reizen werden sterk ontmoedigd vanwege de risico's die gepaard gingen met de verspreiding van het virus. 

Uit de staafgrafiek die de bijdrage van het toerisme aan de Nederlandse economie weergeeft, blijkt dat er in 2020 een opvallende daling heeft plaatsgevonden ten opzichte van het voorgaande jaar, 2019. In de bijbehorende lijngrafiek, die het aantal coronagevallen in Nederland toont, is duidelijk te zien dat pas in 2020 de gevallen begonnen op te lopen, wat samenvalt met de periode van de daling in de staafgrafiek. Het is duidelijk zichtbaar dat naarmate het aantal coronagevallen toenam, de bijdrage van het toerisme in Nederland sterk afnam. Dit impliceert dan een omgekeerde correlatie tussen de twee grafieken. 

Het negatieve effect van COVID-19 op het toerisme in Nederland is dus duidelijk zichtbaar in de grafieken. De daling in de bijdrage van het toerisme aan de economie geeft aan dat de sector zwaar is getroffen. Dit heeft geleid tot economische uitdagingen, verlies van banen en een algemene neergang van de toeristische activiteiten in het land. 

In [8]:
ds = pd.read_csv('Toerisme__kernindicatoren__nationale_rekeningen_20062023_204846.csv')

fig = make_subplots(specs=[[{"secondary_y": True}]])



fig.add_trace(
    go.Bar(x = ds['Perioden'], y= ds['Toerisme: toegevoegde waarde basisprijs'], name="Toerisme: toegevoegde waarde basisprijs"),
    secondary_y=False
)

fig.add_trace(
    go.Scatter(x = ['2019','2020*','2021*'], y = [0, 785875, 2329020], name="Corona gevallen in Nederland"),
    secondary_y=True
)

fig.data[1].line.color = 'rgb(17,165,121)'
fig.update_traces(marker_color='rgb(57,105,172)')

fig.update_yaxes(title_text="Euro", secondary_y=False)
fig.update_yaxes(title_text="Aantal covid-gevallen", secondary_y=True)


fig.update_layout( 
    height = 600,  
    title = 'De bijdrage van het toerisme aan de Nederlandse economie'
)

fig.add_vline(x='2020*', line_width=3, line_dash='dash', line_color='rgb(242,183,1)')

fig.show()

### Faillissementen

Als gevolg van deze neergang in de toeristische activiteiten hebben veel sectoren in Nederland hieronder geleden (Centraal Bureau voor de Statistiek, 2022). Dit wordt geïllustreerd door de taartgrafieken die de faillissementen in Nederland weergeven voor de jaren 2019, 2020, 2021 en 2022. In de grafieken is bijvoorbeeld te zien dat het aantal faillissementen in de horecasector steeg van 254 in 2019 naar 286 in 2020, wat neerkomt op een toename van 12,5%. 

Naast de zware impact op de horecasector, hebben ook andere sectoren in Nederland te maken gehad met de gevolgen van de COVID-19-pandemie. Terwijl de horecasector werd getroffen door een aanzienlijke stijging van faillissementen in het jaar 2020, was het een ander verhaal te zien in de handelssector. De handel vertoonde juist minder faillissementen, namelijk een daling van 20,5% van 2019 naar 2020, wat in verband kan worden gebracht met de impact van COVID-19 op het consumentengedrag. Met de invoering van lockdowns en reisbeperkingen waren mensen genoodzaakt om meer online aankopen te doen. Dit resulteerde in een bloeiende e-commerce en een groei van de online detailhandel. Bedrijven die zich in deze sector bevonden en zich goed aanpasten aan de veranderende omstandigheden, wisten te profiteren van deze verschuiving in het koopgedrag van consumenten. 

Een andere sector die opmerkelijk werd beïnvloed, was de gezondheidszorg. In tegenstelling tot de horeca, zag de gezondheidszorgsector over het algemeen minder faillissementen gedurende de pandemie, een daling van 43,6% van 2019 naar 2020. Dit kan worden toegeschreven aan het feit dat er juist meer werk was in deze sector. De vraag naar medische zorg en gezondheidsdiensten nam toe als gevolg van de pandemie. Ziekenhuizen, klinieken en andere zorginstellingen moesten zich aanpassen om aan de groeiende behoeften van patiënten te voldoen. Hoewel er uitdagingen waren, zorgde de toegenomen vraag naar gezondheidszorg ervoor dat veel bedrijven in deze sector hun activiteiten konden voortzetten en faillissementen konden vermijden. 

Wat betreft de sector van cultuur, sport en recreatie, toonde de taartgrafiek een toename van het aantal faillissementen. Namelijk een toename van 64 naar 77 faillissementen wat een toename is van 20,3%. Dit kan worden verklaard door de verminderde aanwezigheid van toeristen als gevolg van de COVID-19-pandemie. Aangezien deze sector sterk afhankelijk is van toeristen en reizigers, werden musea, theaters, pretparken en andere recreatiebedrijven zwaar getroffen door de beperkte mobiliteit en het afnemende aantal toeristen. De daling in de vraag naar cultuur- en recreatiediensten leidde tot financiële problemen en uiteindelijk tot faillissementen binnen deze sector. 

In het licht van deze taartgrafieken wordt duidelijk dat de impact van COVID-19 op de verschillende sectoren in Nederland aanzienlijk verschilde. Terwijl sommige sectoren zoals de handel en de gezondheidszorg relatief beter presteerden, leden andere sectoren zoals de horeca en de cultuur-, sport- en recreatiesector zwaar onder de gevolgen van de pandemie.  

In [12]:
faillissement2019 = pd.read_csv('Faillissementen__bedrijven_en_instellingen2019.csv')
faillissement2020 = pd.read_csv('Faillissementen_bedrijven_en_instellingen2020.csv')
faillissement2021 = pd.read_csv('Faillissementen_bedrijven_en_instellingen2021.csv')
faillissement2022 = pd.read_csv('Faillissementen_bedrijven_en_instellingen2022.csv')

df19 = faillissement2019.drop(['Natuurlijk persoon met eenmanszaak','Bedrijven en instellingen'], axis=1)
db19 = df19.rename(columns={'Bedrijven, instellingen en eenmanszaken': '2019'}) 
df20 = faillissement2020.drop(['Type gefailleerde','Natuurlijk persoon met eenmanszaak','Bedrijven en instellingen'], axis=1)
db20 = df20.rename(columns={'Bedrijven, instellingen en eenmanszaken': '2020'}) 
df21 = faillissement2021.drop(['Type gefailleerde','Natuurlijk persoon met eenmanszaak','Bedrijven en instellingen'], axis=1)
db21 = df21.rename(columns={'Bedrijven, instellingen en eenmanszaken': '2021'}) 
df22 = faillissement2022.drop(['Type gefailleerde','Natuurlijk persoon met eenmanszaak','Bedrijven en instellingen'], axis=1)
db22 = df22.rename(columns={'Bedrijven, instellingen en eenmanszaken': '2022'}) 

colors = ['rgb(57,105,172)', 'rgb(17,165,121)', 'rgb(242,183,1)', 'rgb(204,80,62)', 'rgb(57,105,172)', 'rgb(17,165,121)', 'rgb(242,183,1)', 'rgb(204,80,62)','rgb(57,105,172)', 'rgb(17,165,121)', 'rgb(242,183,1)', 'rgb(204,80,62)','rgb(57,105,172)', 'rgb(17,165,121)', 'rgb(242,183,1)', 'rgb(204,80,62)','rgb(57,105,172)', 'rgb(17,165,121)', 'rgb(242,183,1)', 'rgb(204,80,62)']

sets = [db19, db20, db21, db22]
faillissement = pd.concat(sets, axis = 1)

for column in faillissement.columns[1:]:
    fig = go.Figure(data=[go.Pie(labels = faillissement['Type gefailleerde'], values = faillissement[column])])
    fig.update_layout(title_text=f'Faillissementen in {column}',
                     height = 600)
    fig.update_traces(marker=dict(colors=colors, line=dict(color='#000000', width=2)))
    fig.show()


### Criminaliteit

Een positief punt van COVID-19 heeft betrekking op de criminaliteit in Nederland. De radargrafiek laat de criminaliteitscijfers zien van verschillende steden in de periode van 2018 tot 2022. Uit de grafiek blijkt dat er tussen 2019 en 2021 een algemene daling van de criminaliteit plaatsvond in alle steden die in de grafiek zijn opgenomen. Deze daling kan worden toegeschreven aan de impact van de coronapandemie (Kruisbergen et al., 2021). 

De beperkende maatregelen en de verminderde sociale activiteiten tijdens de lockdowns hebben de kans op criminaliteit verkleind. Doordat mensen meer thuisbleven, er minder evenementen waren en uitgaansgelegenheden vaak gesloten waren, waren er minder gelegenheden voor criminele activiteiten. Dit resulteerde in lagere criminaliteitscijfers gedurende die periode. 

Echter, in het jaar 2022 werd er in de grafiek ook een stijging van de criminaliteit waargenomen. Deze stijging kan worden verklaard door de versoepeling van de maatregelen en het herstel van sociale activiteiten naarmate de samenleving weer normaliseerde. Met meer mensen op straat en een toename van sociale interacties nam ook de kans op criminaliteit weer toe. 

In [5]:
df = pd.read_csv('merged_database.csv')

cities = ['Amsterdam', 'Rotterdam', 'Groningen', 'Nijmegen', 'Tilburg', 'Breda', 'Eindhoven']

colors = ['rgb(57,105,172)', 'rgb(17,165,121)', 'rgb(242,183,1)', 'rgb(204,80,62)', 'rgb(57,105,172)', 'rgb(17,165,121)', 'rgb(242,183,1)', 'rgb(204,80,62)']


filtered_df = df[df['Gemeente'].isin(cities)].copy()

filtered_df.iloc[:, 1:] = filtered_df.iloc[:, 1:].apply(lambda x: x.str.replace(' ', '').astype(int))

years = filtered_df.columns[1:]
fig = go.Figure()

for i, city in enumerate(cities):
    fig.add_trace(go.Scatterpolar(
        r=filtered_df[filtered_df['Gemeente'] == city].values.flatten()[1:].astype(int),
        theta=years,
        fill='toself',
        name=city,
        line=dict(color=colors[i], width=2),
    ))

max_value = filtered_df.values[:, 1:].astype(int).max()
axis_range = [0, int(max_value) + (0.1 * int(max_value))]

fig.update_layout(
    height = 600,
    title = 'Totaal aantal misdrijven in grote steden',
    polar=dict(
        radialaxis=dict(
            visible=True,
            range=axis_range,  
            tickformat=',d'
        )
    ),
    showlegend=True
)

fig.show()

### Mentale gezondheid

De pandemie heeft naast het effect op de economie, geleid tot een significante toename van mentale gezondheidsproblemen, wat geen verrassing is gezien de uitdagende omstandigheden waar mensen wereldwijd mee te maken kregen. 

De effecten van COVID-19 op de geestelijke gezondheid kunnen worden verklaard door verschillende factoren. Allereerst bracht de pandemie grote onzekerheid met zich mee, zoals angst voor besmetting, zorgen over de gezondheid van dierbaren, financiële instabiliteit en de impact op de werkgelegenheid. Deze constante stress en angst kunnen leiden tot gevoelens van angst, depressie en andere psychische klachten (Hupkens, 2021). 

Daarnaast hebben de maatregelen die werden genomen om de verspreiding van het virus te beperken, zoals lockdowns en sociale isolatie, bijgedragen aan het gevoel van eenzaamheid en sociaal isolement. Het gebrek aan persoonlijk contact, het wegvallen van routines en activiteiten, en het beperkte sociale netwerk hadden een negatieve invloed op de geestelijke gezondheid van mensen.  

Deze impact op de geestelijke gezondheid wordt ondersteund door de gegevens in de grafiek die de toename van psychische klachten per kwartaal in het jaar 2020 laten zien. De staafgrafiek toont duidelijk hoe de mentale klachten zijn toegenomen gedurende dat jaar, wat een directe correlatie aantoont tussen COVID-19 en de geestelijke gezondheidseffecten. 

In [6]:
file = pd.read_csv('Mentalegezondheid.csv')
fig = go.Figure()

years = file['Jaartal'].unique()
quarters = ['1e kwartaal', '2e kwartaal', '3e kwartaal', '4e kwartaal']
colors = ['rgb(57,105,172)', 'rgb(17,165,121)', 'rgb(242,183,1)', 'rgb(204,80,62)']
file['Psychische klachten (%)'] = file['Psychische klachten (%)'].str.replace(",", ".").astype(float)

for i, quarter in enumerate(quarters):
    fig.add_trace(go.Bar(
        x=years,
        y=file[file['Kwartaal'] == quarter]['Psychische klachten (%)'],
        name=quarter,
        marker=dict(color=colors[i])
    ))

fig.update_layout(
    title='Mentale gezondheid in Nederland van 2017 tot 2021',
    xaxis_title='Jaartal',
    yaxis_title='Psychische klachten (%)'
)

fig.update_xaxes(type='category')

fig.update_layout(height=400)

fig.show()


### Andere ziektes

Hoewel COVID-19 negatieve gevolgen heeft gehad op verschillende aspecten van onze gezondheid, is er ook een opmerkelijk positief effect waar te nemen. Dit wordt geïllustreerd door de grafiek die de gevallen van 8 andere contactziektes weergeeft van de jaren 2017 tot 2021. 

Het is opvallend dat in het jaar 2020 alle 8 ziektes een daling laten zien. Dit positieve effect kan worden toegeschreven aan de impact van COVID-19. De maatregelen die zijn genomen om de verspreiding van het virus te beperken, hebben niet alleen de verspreiding van COVID-19 verminderd, maar ook de verspreiding van andere contactziektes. Door lockdowns, sociale afstand nemen, het dragen van maskers en verbeterde hygiënepraktijken zijn de kansen op besmetting met andere ziektes aanzienlijk afgenomen. 

De daling van gevallen van de 8 contactziektes in 2020 kan dus worden beschouwd als een positief effect van COVID-19. Hoewel het virus aanzienlijke uitdagingen met zich heeft meegebracht, heeft het ook geleid tot een verminderde verspreiding van andere infectieziekten. Het benadrukt het belang van preventieve maatregelen en hygiënische praktijken om de algehele volksgezondheid te bevorderen. 

In [6]:
db = pd.read_csv('Gezondheid__leefstijl__zorggebruik_en__aanbod__doodsoorzaken__vanaf_1900_27062023_135537.csv')

colors = ['rgb(57,105,172)', 'rgb(17,165,121)', 'rgb(242,183,1)', 'rgb(204,80,62)', 'rgb(57,105,172)', 'rgb(17,165,121)', 'rgb(242,183,1)', 'rgb(204,80,62)']

fig = px.bar(db, x = 'Onderwerp', y = 'Hoeveelheid', barmode = 'group', animation_frame = 'Jaar', color = 'Onderwerp', color_discrete_sequence=colors)


fig.update_layout(
    height=600,
    showlegend = False)

fig.update_traces(width=1)
fig.update_yaxes(range=[0, 600])

fig.show()

### Reflectie

Tijdens de feedbacksessies ontvingen we op twee verschillende momenten input. De eerste keer was na de presentatie van onze 'draft', waarbij ons werd verteld dat onze argumenten goed werden onderbouwd en dat we geschikte perspectieven hadden gekozen. Er werd echter opgemerkt dat we te weinig deden met onze taartgrafiek. We moesten ofwel meer informatie uit de grafiek halen of een andere grafiek gebruiken, omdat we momenteel veel niet-relevante gegevens toonden die juist voor verwarring konden zorgen. We hadden ook kort besproken welke andere soorten grafieken we konden gebruiken, omdat we op dat moment alleen eenvoudige grafieken hadden. We hadden ook gesproken over mogelijke positieve aspecten van corona, aangezien we op dat moment meer negatieve punten hadden dan positieve. 

Bij de tweede feedbackronde ontvingen we opmerkingen van zowel een andere groep als onze docent-assistent (TA). Hieruit kwamen vergelijkbare punten naar voren, zoals het veranderen van de titel en het verbeteren van de flow van ons verhaal. Daarnaast werden er specifiekere suggesties gedaan. 

Er werd bijvoorbeeld aangeraden om meer informatie te geven met behulp van bronnen om onze argumenten te ondersteunen. Ook werd opgemerkt dat sommige grafieken niet noodzakelijkerwijs een correlatie met corona lieten zien, dus werd voorgesteld om visuele elementen van corona toe te voegen om de verbanden duidelijker te maken. Bovendien hadden we nog geen interactieve grafiek, wat we later hebben toegevoegd. We kregen ook te horen dat we wellicht meer gebruik konden maken van de data in de visualisaties, en dit hebben we vervolgens ook verder verwerkt. Daarnaast hebben we enkele grafieken samengevoegd, omdat deze vaak dezelfde informatie bevatten. 

### Taakverdeling

Tijdens ons project heeft elk teamlid een specifieke rol en verantwoordelijkheden op zich genomen om ervoor te zorgen dat we gezamenlijk een succesvol resultaat konden behalen. 

Naomi speelde een essentiële rol bij het samenstellen van de argumentatie en het analyseren van de grafieken. Hanneke heeft zich voornamelijk gericht op het maken van grafiek 1, 2 en 5. Sil heeft zich beziggehouden met de reflectie en het maken van grafiek 3. Tijn heeft verantwoordelijkheid genomen voor het maken van grafiek 4 en 6 ook heeft Tijn heeft meerdere datasets gepreprocessed wat inhield dat hij meerdere databases combineert.  

Naast de specifieke taken van elk teamlid, hebben we als groep gezamenlijk ideeën bedacht en gedacht aan de verschillende positieve en negatieve aspecten van het onderwerp, evenals de benodigde databases. We hebben nauw samengewerkt en gedeeld inzicht om ervoor te zorgen dat we een uitgebreid en evenwichtig perspectief konden bieden in onze presentatie. 

### Dataset en preprocessing

We hebben voor ons dataverhaal in totaal 11 datasets gebruikt. Deze datasets hebben wij allemaal gevonden op de website van het Centraal Bureau voor de Statistiek (CBS). Alle datasets kunnen gedownload worden via de website https://opendata.cbs.nl/statline/#/CBS/nl/. Bij een aantal datasets hebben we geen preprocessing gebruikt omdat deze datasets niet ingewikkeld waren.  

De datasets die we gebruik hebben zijn: 

- Amsterdam_Airport_Schiphol__passagiersvervoer__partnerluchthaven_20062023_192658.csv
Deze data hebben wij gepreprocessed door de dataset te sorteren op basis van het jaar en verwijderden we 1 kolom met de bestemmingen. Hierdoor hadden we een duidelijk overzicht van het totaal aantal passagiers per jaar. 
De variabelen van deze dataset zijn: Perioden, Totaal passagiers, Passagiers aangekomen en Passagiers vertrokken.

- Emissies_broeikasgassen__IPCC___klimaatsector__kwartaal_21062023_104240.csv 
Deze data hebben wij ook gepreprocessed. In de originele dataset waren er heel veel kolommen. Er waren van vier jaren van elk kwartaal de cijfers van de emissies. We hebben de kolommen van de kwartalen verwijderd, zodat alleen de variabelen van de hele jaren over waren. Hierna hebben we de kolommen en rijen nog omgedraaid zodat de jaren in een kolom stonden. 
De variabelen van deze dataset zijn: Perioden en miljard kg CO2-equivalent.

- Faillissementen__bedrijven_en_instellingen2019.csv
- Faillissementen__bedrijven_en_instellingen2020.csv
- Faillissementen__bedrijven_en_instellingen2021.csv
- Faillissementen__bedrijven_en_instellingen2022.csv
Deze datasets hebben we bij elkaar gevoegd tot 1 dataset, zodat we de ontwikkeling van faillissementen per jaar goed konden zien. De variabelen in deze dataset zijn bij alle vier hetzelfde: Type gefailleerde, Bedrijven, instellingen en eenmanszaken, Natuurlijk persoon met eenamnszaak en Bedrijven en instellingen. 

- Gezondheid__leefstijl__zorggebruik_en__aanbod__doodsoorzaken__vanaf_1900_27062023_135537.csv
Bij deze dataset hebben we alleen een aantal ziektes uit de dataset verwijderd en daarna hebben we de kolommen en rijen omgedraaid zodat de dataset overzichtelijker werd. 
De variabelen in deze dataset zijn: Jaren, Onderwerp en Hoeveelheid. 

- Huiselijk_geweld_aard_geweld_aanvullende_informatie_regio.csv
Deze dataset hebben we niet gepreprocessed.
De variabelen in deze dataset zijn: 'Kenmerken adviezen, meldingen, diensten', 'Totaal', 'Kindermishandeling', 'Geweld tegen ouders', '(Ex-)partnergeweld' en 'Ouderenmishandeling (ouder dan 65 jaar)'.

- Mentalegezondheid.csv
Bij deze dataset hebben we alleen de komma's veranderd door punten, zodat de variabelen dan gezien worden als floats in plaats van strings. 
De variabelen in deze dataset zijn: Jaartal, Kwartaal en Psychische klachten (%).

- merged_database.csv 
Om een gedetailleerder beeld te krijgen van deze dataset, moesten we de gegevens van criminaliteit per gemeente per jaar samenvoegen tot één overzichtelijk bestand. Om deze samenvoeging te realiseren, hebben we specifieke code geschreven. We hebben eerst de datasets van de criminaliteitsgegevens vanuit de afzonderlijke bestanden ingelezen. Vervolgens hebben we de datasets op basis van de gemeente en het jaar samengevoegd.
De variabelen in deze dataset zijn: Gemeente, Totaal misdrijven_2018, Totaal misdrijven_2019, Totaal misdrijven_2020, Totaal misdrijven_2021, Totaal misdrijven_2022.

- Toerisme__kernindicatoren__nationale_rekeningen_20062023_204846.csv
Deze dataset hebben we niet gepreprocessed. 
De variabelen in deze dataset zijn: Perioden, Toerisme: toegevoegde waarde basisprijs, Toerisme: bestedingen NL economie totaal, Recreatieve bestedingen van huishoudens.

### Referenties

Centraal Bureau voor de Statistiek. (2022, 3 mei). 213 faillissementen in eerste kwartaal 2022 bij bedrijven met coronasteun. Centraal Bureau voor de Statistiek. https://www.cbs.nl/nl-nl/nieuws/2022/18/213-faillissementen-in-eerste-kwartaal-2022-bij-bedrijven-met-coronasteun 

Hupkens, C. R. E. C. (2021). Ervaren impact corona op mentale gezondheid en leefstijl. Centraal Bureau voor de Statistiek. https://www.cbs.nl/nl-nl/longread/statistische-trends/2021/ervaren-impact-corona-op-mentale-gezondheid-en-leefstijl?onepage=true 

Kruisbergen, E. W., Haas, M., Van Es, L., & Snijders, J. (2021). De pandemie als criminologisch experiment. Justitiële verkenningen, 47(3), 9–34. https://doi.org/10.5553/jv/016758502021047003002 

Luchtkwaliteit door eerste lockdown beter dan verwacht | RIVM. (z.d.). https://www.rivm.nl/nieuws/luchtkwaliteit-door-eerste-lockdown-beter-dan-verwacht

