
# Effect van social media: Wat is de impact van eindeloos scrollen op je mentale gezondheid en productiviteit?

**Groep H3**  
Jesper Schouten (13449400), Guido Rienks (15804437), Julius Rademakers (14698951), Aylin Kemper (14263246)



## Inleiding

Sociale media spelen een steeds grotere rol in het dagelijks leven van mensen over de hele wereld. Platforms zoals Instagram, TikTok en YouTube worden gebruikt voor entertainment, contact met anderen, nieuws en zelfs voor werk. Hoewel sociale media veel voordelen bieden, wijzen meerdere onderzoeken op negatieve effecten op cognitieve prestaties en welzijn (Twenge et al., 2018; Montag & Walla, 2016).

In deze data story onderzoeken we dit onderwerp vanuit twee verschillende perspectieven: **productiviteit** en **mentale gezondheid**.

Het eerste perspectief richt zich op de vraag of er een verband is tussen het gebruik van sociale media en iemands productiviteit. We bekijken zowel hoe productief mensen daadwerkelijk zijn op basis van meetbare prestaties, en hoe productief zij zichzelf vinden. Mogelijke argumenten hierbij zijn dat intensief social media gebruik kan leiden tot afleiding of tijdverlies, maar ook dat dit verband mogelijk niet zo sterk of afhankelijk van het type gebruik is.
Het tweede perspectief onderzoekt hoe sociale media samenhangen met mentale gezondheid, in het bijzonder bij jongeren. We richten ons op variabelen zoals schermtijd, stressniveau, slaapkwaliteit en mentale veerkracht. Vanuit dit perspectief kijken we naar argumenten zoals: meer schermtijd gaat samen met slechtere slaap en hogere stress, en jongere gebruikers (13-24 jaar) lijken hier gevoeliger voor te zijn dan volwassenen (Odgers & Jensen, 2020).
In de rest van deze data story analyseren we deze perspectieven aan de hand van visualisaties en data uit twee datasets. Hiermee willen we meer inzicht geven in hoe sociale media het dagelijks functioneren van mensen beïnvloedt in wat ze doen en hoe ze zich voelen




## Gebruikte datasets

1. [Social Media vs Productivity](https://www.kaggle.com/datasets/mahdimashayekhi/social-media-vs-productivity)  
2. [Mental Health and Digital Behavior (2020–2024)](https://www.kaggle.com/datasets/atharvasoundankar/mental-health-and-digital-behavior-20202024)



## Belangrijke variabelen

### Social Media vs Productivity

| Variabele | Uitleg | Reden van keuze |
|------------|-------------------|---------------------------------------|
| actual_productivity_score | Meet de daadwerkelijke productiviteit van een persoon, gebaseerd op hun output. | Geeft objectieve maat van prestatie gekoppeld aan social media gebruik. |
| daily_social_media_hours | Het aantal uren dat een persoon per dag op sociale media zit. | Helpt om correlatie te leggen met productiviteit. |
| number_of_notifications | Het aantal meldingen dat een persoon op een dag ontvangt op hun apparaat. | Kan afleidingen meten die mogelijk invloed hebben op concentratie en productiviteit. |
| weekly_offline_hours | Het aantal uren per week dat iemand geen gebruik maakt van digitale apparaten. | Geeft inzicht in de digitale balans en mogelijke hersteltijd voor focus. |
| screen_time_before_sleep | De tijd die iemand besteedt aan een scherm vlak voordat diegene gaat slapen. | Heeft invloed op slaapkwaliteit en daarmee indirect op dagelijkse productiviteit. |
| sleep_hours | Het gemiddeld aantal uren slaap per nacht. | Slaap is essentieel voor cognitief functioneren en productiviteit. |



### Mental Health and Digital Behavior

| Variabele | Uitleg | Relevantie |
|------------|-------------------|---------------------------------------|
| social_media_time_min | Tijd besteed op social media platforms | Als norm voor vergelijking |
| mood_score | Zelf aangegeven stemming (1-10) | Correlatie tussen stemming en social media gebruik |
| anxiety_level | Zelf aangegeven angstniveau (1-10) | Correlatie tussen angst en social media gebruik |
| digital_well_being_score | Gebaseerd op focus, slaap en angst | Meet algemene digitale gezondheid |



## Preprocessing

**Stappen:**  
- Verwijderen van rijen met lege waarden
- Conversie tijdseenheden naar hetzelfde formaat
- Normalisatie (0-1 schaal)
- Herclassificatie: gemiddelden berekend voor overzichtelijkheid
- Filtering per leeftijdsgroep: jongeren (13–24) versus volwassenen (25+)



## Visualisaties en Argumenten

### Perspectief 1: Socialmediagebruik verlaagt productiviteit

**Argument 1:** Meer tijd op social media per dag leidt gemiddeld tot een lagere productiviteitsscore, maar sommige gebruikers blijven toch productief.  

**Argument 2:** Hoog aantal meldingen per week hangt samen met minder offline tijd.  

**Argument 3:** Mensen die vlak voor het slapengaan schermen gebruiken, slapen gemiddeld minder uren per nacht.  


In [1]:

# TODO: Laad dataset en genereer scatter plot voor Argument 1
# Plaats hier je visualisatiecode


In [2]:

# TODO: Staafgrafiek genereren voor Argument 2
# Plaats hier je visualisatiecode


In [3]:

# TODO: Hexbin-plot voor Argument 3
# Plaats hier je visualisatiecode



### Perspectief 2: Socialmediagebruik ondermijnt mentale gezondheid

**Argument 1:** Social media gebruik verlaagt moodscore.  
**Argument 2:** Social media gebruik verhoogt anxiety level.  
**Argument 3:** Hoger social media gebruik correleert met lagere digital well being score.  


In [4]:

import pandas as pd
import plotly.graph_objects as go
import plotly.express as px
import plotly.io as pio
pio.renderers.default = 'notebook_connected'

# Data inladen
df = pd.read_csv('mental_health_digital_behavior_data.csv')
df = df[['social_media_time_min', 'mood_score', 'anxiety_level']].dropna()

# Traces voor Mood score
fig_mood = px.scatter(
    df,
    x='social_media_time_min',
    y='mood_score',
    trendline='ols',
    color_discrete_sequence=['skyblue'],
    labels={
        'social_media_time_min': 'Social media tijd (minuten)',
        'mood_score': 'Mood score'
    }
)

mood_scatter = fig_mood.data[0]
mood_trend = fig_mood.data[1]
mood_trend.line.color = 'deepskyblue'
mood_trend.name = 'Trendline mood score'
mood_trend.hovertemplate = 'Mood score: %{y}<br>Social media tijd: %{x}<extra></extra>'

# Traces voor anxiety level 
fig_anxiety = px.scatter(
    df,
    x='social_media_time_min',
    y='anxiety_level',
    trendline='ols',
    color_discrete_sequence=['salmon'],
    labels={
        'social_media_time_min': 'Social media tijd (minuten)',
        'anxiety_level': 'Anxiety level'
    }
)

anxiety_scatter = fig_anxiety.data[0]
anxiety_trend = fig_anxiety.data[1]
anxiety_trend.line.color = 'firebrick'
anxiety_trend.name = 'Trendline anxiety level'
anxiety_trend.hovertemplate = 'Anxiety level: %{y}<br>Social media tijd: %{x}<extra></extra>'

# Combineer alles in één figuur 
fig = go.Figure()

fig.add_trace(mood_scatter)
fig.add_trace(mood_trend)
fig.add_trace(anxiety_scatter)
fig.add_trace(anxiety_trend)

# Anxiety-traces onzichtbaar bij begin
fig.data[2].visible = False
fig.data[3].visible = False

# Layout en dropdown 
fig.update_layout(
    updatemenus=[
        dict(
            buttons=[
                dict(label='Mood score',
                     method='update',
                     args=[{'visible': [True, True, False, False]},
                           {'title': '<b>Invloed van social media tijd op mood score</b>',
                            'yaxis': {'title': 'Mood score'}}]),
                dict(label='Anxiety level',
                     method='update',
                     args=[{'visible': [False, False, True, True]},
                           {'title': '<b>Invloed van social media tijd op anxiety level</b>',
                            'yaxis': {'title': 'Anxiety level'}}]),
            ],
            direction='down',
            x=1.05,
            y=1,
            xanchor='left',
            yanchor='top',
            showactive=True,
            bgcolor='#e6f2ff',
            font=dict(size=13),
            bordercolor='lightgray',
            borderwidth=1,
        )
    ],
    plot_bgcolor='#e6f2ff',
    paper_bgcolor='#e6f2ff',
    font=dict(family='Arial', size=14),
    title=dict(
        text='<b>Invloed van social media tijd op mood score</b>',
        x=0.5,
        font=dict(size=22)
    ),
    xaxis_title='Social media tijd (minuten)',
    yaxis_title='Mood score',
    margin=dict(t=80)
)

fig.show()

FileNotFoundError: [Errno 2] No such file or directory: 'mental_health_digital_behavior_data.csv'

In [45]:


import pandas as pd
import plotly.graph_objects as go
import numpy as np
import plotly.io as pio
pio.renderers.default = 'notebook_connected'

# Data inladen
df = pd.read_csv("mental_health_digital_behavior_data.csv")

# Bins aanmaken voor social media tijd
bins = [0, 60, 90, 120, df['social_media_time_min'].max()]
labels = ['< 60 min', '60–90 min', '90–120 min', '> 120 min']
df['social_bin'] = pd.cut(df['social_media_time_min'], bins=bins, labels=labels, include_lowest=True)

# Gemiddelde slaapuren en standaardfout per groep berekenen
grouped = df.groupby('social_bin', observed=True)['sleep_hours'].agg(['mean', 'count', 'std']).reset_index()
grouped['sem'] = grouped['std'] / np.sqrt(grouped['count'])

# Plotly figuur maken
fig = go.Figure()

fig.add_trace(go.Scatter(
    x=grouped['social_bin'],
    y=grouped['mean'],
    mode='lines+markers',
    name='Gemiddelde slaapuren',
    line=dict(color='#3AAFA9', width=3),
    marker=dict(color='#2B7A78', size=12, line=dict(color='black', width=1)),
    error_y=dict(
        type='data',
        array=grouped['sem'],
        visible=True,
        color='#95E1D3',
        thickness=3,
        width=10,
    ),
    hovertemplate=(
        '<b style="font-size:16px;">%{x}</b><br>'+
        '<span style="font-weight:bold; font-size:14px;">Gemiddelde slaapuren:</span> %{y:.2f}<br>'+
        '<span style="font-weight:bold; font-size:14px;">Foutmarge (SEM):</span> %{error_y.array:.2f}<extra></extra>'
    )
))

# Layout met zachte blauwe achtergrond en nette marges
fig.update_layout(
    title=dict(
        text='<b>Gemiddelde slaapduur per social media tijdsgroep</b>',
        x=0.5,
        font=dict(size=22)
    ),
    xaxis=dict(
        title='Social media tijdscategorie',
        tickmode='array',
        tickvals=labels,
        ticktext=labels,
        showgrid=True,
        gridcolor='lightgray'
    ),
    yaxis=dict(
        title='Gemiddelde slaapuren',
        showgrid=True,
        gridcolor='lightgray'
    ),
    plot_bgcolor='#e6f2ff',
    paper_bgcolor='#e6f2ff',
    hoverlabel=dict(
        bgcolor='white',
        font_size=16,
        font_family='Arial',
        font_color='black'
    ),
    margin=dict(l=70, r=40, t=80, b=70)
)

fig.show()



In [46]:
import pandas as pd
import plotly.graph_objects as go
import numpy as np
import plotly.io as pio
pio.renderers.default = 'notebook_connected'

# Data inladen
df = pd.read_csv("mental_health_digital_behavior_data.csv")

# Categorien social media tijd 
bins = [30, 60, 90, 120, 150, df['social_media_time_min'].max()]
labels = ['30-60 Min', '61-90 Min', '91-120 Min', '121-150 Min', '>150 Min']
df['Social Media Tijd'] = pd.cut(df['social_media_time_min'], bins=bins, labels=labels, include_lowest=True)

# Filter 
df_filtered = df.dropna(subset=['Social Media Tijd', 'digital_wellbeing_score'])

# Kleuren per categorie
kleuren = {
    '30-60 Min': 'rgba(135, 206, 250, 0.6)',
    '61-90 Min': 'rgba(255, 182, 193, 0.6)',
    '91-120 Min': 'rgba(144, 238, 144, 0.6)',
    '121-150 Min': 'rgba(255, 223, 186, 0.6)',
    '>150 Min': 'rgba(221, 160, 221, 0.6)'
}

# Boxplots toevoegen
fig = go.Figure()

for cat in labels:
    cat_data = df_filtered[df_filtered['Social Media Tijd'] == cat]['digital_wellbeing_score']
    if len(cat_data) == 0:
        continue

# Hover
    fig.add_trace(go.Box(
    y=cat_data,
    name=cat,
    boxpoints='outliers',
    marker=dict(
        color=kleuren[cat].replace('0.6', '1'),
        size=6,
        opacity=0.9,
        line=dict(width=1, color='black')
    ),
    line_color=kleuren[cat].replace('0.6', '1'),
    fillcolor=kleuren[cat],
    boxmean='sd',
    hoverinfo='y'  
))


# Y-as limiet
y_min = max(0, np.floor(df_filtered['digital_wellbeing_score'].min()) - 1)
y_max = np.ceil(df_filtered['digital_wellbeing_score'].max()) + 1

# Layout
fig.update_layout(
    title=dict(
        text='<b>Digitale welzijn score per social media tijdsgroep</b>',
        x=0.5,
        font=dict(size=22)
    ),
    xaxis_title='Social media tijd (minuten)',
    yaxis_title='Digitale welzijn score',
    yaxis=dict(range=[y_min, y_max]),
    plot_bgcolor='#e6f2ff',
    paper_bgcolor='#e6f2ff',
    font=dict(family='Arial', size=14),
    margin=dict(t=80, b=70, l=70, r=40)
)

fig.show()



## Samenvatting

In deze data story onderzochten we hoe social media invloed kan hebben op productiviteit en mentale gezondheid.  
We gebruikten daarvoor de genoemde datasets van Kaggle, voerden preprocessing uit en visualiseerden trends.  
De resultaten bevestigen bestaande literatuur die wijst op risico's van intensief social media gebruik, met name bij jongeren.

### Referenties:
- Twenge, J.M., et al. (2018). *Clinical Psychological Science.*  
- Montag, C. & Walla, P. (2016). *Frontiers in Psychology.*  
- Odgers, C.L. & Jensen, M.R. (2020). *Journal of Child Psychology and Psychiatry.*  
