# Student Depression Analysis

In [1]:
import pandas as pd
import plotly.express as px

# Carica il dataset (assicurati di aver già caricato il file CSV nella variabile df)
df = pd.read_csv('data/student_depression_dataset.csv')

# Grafico 1: Distribuzione della variabile Depression
fig1 = px.histogram(df, x='Depression', 
                    title='Distribuzione della Depression (0 = No, 1 = Yes)',
                    labels={'Depression': 'Depression (0 = No, 1 = Yes)'})
fig1.show()


# Grafico 5: Pie chart per la distribuzione di Genere
fig5 = px.pie(df, names='Gender', 
              title='Distribuzione del Genere',
              labels={'Gender': 'Genere'})
fig5.show()


# Grafico 2: Depression per Genere
fig2 = px.histogram(df, x="Gender", color="Depression", barmode="group", 
                    title="Depression per Genere",
                    labels={'Gender': 'Genere'})
fig2.show()

# TODO percentuale maschi vs femmine depresse (grafico impilato)


# TODO istogramma sovrapposto che metta in relazione Work/Study Hours per Depression

# Grafico 4: Box plot: Work/Study Hours per Depression
fig4 = px.box(df, x='Depression', y='Work/Study Hours', 
              title="Distribuzione delle Work/Study Hours per Depression",
              labels={'Depression': 'Depression (0 = No, 1 = Yes)', 'Work/Study Hours': 'Work/Study Hours'})
fig4.show()


# TODO no scatter, box plot per ogni accdemic pressure
df_filtered = df[df["Academic Pressure"] == 1]

fig = px.scatter(
    df_filtered,
    x="Academic Pressure",
    y="CGPA",
    color="Depression",
    title="Scatter Plot: Academic Pressure 1 vs CGPA (colorato per Depression)",
    hover_data=['Gender', 'Age'],
    labels={'Academic Pressure': 'Academic Pressure', 'CGPA': 'CGPA'}
)

fig.update_xaxes(range=[1, 1])

fig.show()



#Numero di studenti per città

city_counts = df['City'].value_counts()

fig1 = px.bar(x=city_counts.index, y=city_counts.values,
              labels={'x': 'City', 'y': 'Number of Students'},
              title='Number of Students per City')
fig1.update_layout(xaxis_tickangle=-45)
fig1.show()


#Media della pressione accademica e lavorativa per città
city_stress = df.groupby("City")[["Academic Pressure", "Work Pressure"]].mean().reset_index()

fig2 = px.bar(city_stress, x="City", y=["Academic Pressure", "Work Pressure"],
              barmode='group',
              title='Average Academic and Work Pressure per City')
fig2.update_layout(xaxis_tickangle=-45)
fig2.show()


#Percentuale di studenti con depressione per città
city_depression_rate = df.groupby("City")["Depression"].mean().reset_index()
city_depression_rate["Depression"] = city_depression_rate["Depression"] * 100  # percentuale

fig3 = px.bar(city_depression_rate.sort_values("Depression", ascending=False),
              x="City", y="Depression",
              title="Depression Rate per City (%)",
              labels={"Depression": "Depression Rate (%)"})
fig3.update_layout(xaxis_tickangle=-45)
fig3.show()


# TODO lasciare 1 e 3 graifco, spiegare valori anonimi, fare grafico con dimensione citta (e classificazione) VS percentuale depressione
# TODO accademic pressure per tipo di citta
# TODO istogramma con depressione e tipo di citta
