Vi vill se om elevernas bakgrund har något att göra med andelen elever som går klart 9:e klass med behörighet till yrkesprogram i Göteborgs Kommun.


In [128]:
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
import seaborn as sns
import plotly.express as px
import plotly.graph_objects as go

__file__ = 'df_grades_gothenburg_2013_to_2023.xlsx'
df = pd.read_excel(__file__, skiprows=6)

df_löv = df.iloc[440:441]

# Reshape the DataFrame to a long format
df_long = df_löv.melt(id_vars=["Skolenhet"], value_vars=['2013/14', '2014/15', '2015/16', '2016/17', '2017/18', '2018/19', '2019/20', '2020/21', '2021/22', '2022/23'],
                      var_name='School Year', value_name='Andel (%) som fått godkänt betyg i alla ämnen')

# Filter the DataFrame for Lövgärdesskolan 4-9 if it has multiple school data
df_long_löv = df_long[df_long['Skolenhet'].str.contains("Lövgärdesskolan 4-9")]

# Now, plot with the correct x and y
fig_1 = px.line(df_long_löv, x='School Year', y='Andel (%) som fått godkänt betyg i alla ämnen', title='Elever som gått ur 9:e klass med godkända betyg i Lövgärdesskolan 2013-2023')

fig_1.show()


I grafen ovan kan vi se hur stor andel av alla elever i 9:e klass i Lövgärdesskolan gick ut med godkända betyg mellan 2013-2023.
Som vi kan se finns det ett stort problem över de senaste tio åren då 2019 var det enda året där mer än 50% av alla nionde-klassare gick ut med godkända betyg.
Under åren 2020 och 2021 kan vi se påverkan av Covid-19 pandemin, där eleverna främst hade lektioner hemifrån pga smittorisk. 
Vi ser även att 2017 till 2019 så började en positiv trend som ökade antalet godkända elever med nästan 30%!


In [15]:
import pandas as pd
import plotly.express as px


#file path
__file_2__ = 'df_grades_per_subject_2022.xlsx'


subjects = ['Bild', 'Biologi', 'Engelska', 'Fysik', 'Geografi', 'Hem och konsumentkunskap', 'Historia', 'Idrott och hälsa', 'Kemi',
            'Matematik', 'Moderna språk, elevens val', 'Moderna språk, språkval', 'Modersmål', 'Musik', 'Religionskunskap', 'Samhällskunskap',
            'Slöjd', 'Svenska', 'Svenska som andraspråk', 'Teknik', 'Rapportbeskrivning och def.']  # sheet names
# this is to exclude the final sheet which is not a subject
xls = pd.ExcelFile(__file_2__)
sheet_names = xls.sheet_names[:-1] 

# Initialize the DataFrame to hold all subjects' data
all_subjects_2022_df = pd.DataFrame()

# Iterate over each subject, load the data, and append to the all_subjects_df DataFrame
for subject in subjects:
    df_temp = pd.read_excel(__file_2__, sheet_name=subject, skiprows=10)
    df_temp = df_temp.iloc[24:25]  # Adjust this if necessary
    df_temp['Subject'] = subject  # Add a column to identify the subject
    all_subjects_2022_df = pd.concat([all_subjects_2022_df, df_temp], ignore_index=True)

# Now, plot the data

# and 'Andel (%) med A-E' contains the percentage values
fig = px.bar(all_subjects_2022_df, x='Subject', y='Andel (%) med A-E', 
             title='Distribution av Andelen (%) elever med A-E Betygspoäng" över alla ämnen i Lövgärdesskolan 2022')

fig.update_layout(xaxis_title='Subject', 
                  yaxis_title='Andel (%) med A-E Betygspoäng',
                  bargap=0.2)  # Adjust the gap between bars as needed

fig.show()


I grafen ovan ser vi alla ämnen samt hur stor andel av studenterna som klarat av kurserna med godkända betyg. 
Vi kan se att modersmål och moderna språk/språkval har 100% godkända elever samt att biologi, fysik, kemi, och samhällskunskap har relativt låga nivåer av godkända elever.


In [35]:
import pandas as pd
import plotly.express as px
from plotly.subplots import make_subplots
import plotly.graph_objects as go
import numpy as np


#file path
__file_3__ = 'df_grades_per_subject_2019.xlsx'


subjects = ['Bild', 'Biologi', 'Engelska', 'Fysik', 'Geografi', 'Hem och konsumentkunskap', 'Historia', 'Idrott och hälsa', 'Kemi',
            'Matematik', 'Moderna språk, elevens val', 'Moderna språk, språkval', 'Modersmål', 'Musik', 'Religionskunskap', 'Samhällskunskap',
            'Slöjd', 'Svenska', 'Svenska som andraspråk', 'Teknik', 'Rapportbeskrivning och def.']  # sheet names
# this is to exclude the final sheet which is not a subject
xls = pd.ExcelFile(__file_3__)
sheet_names = xls.sheet_names[:-1] 

# Initialize the DataFrame to hold all subjects' data
all_subjects_2019_df = pd.DataFrame()


# Iterate over each subject, load the data, and append to the all_subjects_df DataFrame
for subject in subjects:
    df_temp = pd.read_excel(__file_3__, sheet_name=subject, skiprows=10)
    df_temp = df_temp.iloc[24:25]  # Adjust this if necessary
    df_temp['Subject'] = subject  # Add a column to identify the subject
    all_subjects_2019_df = pd.concat([all_subjects_2019_df, df_temp], ignore_index=True)



# Selected subjects for comparison
selected_subjects = ['Biologi', 'Fysik', 'Kemi', 'Samhällskunskap']

# Initialize subplots: 2 rows (for 2019 and 2022) and 1 column for each selected subject
fig = make_subplots(rows=2, cols=len(selected_subjects), subplot_titles=[f"{subject} {year}" for year in (2019, 2022) for subject in selected_subjects])

# Function to add traces for a given year
def add_traces_for_year(dataframe, year, row):
    for i, subject in enumerate(selected_subjects, start=1):
        # Filter data for the current subject
        subject_data = dataframe[dataframe['Subject'] == subject]
        fig.add_trace(go.Bar(x=subject_data['Subject'], y=subject_data['Andel (%) med A-E'], name=f"{subject} {year}"), row=row, col=i)

# Add traces for 2019 and 2022
add_traces_for_year(all_subjects_2019_df, 2019, 1)
add_traces_for_year(all_subjects_2022_df, 2022, 2)

# Update y-axis range and title for each subplot
for i in range(1, len(selected_subjects) + 1):
    fig.update_yaxes(title_text="Andel (%) godkända elever", range=[0, 100], title_standoff=2, row=1, col=i)
    fig.update_yaxes(title_text="Andel (%) med godkända elever", range=[0, 100], title_standoff=2, row=2, col=i)


# Update layout
fig.update_layout(height=800, width=1200, title_text="Subject Grades Comparison: 2019 vs 2022", showlegend=False,bargap=0.5)
fig.show()

