## A.

In [2]:
import pandas as pd
import matplotlib.pyplot as plt
import numpy as np
import plotly.express as px

betyg_path = "..\project\data\\betyg_o_prov_riksnivå.xlsx"
df_betyg = pd.read_excel(betyg_path, skiprows = 7, sheet_name = "Tabell 1B")
new_columns = [
    'Läsår',  
    'Meritvärde totalt (16 ämnen)',  
    'Meritvärde flickor (16 ämnen)',  
    'Meritvärde pojkar (16 ämnen)',  
    'Meritvärde totalt (17 ämnen)',  
    'Meritvärde flickor (17 ämnen)',  
    'Meritvärde pojkar (17 ämnen)',  
    'Totalt (saknar godkänt)',  
    'Flickor (saknar godkänt)',  
    'Pojkar (saknar godkänt)'
]
    
# Rename columns 
df_betyg.columns = new_columns



# Choosing only the five first five rows
fig = px.line(df_betyg.head(5), x="Läsår", y=["Totalt (saknar godkänt)", "Flickor (saknar godkänt)", "Pojkar (saknar godkänt)" ], labels={"value": "Andel som saknar godkänt (%)", "variable": "Kategori"}, title="Andel elever som saknar godkänt betyg per läsår", markers=True)  

fig.update_layout(xaxis_title="Läsår", yaxis_title="Andel (%)", title=dict(font=dict(color='Black')),)

fig.show()

## B.

In [3]:
# Choosing only the five first five rows
fig = px.line(df_betyg.head(5), x="Läsår", y=[ "Meritvärde totalt (16 ämnen)", "Meritvärde flickor (16 ämnen)", "Meritvärde pojkar (16 ämnen)" ], labels={"value": "Meritvärde för 16 ämnen", "variable": "Kategori"}, title="Meritvärde för 16 ämnen", markers=True)  

fig.update_layout( xaxis_title="Läsår", yaxis_title="Meritvärde", xaxis=dict(tickmode="linear") )

fig.show()

## C.

In [21]:
from plotly.subplots import make_subplots
import plotly.graph_objs as go



df_avg_grades = df_betyg[df_betyg["Läsår"].isin([ "Födda i Sverige", "Födda utomlands, inv. före 2014", "Födda utomlands, inv. 2014 el. senare" ])]

df_missing_grades = df_betyg[df_betyg["Läsår"].isin([ "Födda i Sverige", "Födda utomlands, inv. före 2014", "Födda utomlands, inv. 2014 el. senare" ])]

# Create subplot 
fig = make_subplots(rows=2, cols=2, subplot_titles=("Genomsnittligt meritvärde", "Andel som saknar godkänt (%)", "Flickor meritvärde", "Pojkar meritvärde"))


# First plot
fig.add_trace( go.Bar( x=df_avg_grades["Läsår"].str.replace(' ', '<br>'), y=df_avg_grades["Meritvärde totalt (16 ämnen)"], name="Meritvärde (16 ämnen)", marker=dict(color="#75B2BF") ), row=1, col=1 )

# Second plot
fig.add_trace( go.Bar( x=df_avg_grades["Läsår"].str.replace(' ', '<br>'), y=df_avg_grades["Totalt (saknar godkänt)"], name="Totalt (saknar godkänt)", marker=dict(color="#9E1111") ), row=1, col=2 )

# Third plot
fig.add_trace( go.Bar( x=df_avg_grades["Läsår"].str.replace(' ', '<br>'), y=df_avg_grades["Meritvärde flickor (16 ämnen)"], name="Meritvärde flickor (16 ämnen)", marker=dict(color="#624BAA") ), row=2, col=1 )

# Fourth plot
fig.add_trace( go.Bar( x=df_avg_grades["Läsår"].str.replace(' ', '<br>'), y=df_avg_grades["Meritvärde pojkar (16 ämnen)"], name="Meritvärde pojkar (16 ämnen)", marker=dict(color="#4B76AA") ), row=2, col=2 )


# Adding spines to the subplots
fig.update_layout(xaxis=dict(linecolor='black', linewidth=2, showline=True),
                  yaxis=dict(linecolor='black', linewidth=2, showline=True))
fig.update_layout(xaxis2=dict(linecolor='black', linewidth=2, showline=True),
                  yaxis2=dict(linecolor='black', linewidth=2, showline=True))
fig.update_layout(xaxis3=dict(linecolor='black', linewidth=2, showline=True),
                  yaxis3=dict(linecolor='black', linewidth=2, showline=True))
fig.update_layout(xaxis4=dict(linecolor='black', linewidth=2, showline=True),
                  yaxis4=dict(linecolor='black', linewidth=2, showline=True))

fig.update_layout(
    # Changes size to fit 4 subplots
    height = 1000,
    width = 1000,
    title = {
        "x" : 0.4,
        "y" : 0.97,
        "text" : "Invandring invärkan på betyg",
        "xanchor" : "center",
        "yanchor" : "top"
    },
    paper_bgcolor='white',
    plot_bgcolor='white'
    
)
fig.show()