
# UPPGIFT 3 - Könsspecifik Påverkan av COVID-19 och Vaccinationer

I detta avsnitt analyseras påverkan av COVID-19 och vaccinationer baserat på kön.
De huvudsakliga KPI:erna (Nyckeltalsindikatorer) som undersöks är:

- Totalt antal fall av COVID-19 per kön.
- Totalt antal intensivvårdade patienter per kön.
- Totalt antal avlidna på grund av COVID-19 per kön.
- Vaccinationsgrad per kön, både första och andra doser.

Syftet är att identifiera eventuella skillnader i fall, dödsfall och vaccinationsgrad mellan könen.

In [785]:
import pandas as pd
import os
from pathlib import Path
import plotly.figure_factory as ff
import plotly.express as px
from plotly.subplots import make_subplots
import plotly.graph_objects as go




# Läser in COVID-19-data och hanterar filinläsningsfel
covid_data_path = '..\\filer\\Folkhalsomyndigheten_Covid19.xlsx'

try:
    covid_data = pd.read_excel(covid_data_path, sheet_name='Totalt antal per kön')
except Exception as e:
    print(f"Ett fel uppstod vid inläsning av COVID-19 data: {e}")


# Läser in vaccinationsdata och hanterar filinläsningsfel
vaccine_data_path = '..\\filer\\Folkhalsomyndigheten_Covid19_Vaccine.xlsx'

try:
    vaccine_data = pd.read_excel(vaccine_data_path, sheet_name='Vaccinerade kön')
except Exception as e:
    print(f"Ett fel uppstod vid inläsning av vaccinationsdata: {e}")

In [786]:
# Funktioner för grafer, diagram och sparande
def create_pie_trace(data, labels, values, name, color_map):
# Skapar cirkeldiagram
    return go.Pie(labels=labels, values=data[values], name=name, marker_colors=[color_map[label] for label in labels])

def create_bar_trace(data, x, y, name, color_map):
# Skapar stapeldiagram
    return go.Bar(x=data[x], y=data[y], name=name, marker_color=[color_map[val] for val in data[x]])

# Sparar grafer
def save_plotly_fig(fig, filename, directory="../visualiseringar"):

    Path(directory).mkdir(parents=True, exist_ok=True)
    filepath = f"{directory}/{filename}.html"
    fig.write_html(filepath)
    print(f"Figure saved as {filepath}")

# Förberedelse av data

In [787]:
# Förberedelse av data
print("Head för COVID-19 data:")
print(covid_data.head())
print("\nHead för Vaccinationsdata:")
print(vaccine_data.head())

Head för COVID-19 data:
              Kön  Totalt_antal_fall  Totalt_antal_intensivvårdade  \
0             Man            1210098                          6550   
1          Kvinna            1381189                          2947   
2  Uppgift saknas              20293                            47   

   Totalt_antal_avlidna  
0                 11279  
1                  9273  
2                   107  

Head för Vaccinationsdata:
       Kön  Antal vaccinerade  Andel vaccinerade Vaccinationsstatus
0   Totalt            7810380           0.858964        Minst 1 dos
1   Totalt            7627588           0.838861      Minst 2 doser
2      Män            3858688           0.845743        Minst 1 dos
3      Män            3759898           0.824090      Minst 2 doser
4  Kvinnor            3951692           0.872279        Minst 1 dos


In [788]:
print(covid_data.info())
print(vaccine_data.info())

<class 'pandas.core.frame.DataFrame'>
RangeIndex: 3 entries, 0 to 2
Data columns (total 4 columns):
 #   Column                        Non-Null Count  Dtype 
---  ------                        --------------  ----- 
 0   Kön                           3 non-null      object
 1   Totalt_antal_fall             3 non-null      int64 
 2   Totalt_antal_intensivvårdade  3 non-null      int64 
 3   Totalt_antal_avlidna          3 non-null      int64 
dtypes: int64(3), object(1)
memory usage: 228.0+ bytes
None
<class 'pandas.core.frame.DataFrame'>
RangeIndex: 6 entries, 0 to 5
Data columns (total 4 columns):
 #   Column              Non-Null Count  Dtype  
---  ------              --------------  -----  
 0   Kön                 6 non-null      object 
 1   Antal vaccinerade   6 non-null      int64  
 2   Andel vaccinerade   6 non-null      float64
 3   Vaccinationsstatus  6 non-null      object 
dtypes: float64(1), int64(1), object(2)
memory usage: 324.0+ bytes
None


In [789]:
# Filtrerar COVID-19 Data
covid_data_filtered = covid_data[covid_data['Kön'].isin(['Man', 'Kvinna'])]

# Visa filtrerade COVID-19 Data
print("Filtrerad COVID-19 Data:")
print(covid_data_filtered)

Filtrerad COVID-19 Data:
      Kön  Totalt_antal_fall  Totalt_antal_intensivvårdade  \
0     Man            1210098                          6550   
1  Kvinna            1381189                          2947   

   Totalt_antal_avlidna  
0                 11279  
1                  9273  


In [790]:

# Filtrerar Vaccinationsdata
vaccine_data_filtered = vaccine_data[vaccine_data['Kön'].isin(['Män', 'Kvinnor'])]
print("\nFiltrerad Vaccinationsdata:")
print(vaccine_data_filtered)

# Separerat data baserat på vaccinationsstatus
vaccine_data_1_dose = vaccine_data_filtered[vaccine_data_filtered['Vaccinationsstatus'] == 'Minst 1 dos']
vaccine_data_2_doses = vaccine_data_filtered[vaccine_data_filtered['Vaccinationsstatus'] == 'Minst 2 doser']

# Visar filtrerade vaccinationsdata för 'Minst 1 dos'
print("\nFiltrerad Vaccine Data för 'Minst 1 dos':")
print(vaccine_data_1_dose)

# Visar filtrerade vaccinationsdata för 'Minst 2 doser'
print("\nFiltrerad Vaccin Data för 'Minst 2 doser':")
print(vaccine_data_2_doses)


Filtrerad Vaccinationsdata:
       Kön  Antal vaccinerade  Andel vaccinerade Vaccinationsstatus
2      Män            3858688           0.845743        Minst 1 dos
3      Män            3759898           0.824090      Minst 2 doser
4  Kvinnor            3951692           0.872279        Minst 1 dos
5  Kvinnor            3867690           0.853737      Minst 2 doser

Filtrerad Vaccine Data för 'Minst 1 dos':
       Kön  Antal vaccinerade  Andel vaccinerade Vaccinationsstatus
2      Män            3858688           0.845743        Minst 1 dos
4  Kvinnor            3951692           0.872279        Minst 1 dos

Filtrerad Vaccin Data för 'Minst 2 doser':
       Kön  Antal vaccinerade  Andel vaccinerade Vaccinationsstatus
3      Män            3759898           0.824090      Minst 2 doser
5  Kvinnor            3867690           0.853737      Minst 2 doser


In [791]:
# Pivoterar vaccinationsdata för att ha separata kolumner för varje vaccinationsstatus
vaccine_data_pivot = vaccine_data_filtered.pivot(index='Kön', columns='Vaccinationsstatus', values='Andel vaccinerade').reset_index()
vaccine_data_pivot.columns = ['Kön', 'Andel_vaccinerade_1_dos', 'Andel_vaccinerade_2_doser']
vaccine_data_pivot['Kön'] = vaccine_data_pivot['Kön'].replace({'Män': 'Man', 'Kvinnor': 'Kvinna'})
print("\nPivoterade Vaccinationsdata:")
print(vaccine_data_pivot)


Pivoterade Vaccinationsdata:
      Kön  Andel_vaccinerade_1_dos  Andel_vaccinerade_2_doser
0  Kvinna                 0.872279                   0.853737
1     Man                 0.845743                   0.824090


In [792]:
# Sammanfogar COVID-19 data med pivoterade vaccinationsdata
combined_data = pd.merge(covid_data_filtered, vaccine_data_pivot, on='Kön', how='left')

print("\nSammanfogade Data:")
print(combined_data)



Sammanfogade Data:
      Kön  Totalt_antal_fall  Totalt_antal_intensivvårdade  \
0     Man            1210098                          6550   
1  Kvinna            1381189                          2947   

   Totalt_antal_avlidna  Andel_vaccinerade_1_dos  Andel_vaccinerade_2_doser  
0                 11279                 0.845743                   0.824090  
1                  9273                 0.872279                   0.853737  


In [793]:
print("Unika värden i COVID-19-data:", covid_data_filtered['Kön'].unique())
print("Unika värden i Vaccinationsdata:", vaccine_data_pivot['Kön'].unique())



Unika värden i COVID-19-data: ['Man' 'Kvinna']
Unika värden i Vaccinationsdata: ['Kvinna' 'Man']


In [794]:


# Tablevisualisering av datan vi kommer att visa i grafer
fig = ff.create_table(combined_data)
save_plotly_fig(fig, "combined_data")
fig.show()


Figure saved as ../visualiseringar/combined_data.html


## Visualisering av COVID-19 Fall per Kön

Stapeldiagrammet nedan visar det totala antalet bekräftade fall, antalet intensivvårdade patienter,
och antalet avlidna på grund av COVID-19 uppdelat per kön. Denna visualisering hjälper till att
förstå fördelningen och svårighetsgraden av pandemins påverkan på olika kön.


In [795]:
# Definierar färger
color_scheme = {'Man': '#89CFF0', 'Kvinna': '#F4C2C2'}

# Skapar en subplot-grid med 2 rader och 2 kolumner
fig = make_subplots(
    rows=2, cols=2,
    subplot_titles=('Totalt Antal Fall per Kön',
                    'Totalt Antal Intensivvårdade per Kön',
                    'Totalt Antal Avlidna per Kön',
                    'Vaccinationsgrad per Kön')
)

# Hovertemplate för COVID-data i stapeldiagram
hovertemplate_covid_bar = '<b>KÖN: </b> %{x}<br><b>ANTAL: </b>%{y}<extra></extra>'

# Hovertemplate för Vaccinationsdata i stapeldiagram
hovertemplate_vaccine_bar = '<b>KÖN: </b> %{x}<br><b>1:a DOS: </b>%{y:.2%}<br><b>2:a DOS: </b>%{y:.2%}<extra></extra>'



# Första subplot: Totalt antal fall
fig.add_trace(
    go.Bar(x=combined_data['Kön'], y=combined_data['Totalt_antal_fall'], name='Fall',
           marker_color=[color_scheme[gender] for gender in combined_data['Kön']],
           hovertemplate=hovertemplate_covid_bar),
    row=1, col=1
)

# Andra subplot: Totalt antal intensivvårdade per kön
fig.add_trace(
    go.Bar(x=combined_data['Kön'], y=combined_data['Totalt_antal_intensivvårdade'], name='Intensivvårdade',
           marker_color=[color_scheme[gender] for gender in combined_data['Kön']],
           hovertemplate=hovertemplate_covid_bar),
    row=1, col=2
)

# Tredje subplot: Totalt antal avlidna per kön
fig.add_trace(
    go.Bar(x=combined_data['Kön'], y=combined_data['Totalt_antal_avlidna'], name='Avlidna',
           marker_color=[color_scheme[gender] for gender in combined_data['Kön']],
           hovertemplate=hovertemplate_covid_bar),
    row=2, col=1
)

# Fjärde subplot: Vaccinationsgrad för första och andra dosen per kön
for gender, group in combined_data.groupby('Kön'):
    fig.add_trace(
        go.Bar(x=[f'{gender} 1 Dos'], y=group['Andel_vaccinerade_1_dos'] * 100, name='1 Dos',
               marker_color=color_scheme[gender],
               hovertemplate=hovertemplate_vaccine_bar),
        row=2, col=2
    )
    fig.add_trace(
        go.Bar(x=[f'{gender} 2 Doser'], y=group['Andel_vaccinerade_2_doser'] * 100, name='2 Doser',
               marker_color=color_scheme[gender],
               hovertemplate=hovertemplate_vaccine_bar),
        row=2, col=2
    )

# Uppdaterar layout
fig.update_layout(
    title_text='COVID-19 Statistik per Kön',
    height=700,
    showlegend=True,
    plot_bgcolor='rgba(0,0,0,0)', 
    paper_bgcolor='rgba(0,0,0,0)',  
    font_color="white",  
    template="plotly_dark", 
    hovermode='closest'
)
save_plotly_fig(fig, "COVID-19 Statistik per Kön")
fig.show()


Figure saved as ../visualiseringar/COVID-19 Statistik per Kön.html


In [796]:
# Definierar färger
color_scheme = {'Man': '#89CFF0', 'Kvinna': '#F4C2C2'}

# Skapar subplot grid med 1 rad och 5 kolumner
fig = make_subplots(rows=1, cols=5, specs=[[{'type':'domain'}]*5])

# Definierar hovertemplates
hovertemplate_covid = '<b>KÖN: </b> %{label}<br><b>ANTAL: </b>%{value}<extra></extra>'
hovertemplate_vaccine = '<b>KÖN:</b> %{label}<br><b>VACCINERADE:</b> %{value:.2%}<br><b>PROPORTION:</b> %{percent}<extra></extra>'

# Lägger till pie chart traces för COVID-data och vaccinationsdata
categories = ['Totalt_antal_fall', 'Totalt_antal_intensivvårdade', 'Totalt_antal_avlidna', 'Andel_vaccinerade_1_dos', 'Andel_vaccinerade_2_doser']
for i, category in enumerate(categories, start=1):
    hovertemplate = hovertemplate_vaccine if 'vaccinerade' in category else hovertemplate_covid
    fig.add_trace(
        go.Pie(
            labels=combined_data['Kön'],
            values=combined_data[category],
            name=category,
            marker_colors=[color_scheme[gender] for gender in combined_data['Kön']],
            hovertemplate=hovertemplate
        ),
        row=1, col=i
    )

# Uppdaterar layouten
fig.update_layout(
    title_text='COVID-19 och Vaccinationsstatistik per Kön',
    height=700,
    showlegend=True,
    template="plotly_dark",
    plot_bgcolor='rgba(0,0,0,0)',
    paper_bgcolor='rgba(0,0,0,0)',
    font_color="white",
    hovermode='closest'
)

# Lägger till titlar för varje subplot
titles = [
    'Totalt Antal Fall per Kön',
    'Totalt Antal Intensivvårdade per Kön',
    'Totalt Antal Avlidna per Kön',
    'Vaccinationsgrad 1:a Dosen per Kön',
    'Vaccinationsgrad 2:a Dosen per Kön'
]
title_x_positions = [0.08, 0.29, 0.50, 0.71, 0.92]  # Gör så att titlarna är centrerade till diagram
for i, title in enumerate(titles):
    fig.add_annotation(
        text=title,
        x=title_x_positions[i],
        y=0.8,  # Y-position ovanför subplots
        xref='paper',
        yref='paper',        
        showarrow=False,
        font=dict(size=12),
        xanchor='center',
        yanchor='bottom'
    )

save_plotly_fig(fig, "COVID-19 och Vaccinationsstatistik per Kön")

fig.show()


Figure saved as ../visualiseringar/COVID-19 och Vaccinationsstatistik per Kön.html


## Slutsatser

Baserat på de visuella representationerna kan vi dra följande slutsatser:

- En högre andel kvinnor har bekräftats infekterade än män.
- Män har dock en högre frekvens av intensivvårdsinläggningar och avlidna, vilket kan tyda på en högre svårighetsgrad av sjukdomen hos män.
- Vaccinationsgraden är jämförbart hög mellan könen, med en marginell högre andel hos kvinnor för både första och andra doser.

Denna analys innefattar flera KPI:er, där varje variabel som antal fall, intensivvårdade, avlidna och vaccinationsgrad kan ses som en egen KPI. En KPI är en kvantifierbar mätning, ofta avsedd för prestandaövervakning. Här, genom att betrakta varje variabel separat och i samband med varandra, har vi ett flertal KPI:er som bidrar till en omfattande bild av COVID-19:s påverkan.
